Pig es una plataforma o herramienta de alto nivel que se utiliza para procesar grandes conjuntos de datos. Proporciona un alto nivel de abstracción para el procesamiento en MapReduce. Proporciona un lenguaje de secuencias de comandos de alto nivel, conocido como Pig Latin, que se utiliza para desarrollar los códigos de análisis de datos.
Para instalar Apache Pig, debe tener Hadoop y Java instalados en su sistema.
Paso 1: Descargue la nueva versión de Apache Pig desde este enlace . En mi caso, he descargado la versión pig-0.17.0.tar.gz de Pig, que es la última y tiene un tamaño aproximado de 220 MB .
Paso 2: Ahora mueva el archivo Pig tar descargado a la ubicación deseada. En mi caso, lo muevo a mi carpeta /Documentos .
Paso 3: ahora extraemos este archivo tar con la ayuda del siguiente comando (asegúrese de verificar su nombre de archivo tar):
tar -xvf pig-0.17.0.tar.gz
Paso 4: Una vez que esté instalado, es hora de que cambiemos a nuestro usuario de Hadoop. En mi caso es hadoopusr . Si no ha creado un usuario dedicado separado para Hadoop, entonces, en ese caso, no es necesario mover ese archivo y configurar la ruta de acuerdo con su PIG PATH en el archivo .bashrc . Para cambiar de usuario, puede usar el siguiente comando o también puede cambiar manualmente cambiando la configuración de usuario .
su - hadoopusr
Paso 5: Ahora necesitamos mover esta carpeta extraída al usuario hadoopusr . Para eso, use el siguiente comando (asegúrese de que el nombre de su carpeta extraída sea pig-0.17.0; de lo contrario, cámbielo en consecuencia)
sudo mv pig-0.17.0 /usr/local/
Paso 6: ahora, una vez que lo movimos, debemos cambiar la variable de entorno para la ubicación de Pig. Para eso, abra el archivo bashrc con el siguiente comando.
sudo gedit ~/.bashrc
Una vez que se abra el archivo, guarde la siguiente ruta dentro de este archivo bashrc.
#Pig location export PIG_INSTALL=/usr/local/pig-0.17.0 export PATH=$PATH:/usr/local/pig-0.17.0/bin
Paso 7: luego verifique si lo ha configurado correctamente o no usando el siguiente comando:
source ~/.bashrc
Paso 8: Una vez que lo haya hecho correctamente, eso es todo, hemos instalado correctamente pig en nuestra configuración de Node único de Hadoop, ahora comenzamos pig con el siguiente comando pig.
pig
Paso 9: puede verificar su versión de cerdo con el siguiente comando.
pig -version
Publicación traducida automáticamente
Artículo escrito por dikshantmalidev y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA