¿Cómo instalar Apache Pig en Linux?

Pig es una plataforma o herramienta de alto nivel que se utiliza para procesar grandes conjuntos de datos. Proporciona un alto nivel de abstracción para el procesamiento en MapReduce. Proporciona un lenguaje de secuencias de comandos de alto nivel, conocido como Pig Latin, que se utiliza para desarrollar los códigos de análisis de datos.

Para instalar Apache Pig, debe tener Hadoop y Java instalados en su sistema.

Paso 1: Descargue la nueva versión de Apache Pig desde este enlace . En mi caso, he descargado la versión pig-0.17.0.tar.gz de Pig, que es la última y tiene un tamaño aproximado de 220 MB .

Paso 2: Ahora mueva el archivo Pig tar descargado a la ubicación deseada. En mi caso, lo muevo a mi carpeta /Documentos .

Apache Pig Installation - 1

Paso 3: ahora extraemos este archivo tar con la ayuda del siguiente comando (asegúrese de verificar su nombre de archivo tar):

tar -xvf pig-0.17.0.tar.gz

Apache Pig Installation -2

Paso 4: Una vez que esté instalado, es hora de que cambiemos a nuestro usuario de Hadoop. En mi caso es hadoopusr . Si no ha creado un usuario dedicado separado para Hadoop, entonces, en ese caso, no es necesario mover ese archivo y configurar la ruta de acuerdo con su PIG PATH en el archivo .bashrc . Para cambiar de usuario, puede usar el siguiente comando o también puede cambiar manualmente cambiando la configuración de usuario .

su - hadoopusr

Apache Pig Installation - 3

Paso 5: Ahora necesitamos mover esta carpeta extraída al usuario hadoopusr . Para eso, use el siguiente comando (asegúrese de que el nombre de su carpeta extraída sea pig-0.17.0; de lo contrario, cámbielo en consecuencia)

sudo mv pig-0.17.0 /usr/local/

Apache Pig Installation - 4

Paso 6: ahora, una vez que lo movimos, debemos cambiar la variable de entorno para la ubicación de Pig. Para eso, abra el archivo bashrc con el siguiente comando.

sudo gedit ~/.bashrc

Apache Pig Installation - 5

Una vez que se abra el archivo, guarde la siguiente ruta dentro de este archivo bashrc.

#Pig location
export PIG_INSTALL=/usr/local/pig-0.17.0
export PATH=$PATH:/usr/local/pig-0.17.0/bin

Apache Pig Installation - 6

Paso 7: luego verifique si lo ha configurado correctamente o no usando el siguiente comando:

source ~/.bashrc

Apache Pig Installation - 7

Paso 8: Una vez que lo haya hecho correctamente, eso es todo, hemos instalado correctamente pig en nuestra configuración de Node único de Hadoop, ahora comenzamos pig con el siguiente comando pig.

pig

Apache Pig Installation - 8 class=

Paso 9: puede verificar su versión de cerdo con el siguiente comando.

pig -version

Checking Apache Pig Version

Publicación traducida automáticamente

Artículo escrito por dikshantmalidev y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *