1. Pig :
Pig se utiliza para el análisis de una gran cantidad de datos. Es abstracto sobre MapReduce. Pig se utiliza para realizar todo tipo de operaciones de manipulación de datos en Hadoop. Proporciona el lenguaje Pig-Latin para escribir el código que contiene muchas funciones incorporadas como unir, filtrar, etc. Las dos partes de Apache Pig son Pig-Latin y Pig-Engine. Pig Engine se utiliza para convertir todos estos scripts en un mapa específico y reducir las tareas. La abstracción del cerdo está en un nivel superior. Contiene menos línea de código en comparación con MapReduce.
2. Hue:
Hue es una interfaz de usuario web que proporciona una serie de servicios y Hue es un marco Hadoop. Hue proporciona una interfaz de usuario web junto con la ruta del archivo para explorar HDFS. Las características más importantes de Hue son el navegador de trabajos, el shell de Hadoop , los permisos de administrador de usuario, el editor de Impala, el navegador de archivos HDFS, el editor de Pig, el editor de Hive, la interfaz web de Ozzie y el acceso a la API de Hadoop. Este diseño de interfaz de usuario web ayuda a los usuarios a explorar los archivos, de forma similar a como lo haría un usuario promedio de Windows que busca sus archivos en su máquina. Hue proporciona una interfaz de usuario web para lenguajes de programación que es una herramienta útil para que los usuarios eviten errores de sintaxis al ejecutar consultas. Hue se puede instalar o configurar solo mediante un navegador web.
Diferencia entre cerdo y tono:
Cerdo | Matiz |
---|---|
Pig opera en el lado del cliente de un clúster. | Hue es una interfaz de usuario web que proporciona una serie de servicios y Hue es un marco Hadoop. |
No es compatible con JDBC. | Es compatible con JDBC. |
Pig se implementa y se accede mediante una interfaz de interfaz de usuario web o una interfaz de línea de comandos. | Hue se implementa en un navegador web donde podemos acceder a múltiples programas instalados en Cloudera. |
Pig no admite esquemas para almacenar datos. | Hue admite esquemas para la inserción de datos en tablas. |
Es utilizado por investigadores y programadores. | Es utilizado principalmente por analistas de datos. |
Se utiliza para manejar datos estructurados y semiestructurados. | Se utiliza principalmente para manejar datos estructurados. |
No es compatible con ODBC. | Es compatible con ODBC. |
Es compatible con el formato de archivo Avro. | No es compatible con el formato de archivo Avro. |
Pig utiliza un algoritmo de reducción de mapas para procesar y analizar los datos. | Hue proporciona un editor de interfaz de usuario web al que se puede acceder mediante Hive y otros lenguajes de programación. |
Publicación traducida automáticamente
Artículo escrito por bansal_rtk_ y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA