1. cerdo :
Pig se utiliza para el análisis de una gran cantidad de datos. Es abstracto sobre MapReduce. Pig se utiliza para realizar todo tipo de operaciones de manipulación de datos en Hadoop. Proporciona el lenguaje Pig-Latin para escribir el código que contiene muchas funciones incorporadas como unir, filtrar, etc. Las dos partes de Apache Pig son Pig-Latin y Pig-Engine. Pig Engine se utiliza para convertir todos estos scripts en un mapa específico y reducir las tareas. La abstracción del cerdo está en un nivel superior. Contiene menos línea de código en comparación con MapReduce.
2. Colmena :
Hive está construido sobre Hadoop y se usa para procesar datos estructurados en Hadoop. Hive fue desarrollado por Facebook. Proporciona varios tipos de lenguaje de consulta que se conoce con frecuencia como Hive Query Language. Apache Hive es un almacén de datos que proporciona una interfaz similar a SQL entre el usuario y el sistema de archivos distribuido de Hadoop (HDFS) que integra Hadoop.
Diferencia entre cerdo y colmena:
S. No. | Cerdo | Colmena |
---|---|---|
1. | Pig opera en el lado del cliente de un clúster. | Hive opera en el lado del servidor de un clúster. |
2. | Pig usa el lenguaje pig-latin. | Hive utiliza lenguaje HiveQL. |
3. | Pig es un lenguaje de flujo de datos de procedimiento. | Hive es un lenguaje SQLish declarativo. |
4. | Fue desarrollado por Yahoo. | Fue desarrollado por Facebook. |
5. | Es utilizado por investigadores y programadores. | Es utilizado principalmente por analistas de datos. |
6. | Se utiliza para manejar datos estructurados y semiestructurados. | Se utiliza principalmente para manejar datos estructurados. |
7. | Se utiliza para la programación. | Se utiliza para crear informes. |
8. | Los scripts de Pig terminan con la extensión .pig. | En HIVe, se admiten todas las extensiones. |
9. | No admite particiones. | Es compatible con la partición. |
10 | Carga datos rápidamente. | Carga los datos lentamente. |
11 | No es compatible con JDBC. | Es compatible con JDBC . |
12 | No es compatible con ODBC. | Es compatible con ODBC . |
13 | Pig no tiene una base de datos de metadatos dedicada. | Hive utiliza la variación exacta del lenguaje SQL-DDL dedicado mediante la definición de tablas de antemano. |
14 | Es compatible con el formato de archivo Avro. | No es compatible con el formato de archivo Avro. |
15. | Pig es adecuado para estructuras de datos complejas y anidadas. | Hive es adecuado para sistemas OLAP de procesamiento por lotes. |
dieciséis. | Pig no admite esquemas para almacenar datos. | Hive admite esquemas para la inserción de datos en tablas. |
17 | Es muy fácil escribir UDF para calcular arrays. | Admite UDF, pero es mucho más difícil de depurar. |
Publicación traducida automáticamente
Artículo escrito por bansal_rtk_ y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA