Introducción a Apache Pig

Pig Representa Big Data como flujos de datos. Pig es una plataforma o herramienta de alto nivel que se utiliza para procesar grandes conjuntos de datos. Proporciona un alto nivel de abstracción para el procesamiento en MapReduce. Proporciona un lenguaje de secuencias de comandos de alto nivel, conocido como Pig Latin , que se utiliza … Continue reading «Introducción a Apache Pig»

Diferencia entre cerdo y colmena

1. cerdo :  Pig se utiliza para el análisis de una gran cantidad de datos. Es abstracto sobre MapReduce. Pig se utiliza para realizar todo tipo de operaciones de manipulación de datos en Hadoop. Proporciona el lenguaje Pig-Latin para escribir el código que contiene muchas funciones incorporadas como unir, filtrar, etc. Las dos partes de … Continue reading «Diferencia entre cerdo y colmena»

Prueba de concepto sobre agregador de noticias usando tecnologías de Big Data

Big Data es un gran conjunto de datos que puede tener un gran volumen de datos, velocidad y variedad de datos. Por ejemplo, miles de millones de usuarios buscan en Google al mismo tiempo y ese será un conjunto de datos muy grande. En este, discutiremos la prueba de concepto (POC) en un agregador de … Continue reading «Prueba de concepto sobre agregador de noticias usando tecnologías de Big Data»

¿Cómo instalar Apache Pig en Linux?

Pig es una plataforma o herramienta de alto nivel que se utiliza para procesar grandes conjuntos de datos. Proporciona un alto nivel de abstracción para el procesamiento en MapReduce. Proporciona un lenguaje de secuencias de comandos de alto nivel, conocido como Pig Latin, que se utiliza para desarrollar los códigos de análisis de datos. Para … Continue reading «¿Cómo instalar Apache Pig en Linux?»

Instalación de Apache Pig en Windows y estudio de caso

Apache Pig es una herramienta de manipulación de datos construida sobre MapReduce de Hadoop. Pig nos proporciona un lenguaje de secuencias de comandos para una manipulación de datos más fácil y rápida. Este lenguaje de scripting se llama Pig Latin. Los scripts de Apache Pig se pueden ejecutar de 3 maneras de la siguiente manera: … Continue reading «Instalación de Apache Pig en Windows y estudio de caso»

Diferencia entre MapReduce y Pig

MapReduce es un modelo que funciona sobre Hadoop para acceder a grandes datos almacenados de manera eficiente en HDFS (Sistema de archivos distribuidos de Hadoop). Es el componente central de Hadoop, que divide los grandes datos en pequeños fragmentos y los procesa en paralelo.  Características de MapReduce: Puede almacenar y distribuir grandes cantidades de datos … Continue reading «Diferencia entre MapReduce y Pig»