Big Data es una colección de datos que está creciendo exponencialmente, y es enorme en volumen con mucha complejidad ya que proviene de varios recursos. Estos datos pueden ser datos estructurados, no estructurados o semiestructurados. Entonces, para manejarlo o administrarlo de manera eficiente, Hadoop entra en escena.
Hadoop es un marco escrito en el lenguaje de programación Java que funciona sobre la colección de hardware básico. Antes de Hadoop, usábamos un solo sistema para almacenar y procesar datos. Además, dependemos de RDBMS, que solo almacena los datos estructurados. Para resolver el problema de datos tan grandes y complejos, Hadoop proporciona la mejor solución. Entonces empecemos.
Temas:
- Lo esencial
- Instalación y configuración del entorno
- Componentes de Hadoop
- Clúster, bastidor y programadores
- HDFS
- Mapa reducido
- Programas MapReduce
- Transmisión de Hadoop
- Archivo y comandos de Hadoop
- Varios
Lo esencial
- ¿Qué es Big Data?
- ¿Qué son los datos no estructurados?
- ¿Qué son los datos semiestructurados?
- 5V de Big Data
- Hadoop – Solución al Big Data
- Evolución de Hadoop
- Diferentes versiones de Hadoop
- RDBMS frente a Hadoop
- Arquitectura Hadoop
- Hadoop 2.x frente a Hadoop 3.x
- Hadoop – Ecosistema
Instalación y configuración del entorno
- ¿Cómo instalar Hadoop en Linux?
- Instalación y configuración de Hadoop en Windows 10
- Instalación de Hadoop de clúster de un solo Node en Windows
- Configuración de Eclipse con Apache Hadoop
Componentes de Hadoop
Clúster, bastidor y programadores
- Clúster de Hadoop
- Hadoop: clúster, propiedades y sus tipos
- Hadoop: conocimiento de bastidores y bastidores
- Hadoop: programadores y tipos de programadores
- Hadoop: diferentes modos de funcionamiento
HDFS
- Varios sistemas de archivos en Hadoop
- ¿Por qué un bloque en HDFS es tan grande?
- Demonios y sus características
- Bloques de archivos y factor de replicación
- Operación de lectura de datos
Mapa reducido
- Mapa Reducir en Hadoop
- Arquitectura MapReduce
- Mapeador en MapReduce
- Reductor en Map-Reduce
- Ejecución del trabajo de MapReduce
- Hadoop MapReduce: flujo de datos
- Inicializaciones de trabajos en MapReduce
- ¿Cómo se ejecuta Job en MapReduce?
- ¿Cómo MapReduce completa una tarea?
Programas MapReduce
- Análisis de datos meteorológicos para analizar días cálidos y fríos
- Encontrar la edad promedio de hombres y mujeres muertos en el desastre del Titanic
- ¿Cómo ejecutar el programa de conteo de caracteres en MapReduce Hadoop?
Transmisión de Hadoop
Archivo y comandos de Hadoop
- Hadoop – Permiso de archivo y ACL (Lista de control de acceso)
- Hadoop: comando copyFromLocal
- Hadoop – Comando getmerge
Varios
- Hadoop Versión 3.0 – ¿Qué hay de nuevo?
- Las 7 razones principales para aprender Hadoop
- Las 10 principales herramientas de análisis de Hadoop para Big Data
- Los 5 mejores libros recomendados para aprender Hadoop
- Características de Hadoop que lo hacen popular
- Hadoop vs Spark vs Flink
Publicación traducida automáticamente
Artículo escrito por GeeksforGeeks-1 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA