Big Data : son datos, información o estadísticas relevantes enormes, grandes o voluminosos adquiridos por las grandes organizaciones y empresas. Se crearon y prepararon muchos software y almacenamiento de datos, ya que es difícil calcular manualmente los grandes datos. Se utiliza para descubrir patrones y tendencias y tomar decisiones relacionadas con el comportamiento humano y la tecnología de interacción.
Aplicación y uso de Big Data:
- Sitios de redes sociales como facebook y twitter.
- Transporte como las vías aéreas y los ferrocarriles.
- Sistemas de salud y educación.
- Aspectos Agrícolas.
Apache Hadoop: It is an open-source software framework that built on the cluster of machines. It is used for distributed storage and distributed processing for very large data sets i.e. Big Data. It is done using the MapReduce programming model. Implemented in Java, a development-friendly tool backs the Big Data Application. It easily processes voluminous volumes of data on a cluster of commodity servers. It can mine any form of data i.e. structured, unstructured, or semi-structured. It is highly scalable.
Consta de 3 componentes:
- HDFS : Sistema de almacenamiento confiable con la mitad de los datos del mundo almacenados en él.
- MapReduce : la capa consiste en un procesador distribuido.
- Hilo : la capa consiste en un administrador de recursos.
A continuación se muestra una tabla de diferencias entre Big Data y Apache Hadoop:
No. | Grandes datos | apache hadoop |
---|---|---|
1 | Big Data es un grupo de tecnologías. Es una colección de datos enorme que se multiplica continuamente. | Apache Hadoop es un marco basado en Java de código abierto que involucra algunos de los principios de Big Data. |
2 | Es una colección de activos bastante compleja, complicada y ambigua. | Logra un conjunto de metas y objetivos para hacer frente a la colección de activos. |
3 | Es un problema complicado, es decir, una gran cantidad de datos sin procesar. | Es una solución que es una máquina de procesamiento de esos datos. |
4 | Big Data es más difícil de acceder. | Permite acceder a los datos y procesarlos más rápido. |
5 | Es difícil almacenar la gran cantidad de datos, ya que consiste en todo tipo de datos. es decir, estructurados, no estructurados y semiestructurados. | Implementa Hadoop Distributed File System (HDFS) que permite el almacenamiento de diferentes tipos de datos. |
6 | Define el tamaño del conjunto de datos. | Es donde se almacena y procesa el conjunto de datos. |
7. | Big data tiene una amplia gama de aplicaciones en campos como las telecomunicaciones, el sector bancario, el cuidado de la salud, etc. | Hadoop se utiliza para la gestión de recursos de clústeres, el procesamiento paralelo y el almacenamiento de datos. |
Publicación traducida automáticamente
Artículo escrito por shivamraj74 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA