Requisitos previos:
introducción a Hadoop , Apache HBase
La arquitectura HBase tiene 3 componentes principales: HMaster, Region Server, Zookeeper.
Figura – Arquitectura de HBase
Los 3 componentes se describen a continuación:
- HMaster:
la implementación de Master Server en HBase es HMaster. Es un proceso en el que las regiones se asignan al servidor de regiones, así como las operaciones DDL (crear, eliminar tabla). Supervisa todas las instancias del servidor de región presentes en el clúster. En un entorno distribuido, Master ejecuta varios subprocesos en segundo plano. HMaster tiene muchas funciones, como controlar el equilibrio de carga, la conmutación por error, etc.
- Servidor de región:
las tablas HBase se dividen horizontalmente por rango de clave de fila en regiones. Las regiones son los elementos de construcción básicos del clúster de HBase que consta de la distribución de tablas y se compone de familias de columnas. El servidor de región se ejecuta en HDFS DataNode que está presente en el clúster de Hadoop. Las regiones del servidor de regiones son responsables de varias cosas, como el manejo, la administración, la ejecución y las operaciones de lectura y escritura de HBase en ese conjunto de regiones. El tamaño predeterminado de una región es de 256 MB.
- Zookeeper –
Es como un coordinador en HBase. Proporciona servicios como el mantenimiento de la información de configuración, la asignación de nombres, la sincronización distribuida, la notificación de fallas del servidor, etc. Los clientes se comunican con los servidores de la región a través de zookeeper.
Ventajas de HBase –
- Puede almacenar grandes conjuntos de datos
- La base de datos se puede compartir
- Rentable de gigabytes a petabytes
- Alta disponibilidad a través de conmutación por error y replicación
Desventajas de HBase –
- Sin soporte de estructura SQL
- Sin soporte de transacciones
- Ordenado solo en clave
- Problemas de memoria en el clúster
Comparación entre HBase y HDFS :
- HBase proporciona acceso de baja latencia, mientras que HDFS proporciona operaciones de alta latencia.
- HBase admite lecturas y escrituras aleatorias, mientras que HDFS admite Escribir una vez Leer muchas veces.
- Se accede a HBase a través de comandos de shell, API de Java, REST, Avro o Thrift API, mientras que a HDFS se accede a través de trabajos de MapReduce.
Nota: HBase se usa ampliamente para operaciones analíticas en línea, como en aplicaciones bancarias, como actualizaciones de datos en tiempo real en cajeros automáticos, se puede usar HBase.
Publicación traducida automáticamente
Artículo escrito por APOORV_CHAUDHARY y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA