Modelo HBase en Hadoop

En este artículo, discutiremos qué es Hbase, diferentes tipos de enfoques de almacenamiento de datos, por qué se prefiere HBase en comparación con otras bases de datos, ventajas y problemas en HBase. Entonces, profundicemos un poco en este artículo para comprender el concepto. bien. 

Base H :

HBase es una base de datos que es una plataforma de código abierto y es la implementación de la arquitectura de almacenamiento de Big Table de Google. La base de datos HBase está orientada a columnas, por lo que la hace única de otras bases de datos. Una de las cualidades únicas de Hbase es que no se preocupa por los tipos de datos porque podemos almacenar diferentes tipos de datos para la misma columna en diferentes filas. Contiene diferentes conjuntos de tablas que mantienen los datos en formato clave-valor. Hbase es más adecuado para conjuntos de datos dispersos que son muy comunes en el caso de big data. Se puede usar para administrar datos estructurados y semiestructurados y tiene muchas funciones integradas, como:

  • Escalabilidad
  • Versionado
  • Compresión
  • Recolección de basura

Hay dos tipos de medios de almacenamiento de datos:

  1. Orientado a filas
  2. Orientado a columnas

Orientado a filas:

En el enfoque de almacenamiento de datos orientado a filas, los datos se almacenan y recuperan una fila a la vez. Esto podría generar varios problemas, supongamos que solo queremos una parte de los datos de la fila, pero de acuerdo con este enfoque, debe recuperar la fila completa incluso si no la necesita. Aparte de eso, este enfoque también sirve para obtener ayuda en el caso de la operación de los sistemas OLTP y ayuda a leer y escribir registros fácilmente. Pero es menos eficiente en el caso de que realicemos operaciones en una base de datos completa.

Orientado a columnas:

En el enfoque de almacenamiento de datos orientado a columnas, los datos se almacenan y recuperan en función de las columnas. Por lo tanto, el problema al que nos enfrentábamos en el caso del enfoque orientado a filas se ha resuelto porque en el enfoque orientado a columnas podemos filtrar los datos que se nos solicitan de todo el conjunto de datos con la ayuda de las columnas correspondientes. En el enfoque orientado a columnas, las operaciones de lectura y escritura son más lentas que otras, pero puede ser eficiente al realizar operaciones en toda la base de datos y, por lo tanto, permite tasas de compresión muy altas. 

Preferencia de HBase:

  • Hbase puede manejar grandes bases de datos muy fácilmente en comparación con otras bases de datos y realizar las operaciones de manera eficiente.
  • Los datos esperados en Hbase están altamente estructurados y pueden encajar fácilmente en el esquema bien definido.
  • Es fácil y adecuado para operaciones de baja latencia.
  • Proporciona acceso a la fila particular de miles de registros.
  • Se puede acceder a los datos en Hbase a través de comandos de shell o a través de la API del cliente en java.
  • Otras bases de datos se vuelven extremadamente lentas mientras que las bases de datos son grandes, pero en el caso de Hbase, maneja las bases de datos grandes de manera finita.

Ventajas de HBase:

  • Hbase proporciona una gran funcionalidad para análisis en asociación con Hadoop MapReduce.
  • Es capaz de manejar una gran cantidad de bases de datos.
  • Hbase ofrece la posibilidad de compartir la base de datos con otros usuarios.
  • Hay muchas operaciones como la lectura y el procesamiento de datos que llevarán menos tiempo en comparación con otras bases de datos tradicionales.
  • Cada vez que surge una falla o un problema de carga compartida, Hbase puede recuperarse automáticamente del problema porque se distribuye internamente.
  • En Hbase, la escalabilidad se admite tanto en formas lineales como modulares.
  • Aporta una gran consistencia.

Problemas en HBase:

  • En HBase, los requisitos de los bloques de memoria y el requisito de hardware para la asignación durante una operación son costosos.
  • Almacenar el archivo grande que está en formato binario es muy difícil en HBase.
  • No hay un optimizador de consultas presente en HBase debido a que no puede realizar funciones SQL y tampoco admite estructuras SQL.
  • Aunque Hbase proporciona muchas funciones, no puede servir como un reemplazo completo de los modelos tradicionales porque HBase aún no admite algunas de las características tradicionales.
  • Hbase no proporciona soporte para transacciones.
  • HBase no admite ninguna función de indexación predeterminada.

Publicación traducida automáticamente

Artículo escrito por manasmohapatra y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *