Un almacén de datos es básicamente un lugar para almacenar colecciones de datos, como una base de datos, un sistema de archivos o un directorio. En el sistema de base de datos se pueden almacenar de dos maneras. Estos son los siguientes:
- Almacenes de datos orientados a filas
- Almacenes de datos orientados a columnas
Las comparaciones entre los almacenes de datos orientados a filas y los almacenes de datos orientados a columnas son las siguientes:
Almacenes de datos orientados a filas | Almacenes de datos orientados a columnas |
---|---|
Los datos se almacenan y recuperan una fila a la vez y, por lo tanto, podrían leer datos innecesarios si se requieren algunos de los datos de una fila. | En este tipo de almacenes de datos, los datos se almacenan y recuperan en columnas y, por lo tanto, solo pueden leer los datos relevantes si es necesario. |
Los registros en los almacenes de datos orientados por filas son fáciles de leer y escribir. | En este tipo de almacenes de datos, las operaciones de lectura y escritura son más lentas en comparación con las orientadas a filas. |
Los almacenes de datos orientados a filas son los más adecuados para el sistema de transacciones en línea. | Las tiendas orientadas a columnas son las más adecuadas para el procesamiento analítico en línea. |
Estos no son eficientes para realizar operaciones aplicables a conjuntos de datos completos y, por lo tanto, la agregación en filas es un trabajo u operaciones costosas. | Estos son eficientes en la realización de operaciones aplicables a todo el conjunto de datos y, por lo tanto, permiten la agregación en muchas filas y columnas. |
Mecanismos de compresión típicos que brindan resultados menos eficientes que los que logramos con los almacenes de datos orientados a columnas. | Este tipo de almacenamiento de datos básicamente permite altas tasas de compresión debido a valores poco distintos o únicos en las columnas. |
El mejor ejemplo de almacenamiento de datos orientado a filas es la base de datos relacional , que es un almacenamiento de datos estructurado y también un motor de consulta sofisticado. Se incurre en una gran penalización para mejorar el rendimiento a medida que aumenta el tamaño de los datos.
El mejor ejemplo de un almacén de datos orientado a columnas es la base de datos HBase , que básicamente está diseñada desde cero para proporcionar escalabilidad y partición para permitir la serialización, el almacenamiento y la recuperación eficientes de la estructura de datos.
Las características de Base de datos relacional y HBase son las siguientes:
Base de datos relacional | HBase |
---|---|
Básicamente se basa en un esquema fijo. | Es totalmente sin esquema. |
Es un ejemplo de almacén de datos orientado a filas. | Es un ejemplo de almacenes de datos orientados a columnas. |
Básicamente está diseñado para almacenar datos normalizados. | Básicamente está diseñado para almacenar datos no normalizados. |
Básicamente contiene tablas delgadas. | Básicamente contiene tablas pobladas amplias y escasamente orientadas. |
No tiene soporte incorporado para particionar. | Básicamente es compatible con el particionamiento automático. |
Publicación traducida automáticamente
Artículo escrito por Akashkumar17 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA