¿Qué es una base de datos columnar?

Una base de datos en columnas se utiliza en un sistema de administración de bases de datos ( DBMS ) que ayuda a almacenar datos en columnas en lugar de filas. Es responsable de acelerar el tiempo requerido para devolver una consulta en particular. También es responsable de mejorar en gran medida el rendimiento de E/S del disco. Es útil en el análisis de datos y el almacenamiento de datos. también el motivo principal de Columnar Database es leer y escribir datos de manera efectiva. Estos son algunos ejemplos de bases de datos en columnas como Monet DB, Apache Cassandra, SAP Hana, Amazon Redshift.

Base de datos en columnas VS Base de datos en filas:

Tanto las bases de datos de columnas como las de filas son algunos de los métodos que se utilizan para procesar análisis de big data y almacenamiento de datos. Pero su enfoque es diferente entre sí. 

Por ejemplo:

  • Base de datos de fila: «Cliente 1: Nombre, Dirección, Ubicación». (Los campos para cada nuevo registro se almacenan en una fila larga).
  • Base de datos en columnas: «Cliente 1: Nombre, Dirección, Ubicación». (Cada campo tiene su propio conjunto de columnas).

Ejemplo:

Aquí hay un ejemplo de una tabla de base de datos simple con cuatro columnas y tres filas.

Número de identificación Apellido Primer nombre Prima
534782 Molinero Ginny 6000
585523 parker Pedro 8000
479148 stacy gwen 2000

En un DBMS columnar, los datos almacenados están en este formato:

534782, 585523, 479148; Miller, Parker, Stacy; Ginny, Peter, Gwen; 6000, 8000, 2000.

En un DBMS orientado a filas, los datos almacenados tienen este formato:

534782, Miller, Ginny, 6000; 585523, Parker, Peter, 8000; 479148, Stacy, Gwen, 2000.

Cuándo usar la base de datos en columnas:

  1. Consultas que implican solo unas pocas columnas.
  2. Compresión pero solo en columna.
  3. Agrupación de consultas contra una gran cantidad de datos.

Ventajas de la base de datos columnar:

  1. Las bases de datos en columnas se pueden usar para diferentes tareas, como cuando entran en juego las aplicaciones que están relacionadas con big data, entonces las bases de datos orientadas a columnas tienen una mayor atención en tal caso.
  2. Los datos en la base de datos en columnas tienen una naturaleza altamente comprimible y tienen diferentes operaciones como (AVG), (MIN, MAX), que son permitidas por la compresión.
  3. Eficiencia y velocidad: la velocidad de las consultas analíticas que se realizan es más rápida en las bases de datos columnares.
  4. Autoindexación: otro beneficio de un DBMS basado en columnas es la autoindexación, que usa menos espacio en disco que un sistema de administración de base de datos relacional que contiene los mismos datos.

Limitación de la base de datos columnar:

  1. Para cargar datos incrementales, las bases de datos tradicionales son más relevantes en comparación con las bases de datos orientadas a columnas.
  2. Para las aplicaciones de procesamiento de transacciones en línea (OLTP), las bases de datos orientadas a filas son más apropiadas que las bases de datos en columnas.

Publicación traducida automáticamente

Artículo escrito por shubhanjaytiwari y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *