Data Marts (componente de almacenamiento de HDFS) – Part 1

Datawarehouse y Data Mart, ambos son componentes de almacenamiento de HDFS. Data mart es un componente de almacenamiento de este tipo que se refiere a un departamento específico de una organización. Es un subconjunto de los datos almacenados en el almacén de datos. El data mart se enfoca solo en una función particular de una organización y lo mantiene una sola autoridad, por ejemplo, finanzas, marketing. Los Data Marts son pequeños y flexibles. 

Tipos de Data Mart: 
Hay tres tipos de data marts: 

1. Mercado de datos dependiente: 

Dependent Data Mart se crea extrayendo los datos del repositorio central, Datawarehouse. El primer almacén de datos se crea extrayendo datos (a través de la herramienta ETL) de fuentes externas y luego se crea el data mart a partir del almacén de datos. El data mart dependiente se crea en un enfoque de arriba hacia abajo de la arquitectura del almacén de datos. Este modelo de data mart es utilizado por grandes organizaciones. 

2. Mercado de datos independiente – 

El Data Mart independiente se crea directamente a partir de fuentes externas en lugar del almacén de datos. El primer data mart se crea extrayendo datos de fuentes externas y luego el datawarehouse se crea a partir de los datos presentes en el data mart. El data mart independiente está diseñado con un enfoque de abajo hacia arriba de la arquitectura del almacén de datos. Este modelo de data mart es utilizado por organizaciones pequeñas y es comparativamente rentable. 

3. Mercado de datos híbrido – 

Este tipo de Data Mart se crea extrayendo datos de una fuente operativa o de un almacén de datos. 1Path refleja el acceso a datos directamente desde fuentes externas y 2Path refleja el modelo de datos dependientes del data mart. 

Necesidad de Data Mart: 

  1. Data Mart se enfoca solo en el funcionamiento de un departamento particular de una organización. 
  2. Es mantenido por una sola autoridad de una organización. 
  3. Dado que almacena los datos relacionados con una parte específica de una organización, la recuperación de datos es muy rápida. 
  4. Se considera que el diseño y el mantenimiento del data mart son bastante sencillos en comparación con el almacén de datos. 
  5. Reduce el tiempo de respuesta del usuario ya que almacena un pequeño volumen de datos. 
  6. Es de tamaño pequeño debido a que el acceso a los datos es muy rápido. 
  7. Esta unidad de almacenamiento es utilizada por la mayoría de las organizaciones para el buen funcionamiento de sus departamentos.

Ventajas de Data Mart: 

  1. La implementación del data mart requiere menos tiempo en comparación con la implementación del datawarehouse, ya que el data mart está diseñado para un departamento particular de una organización. 
  2. Las organizaciones cuentan con opciones para elegir el modelo de data mart según el costo y su negocio. 
  3. Se puede acceder fácilmente a los datos desde el data mart. 
  4. Contiene consultas a las que se accede con frecuencia, por lo que permite analizar la tendencia empresarial. 

Desventajas de Data Mart:  

  1. Dado que almacena los datos relacionados solo con una función específica, no almacena un gran volumen de datos relacionados con todos y cada uno de los departamentos de una organización como el almacén de datos. 
  2. A veces, crear demasiados data marts se vuelve engorroso. 
     

Publicación traducida automáticamente

Artículo escrito por priyankagujral y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *