Arquitectura de almacén de datos

Un almacén de datos es una colección heterogénea de diferentes fuentes de datos organizadas bajo un esquema unificado. Hay 2 enfoques para construir un almacén de datos: el enfoque de arriba hacia abajo y el enfoque de abajo hacia arriba se explican a continuación. 

1. Enfoque de arriba hacia abajo: 

Los componentes esenciales se discuten a continuación: 

  1. Fuentes 
    externas: la fuente externa es una fuente desde donde se recopilan datos independientemente del tipo de datos. Los datos pueden ser estructurados, semiestructurados y no estructurados también. 
     
  2. Área de escenario: 
    dado que los datos extraídos de fuentes externas no siguen un formato particular, es necesario validar estos datos para cargarlos en el almacén de datos. Para ello, se recomienda utilizar la herramienta ETL
    • E (Extraído): los datos se extraen de una fuente de datos externa. 
       
    • T (Transformar): Los datos se transforman al formato estándar. 
       
    • L (Cargar): Los datos se cargan en el almacén de datos después de transformarlos al formato estándar. 
       
  3. Depósito de datos : 
    después de la limpieza de los datos, se almacenan en el depósito de datos como repositorio central. En realidad, almacena los metadatos y los datos reales se almacenan en los data marts. Tenga en cuenta que el almacén de datos almacena los datos en su forma más pura en este enfoque de arriba hacia abajo. 
     
  4. Data Marts: 
    Data Mart también forma parte del componente de almacenamiento. Almacena la información de una función particular de una organización que es manejada por una sola autoridad. Puede haber tantos data marts en una organización dependiendo de las funciones. También podemos decir que el data mart contiene un subconjunto de los datos almacenados en el datawarehouse. 
     
  5. Minería de datos: 
    la práctica de analizar los grandes datos presentes en el almacén de datos es la minería de datos. Se utiliza para encontrar los patrones ocultos que están presentes en la base de datos o en el almacén de datos con la ayuda del algoritmo de minería de datos. 

    Inmon define este enfoque como: el almacén de datos como un depósito central para la organización completa y los data marts se crean a partir de él después de que se haya creado el almacén de datos completo. 
     

Ventajas del enfoque de arriba hacia abajo:  

  1. Dado que los data marts se crean a partir del datawarehouse, proporciona una vista dimensional coherente de los data marts. 
     
  2. Además, este modelo se considera como el modelo más fuerte para los cambios comerciales. Por eso, las grandes organizaciones prefieren seguir este enfoque. 
     
  3. Crear data mart desde datawarehouse es fácil. 
     

Desventajas del enfoque de arriba hacia abajo:  

  1. El coste, el tiempo de diseño y su mantenimiento es muy elevado. 
     

2. Enfoque de abajo hacia arriba: 

  1. Primero, los datos se extraen de fuentes externas (lo mismo que sucede en el enfoque de arriba hacia abajo). 
     
  2. Luego, los datos pasan por el área de preparación (como se explicó anteriormente) y se cargan en los data marts en lugar de en el almacén de datos. Los data marts se crean primero y brindan capacidad de generación de informes. Se dirige a una única área de negocio. 
     
  3. Estos data marts luego se integran en el datawarehouse. 
     

Este enfoque es proporcionado por Kinball como: los data marts se crean primero y proporcionan una vista delgada para los análisis y el datawarehouse se crea después de que se hayan creado los data marts completos. 

Ventajas del enfoque de abajo hacia arriba:  

  1. Como los data marts se crean primero, los informes se generan rápidamente. 
     
  2. Podemos acomodar una mayor cantidad de data marts aquí y, de esta manera, se puede ampliar el almacenamiento de datos. 
     
  3. Además, el costo y el tiempo necesarios para diseñar este modelo son comparativamente bajos. 
     

Desventaja del enfoque de abajo hacia arriba: 

  1. Este modelo no es sólido como enfoque de arriba hacia abajo, ya que la vista dimensional de los data marts no es consistente como lo es en el enfoque anterior. 

Publicación traducida automáticamente

Artículo escrito por priyankagujral y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *