Un almacén de datos se puede representar mediante la integración de datos de múltiples fuentes heterogéneas. Fue definido por Bill Inmon en 1990. El almacén de datos es una recopilación de datos integrada, orientada a temas, variable en el tiempo y no volátil. Un almacén de datos está estructurado por la integración de datos de múltiples fuentes heterogéneas. Es un sistema utilizado para el análisis de datos y la presentación de informes. Un almacén de datos es deliberadamente un factor central de la inteligencia empresarial. La tecnología de BI proporciona una vista histórica, actual y predictiva de las operaciones comerciales sin minería de datos, es posible que muchas empresas no puedan realizar un análisis de mercado efectivo, la fortaleza y debilidad de sus competidores, decisiones rentables, etc.
Data Warehouse se refiere al depósito de datos que se mantiene por separado de los datos operativos de la organización. La arquitectura de almacén de datos de varios niveles consta de los siguientes componentes:
- Nivel inferior
- Nivel Medio
- nivel superior
Nivel inferior (fuentes de datos y almacenamiento de datos):
- El nivel inferior generalmente consta de fuentes de datos y almacenamiento de datos.
- Es un servidor de base de datos de almacén. Por ejemplo RDBMS.
- En el nivel inferior, utilizando la interfaz del programa de aplicación (llamadas puertas de enlace), los datos se extraen de fuentes operativas y externas.
- La interfaz del programa de aplicación es compatible con ODBC (Conexión de base de datos abierta), OLE-DB (Enlace abierto e incrustación para base de datos), JDBC (Conexión de base de datos Java).
Nivel medio:
El nivel intermedio es un servidor OLAP que normalmente se implementa utilizando:
Un modelo OLAP relacional (ROLAP) (es decir, un DBMS relacional extendido que asigna operaciones de datos estándar a datos estándar); o Un modelo OLAP multidimensional (MOLAP) (es decir, un servidor de propósito especial que implementa directamente operaciones y datos multidimensionales).
Nivel superior:
El nivel superior es una capa de cliente frontal, que incluye herramientas de consulta e informes, herramientas de análisis y/o herramientas de extracción de datos (por ejemplo, análisis de tendencias, predicción, etc.).
Modelos de almacén de datos:
Desde el punto de vista de la arquitectura, hay tres modelos de almacén:
Almacén empresarial: –
- Un almacén empresarial recopila todos los temas de información repartidos por toda la organización.
- Proporciona integración de datos en toda la empresa, generalmente de uno o varios sistemas operativos o proveedores de información externos, y tiene un alcance multifuncional.
- Por lo general, contiene datos detallados, así como datos resumidos y puede variar en tamaño desde unos pocos gigabytes hasta cientos de gigabytes, terabytes o más. Puede ser un almacén de datos empresarial.
- El mainframe tradicional, el superservidor informático o la arquitectura paralela se han implementado en las plataformas. Esto requiere un extenso modelado comercial y puede llevar años diseñarlo y fabricarlo.
Mercado de datos: –
- Un data mart contiene un subconjunto de datos corporativos que son importantes para un grupo específico de usuarios.
- El alcance se limita a temas específicos seleccionados.
- Por ejemplo, un mercado de datos de marketing puede limitar sus temas a clientes, bienes y ventas.
- Los datos contenidos en las verrugas de datos se resumen. Las verrugas de datos generalmente se aplican a servidores departamentales de bajo costo que están basados en Unix/Linux o Windows.
- Es más probable que el ciclo de implementación de un data mart se mida en semanas en lugar de meses o años. Sin embargo, puede ser que a la larga, la integración compleja esté involucrada en su diseño y planificación no sean de toda la empresa.
Almacén Virtual:-
- Un almacén virtual es un grupo de vistas en una base de datos operativa.
- Para un procesamiento de consultas eficiente, solo unas pocas vistas de resumen posibles pueden ser físicas.
- La creación de un almacén virtual es fácil, pero requiere capacidad adicional en los servidores de bases de datos operativas.
Publicación traducida automáticamente
Artículo escrito por tanushree7252 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA