Requisito previo: arquitectura del almacén de datos
Data Warehouse se utiliza para almacenar datos históricos que ayudan a tomar decisiones estratégicas para el negocio. Se utiliza para el procesamiento analítico en línea (OLAP) , que ayuda a analizar los datos. El almacén de datos contribuye a que los ejecutivos de negocios organicen, acepten y utilicen sistemáticamente sus datos para tomar decisiones estratégicas.
¿Qué es exactamente un almacén de datos?
El almacén de datos se ha definido de muchas maneras, lo que dificulta formular una definición rigurosa. Hablando gradualmente, un almacén de datos es un depósito de datos que se mantiene separado de la base de datos operativa de una organización. Los sistemas de almacenamiento de datos permiten la integración de una amplia variedad de sistemas de aplicación. Apoyan el procesamiento de la información al proporcionar un plan sólido de datos históricos agregados para el análisis.
Los datos en un almacén de datos provienen de los sistemas operativos de la organización, así como de otras fuentes externas. Estos se conocen colectivamente como los sistemas de origen. Los datos extraídos de los sistemas de origen se almacenan en un área llamada área de preparación de datos, donde los datos se limpian, transforman, ensamblan y duplican para preparar los datos en el almacén de datos.
El área de preparación de datos suele ser un conjunto de máquinas donde se llevan a cabo actividades simples como la clasificación y el procesamiento secuencial. El área de preparación de datos no proporciona lo antes posible un sistema proporciona servicios de consulta o presentación, se clasifica como un servidor de presentación. Un servidor de presentación es la máquina de destino en la que se cargan los datos desde el área de preparación de datos y se almacenan directamente para que los consulten los usuarios finales, los autores de informes y otras aplicaciones.
Hay tres tipos diferentes de sistemas necesarios para un almacén de datos:
- Sistemas de origen
- Área de preparación de datos
- Servidor de presentación
Los datos se mueven desde el área de origen de datos a través del área de preparación hasta el servidor de presentación. Todo el proceso se conoce mejor como ETL (extracción, transformación y carga) o ETT (extracción, transformación y transferencia).
Componentes de la arquitectura del almacén de datos y sus tareas:
1. Fuente operativa –
- Una fuente operativa es una fuente de datos que consta de datos operativos y datos externos.
- Los datos pueden provenir de DBMS relacionales como Informix, Oracle.
2. Administrador de carga –
- El administrador de carga realiza todas las operaciones asociadas con la extracción de datos de carga en el almacén de datos.
- Estas tareas incluyen la transformación simple de datos para prepararlos para ingresar al almacén.
3. Gestión de almacén –
- El jefe de almacén es el responsable del proceso de gestión del almacén.
- Las operaciones realizadas por el responsable del almacén son el análisis, agregación, copia de seguridad y recopilación de datos, desnormalización de los datos.
4. Administrador de consultas –
- Query Manager realiza todas las tareas asociadas con la gestión de las consultas de los usuarios.
- La complejidad del administrador de consultas está determinada por la herramienta de operaciones de acceso del usuario final y las funciones proporcionadas por la base de datos.
5. Datos detallados –
- Se utiliza para almacenar todos los datos detallados en el esquema de la base de datos.
- Los datos detallados se cargan en el almacén de datos para complementar los datos recopilados.
6. Datos resumidos –
- Los datos resumidos son una parte del almacén de datos que almacena agregaciones predefinidas
- Estas agregaciones son generadas por el responsable del almacén.
7. Datos de archivo y copia de seguridad –
- Los datos detallados y resumidos se almacenan con fines de archivo y copia de seguridad.
- Los datos se reubican en archivos de almacenamiento, como cintas magnéticas o discos ópticos.
8. Metadatos –
- Los metadatos son básicamente datos almacenados por encima de los datos.
- Se utiliza para el proceso de extracción y carga, almacén, proceso de gestión y proceso de gestión de consultas.
9. Herramientas de acceso del usuario final:
- Las herramientas de acceso del usuario final consisten en análisis, informes y minería.
- Mediante el uso de herramientas de acceso de usuario final, los usuarios pueden vincularse con el almacén.
Publicación traducida automáticamente
Artículo escrito por tanushree7252 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA