Data Warehouse almacena una gran cantidad de datos, que generalmente se recopilan de múltiples fuentes heterogéneas como archivos, DBMS, etc. para producir resultados estadísticos que ayudan en la toma de decisiones.
Las pruebas son muy importantes para los sistemas de almacenamiento de datos para la validación de datos y para que funcionen de manera correcta y eficiente.
Hay tres niveles básicos de prueba realizados en el almacén de datos que son los siguientes:
- Prueba unitaria :
este tipo de prueba se realiza al final del desarrollador. En las pruebas unitarias, cada unidad/componente de los módulos se prueba por separado. Cada módulo del almacén de datos completo, es decir, el programa, el script SQL, el procedimiento y el shell de Unix se validan y prueban. - Pruebas de integración :
en este tipo de pruebas, las diversas unidades/módulos individuales de la aplicación se juntan o combinan y luego se prueban contra el número de entradas. Se realiza para detectar la falla en los módulos integrados y para probar si los diversos componentes funcionan bien después de la integración. - Pruebas del sistema :
las pruebas del sistema son la forma de prueba que valida y prueba toda la aplicación del almacén de datos. Este tipo de prueba está siendo realizada por el equipo de pruebas técnicas. Esta prueba se lleva a cabo después de que el equipo de desarrolladores realiza pruebas unitarias y el objetivo principal de esta prueba es verificar si todo el sistema funciona en conjunto o no.
Los desafíos de las pruebas de almacenamiento de datos son:
- La selección de datos de múltiples fuentes y el análisis que sigue plantean un gran desafío.
- Volumen y complejidad de los datos, ciertas estrategias de prueba consumen mucho tiempo.
- Las pruebas de ETL requieren habilidades de Hive SQL, por lo que plantean desafíos para los probadores que tienen habilidades limitadas de SQL.
- Datos redundantes en un almacén de datos.
- Informes inconsistentes e inexactos.
La prueba ETL se realiza en cinco etapas:
- Identificar las fuentes de datos y los requisitos.
- Adquisición de datos.
- Implementar lógicas de negocio y modelado dimensional.
- Generar y completar datos.
- Crear informes.
Publicación traducida automáticamente
Artículo escrito por Shivamthakur77 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA