Hay muchas bases de datos y fuentes de datos que necesitan integración. Casi todas las aplicaciones tienen muchas fuentes de datos que se pueden usar para trabajar juntas. La integración de datos implica la integración de datos de varias fuentes y tiene una vista única sobre las fuentes. Se realiza para responder consultas utilizando la información que se ha combinado. Puede ser físico y virtual. La integración de datos físicos sobrevive a los datos en el almacén.
La integración virtual mantiene los datos en las propias fuentes. El problema que surge debido a la integración es la heterogeneidad de los datos entre las fuentes. Puede haber varios problemas de heterogeneidad al recopilar datos de las fuentes, como semántica (diferentes nombres de los atributos que tienen datos similares), comunicación, esquema o tipo de datos. Para superar estos problemas, existen tres modelos diseñados para integrar datos, son bases de datos federadas, almacenamiento de datos y mediación.
Global as View (GAV):
Global as view es uno de los tipos de mediadores de integración de datos basada en vistas. El esquema global actúa como una vista sobre el esquema fuente, es decir, el esquema mediador se describe en términos del esquema local. Dada una consulta sobre el esquema global, el mediador seguirá las reglas y plantillas existentes para convertir la consulta en consultas específicas de fuente. Envía las nuevas consultas a los contenedores para su ejecución. Wrapper busca todas las expresiones posibles y cómo se pueden combinar para responder a la consulta dada.
Aplicaciones:
- Integración de información empresarial que crea bases de datos separadas que son propiedad de una empresa y funcionan juntas.
- Bases de datos científicas, por ejemplo, la base de datos del genoma.
- Integración de catálogos: eso implica combinar información del producto de cada proveedor.
Cómo funciona:
la mediación involucra a un mediador que es una vista virtual de los datos y no almacena ningún dato, ya que los datos se almacenan en las fuentes. El esquema de varias fuentes se combina formando un esquema virtual de mediador. La asignación tiene lugar en el momento de la consulta. Cuando un usuario consulta, se asigna a varias otras consultas y cada consulta se envía a las fuentes. Las fuentes los evalúan y envían los resultados.
Los resultados se fusionan y se envían al usuario final. Este proceso se llama mediación. Utiliza wrappers que son los encargados de realizar el mapeo de las consultas. Utilizan plantillas (que ya están creadas) que representan muchas consultas y, por lo tanto, se vuelven flexibles. Si la consulta del mediador coincide con una plantilla, se devuelven los resultados; de lo contrario, no. Hay dos tipos de mediador, son Global como Vista y Local como Vista. Discutiremos Global As View.
Ejemplo:
Tomemos un ejemplo para entender el funcionamiento de GAV.
Integrar catálogos. Supongamos que Zexmon (una empresa) quiere comprar chips como DIP y PGA que tienen el mismo protocolo.
Esquema global –
DIP ( manufacturer, model, protocol ) PGA ( manufacturer, model, protocol )
Esquema local:
cada fabricante de DIP y PGA tiene una relación (modelo, protocolo).
Zexmon consultará al mediador. El mediador comenzará consultando a todos los fabricantes de DIP sobre el par de modelo y protocolo. El envoltorio los convertirá en un triplete al agregar el atributo fabricante. Los protocolos de todas las fuentes para cada chip DIP se devuelven al mediador.
Ahora el mediador comienza a consultar a todos los fabricantes de PGA utilizando el protocolo devuelto anteriormente. Nuevamente, el contenedor agrega el atributo del fabricante al par (modelo, protocolo). Y así es como el mediador recupera los chips DIP y PGA que tienen protocolos similares. Este a su vez ayuda a zexmon a comprar las fichas deseadas.
ventajas :
- Global as view es más simple de implementar porque usted tiene el control sobre el funcionamiento del mediador.
- Es simple de diseñar.
- El enfoque de respuesta a consultas es procedimental y, por lo tanto, lo practican muchos sistemas industriales.
Desventajas:
- Dado que la base de datos global está en términos de múltiples fuentes, el esquema global no puede enmarcar ninguna información que esté ausente en cualquiera de los esquemas fuente.
- Es un gasto general cuando se trata de agregar nuevas fuentes a las existentes, ya que debe garantizarse que las fuentes actuales dependan de ellas, es decir, rara vez se agregan fuentes independientes. Si se agrega la nueva fuente, también se deben cambiar las asignaciones.
- Se estrecha la visión del contenido que se podría generar.
- La eliminación de una fuente de datos también puede requerir mucho trabajo, lo que la hace inflexible.
Publicación traducida automáticamente
Artículo escrito por ajaychawla y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA