Los datos semiestructurados son los datos que no se ajustan a un modelo de datos pero tienen alguna estructura. Carece de un esquema fijo o rígido. Son los datos que no residen en una base de datos racional pero que tienen algunas propiedades organizativas que facilitan su análisis. Con algún proceso, podemos almacenarlos en la base de datos relacional.
Características de los Datos semiestructurados:
- Los datos no se ajustan a un modelo de datos pero tienen alguna estructura.
- Los datos no se pueden almacenar en forma de filas y columnas como en las bases de datos
- Los datos semiestructurados contienen etiquetas y elementos (metadatos) que se utilizan para agrupar datos y describir cómo se almacenan.
- Las entidades similares se agrupan y organizan en una jerarquía.
- Las entidades en el mismo grupo pueden o no tener los mismos atributos o propiedades
- No contiene suficientes metadatos, lo que dificulta la automatización y la gestión de datos.
- El tamaño y el tipo de los mismos atributos en un grupo pueden diferir
- Debido a la falta de una estructura bien definida, los programas de computadora no pueden utilizarlo fácilmente.
Uso de LOB para datos semiestructurados
Los archivos de documentos, como los documentos XML o los archivos de procesadores de texto, son ejemplos de datos semiestructurados. Estos tipos de documentos contienen datos en una estructura lógica que es interpretada o procesada por una aplicación, y no se divide en unidades lógicas más pequeñas cuando se almacena en la base de datos.
Las aplicaciones que tienen datos semiestructurados suelen utilizar una gran cantidad de datos de caracteres. Para almacenar y manipular este tipo de datos, están disponibles los tipos de datos Character Large Object (CLOB)
y National Character Large Object (NCLOB)
.
Los objetos de archivo binario ( BFILE
tipos de datos) también se pueden usar para almacenar datos de caracteres. BFILES
también se puede usar para cargar datos de solo lectura del sistema operativo en CLOB
o NCLOB
instancias para que pueda manipular datos en su aplicación.
Los datos no estructurados son los datos que no se ajustan a un modelo de datos y no tienen una estructura fácilmente identificable, por lo que no pueden ser utilizados fácilmente por un programa de computadora. Los datos no estructurados no están organizados de una manera predefinida o no tienen un modelo de datos predefinido, por lo que no son adecuados para una base de datos relacional convencional.
Características de los datos no estructurados:
- Los datos no se ajustan a un modelo de datos ni tienen ninguna estructura.
- Los datos no se pueden almacenar en forma de filas y columnas como en las bases de datos
- Los datos no siguen ninguna semántica o reglas.
- Los datos carecen de algún formato o secuencia en particular
- Los datos no tienen una estructura fácilmente identificable
- Debido a la falta de una estructura identificable, los programas de computadora no pueden usarlo fácilmente.
Uso de LOB para datos no estructurados
Los datos no estructurados no se pueden dividir en componentes estándar. Por ejemplo, los datos de un empleado se pueden separar/mostrar como un nombre, que se almacena como una string; El número de identificación, almacenado como un número entero, el salario del empleado, etc., mientras que, por otro lado, una fotografía consiste en una larga secuencia de 1 y 0. Estos bits se manipulan para cambiar los píxeles como activados y desactivados para que podamos ver las imágenes en pantalla, pero no se dividen en ninguna estructura para el almacenamiento de la base de datos.
Además, los datos no estructurados, como imágenes gráficas, clips de video fijos, videos en movimiento y formas de onda de sonido, tienden a tener un tamaño grande, mientras que el registro típico de un empleado puede ser igual a unos pocos cientos de bytes, mientras que incluso el tamaño pequeño de los datos multimedia puede ser igual a miles de veces más grande.
Los tipos de datos ideales que se utilizan para una gran cantidad de datos no estructurados incluyen el tipo de BLOB
datos (objeto binario grande) y el tipo de BFILE
datos (objeto de archivo binario).
Publicación traducida automáticamente
Artículo escrito por ShubhamMaurya3 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA