Big Data incluye gran volumen, alta velocidad y variedad extensible de datos. Estos son 3 tipos: datos estructurados, datos semiestructurados y datos no estructurados.
- Datos estructurados:
los datos estructurados son datos cuyos elementos son direccionables para un análisis efectivo. Se ha organizado en un repositorio formateado que suele ser una base de datos. Se trata de todos los datos que se pueden almacenar en la base de datos SQL en una tabla con filas y columnas. Tienen claves relacionales y se pueden mapear fácilmente en campos prediseñados. Hoy en día, esos datos son los más procesados en el desarrollo y la forma más sencilla de gestionar la información. Ejemplo: Datos relacionales.
- Datos
semiestructurados: los datos semiestructurados son información que no reside en una base de datos relacional pero que tiene algunas propiedades organizativas que facilitan el análisis. Con algunos procesos, puede almacenarlos en la base de datos de relaciones (podría ser muy difícil para algún tipo de datos semiestructurados), pero los semiestructurados existen para facilitar el espacio. Ejemplo : datos XML.
- Datos no estructurados: los datos
no estructurados son datos que no están organizados de una manera predefinida o no tienen un modelo de datos predefinido, por lo que no son adecuados para una base de datos relacional convencional. Por lo tanto, para los datos no estructurados, existen plataformas alternativas para almacenar y administrar, son cada vez más frecuentes en los sistemas de TI y las organizaciones los utilizan en una variedad de aplicaciones de análisis e inteligencia comercial. Ejemplo : Word, PDF, texto, registros multimedia.
Diferencias entre datos estructurados, semiestructurados y no estructurados:
Propiedades | Datos estructurados | Datos semiestructurados | Datos no estructurados |
---|---|---|---|
Tecnología | Se basa en la tabla de base de datos relacional. | Se basa en XML/RDF (Marco de descripción de recursos). | Se basa en caracteres y datos binarios. |
Gestión de transacciones | Transacciones maduras y varias técnicas de concurrencia | La transacción está adaptada de DBMS no madurada | Sin gestión de transacciones y sin concurrencia |
Gestión de versiones | Versionado sobre tuplas, filas, tablas | Es posible el control de versiones sobre tuplas o gráficos | Versionado como un todo |
Flexibilidad | Depende del esquema y es menos flexible. | Es más flexible que los datos estructurados pero menos flexible que los datos no estructurados | Es más flexible y hay ausencia de esquema. |
Escalabilidad | Es muy difícil escalar el esquema DB | Su escalado es más simple que los datos estructurados | Es más escalable. |
Robustez | muy robusto | Nueva tecnología, poco difundida | — |
Rendimiento de consultas | La consulta estructurada permite uniones complejas | Las consultas sobre Nodes anónimos son posibles | Solo son posibles las consultas textuales |
Publicación traducida automáticamente
Artículo escrito por AshishVishwakarma1 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA