Diferencia entre datos estructurados, semiestructurados y no estructurados

Big Data incluye gran volumen, alta velocidad y variedad extensible de datos. Estos son 3 tipos: datos estructurados, datos semiestructurados y datos no estructurados. 
 

  1. Datos estructurados: 
    los datos estructurados son datos cuyos elementos son direccionables para un análisis efectivo. Se ha organizado en un repositorio formateado que suele ser una base de datos. Se trata de todos los datos que se pueden almacenar en la base de datos SQL en una tabla con filas y columnas. Tienen claves relacionales y se pueden mapear fácilmente en campos prediseñados. Hoy en día, esos datos son los más procesados ​​en el desarrollo y la forma más sencilla de gestionar la información. Ejemplo: Datos relacionales. 
     
  2. Datos 
    semiestructurados: los datos semiestructurados son información que no reside en una base de datos relacional pero que tiene algunas propiedades organizativas que facilitan el análisis. Con algunos procesos, puede almacenarlos en la base de datos de relaciones (podría ser muy difícil para algún tipo de datos semiestructurados), pero los semiestructurados existen para facilitar el espacio. Ejemplo : datos XML. 
     
  3. Datos no estructurados: los datos 
    no estructurados son datos que no están organizados de una manera predefinida o no tienen un modelo de datos predefinido, por lo que no son adecuados para una base de datos relacional convencional. Por lo tanto, para los datos no estructurados, existen plataformas alternativas para almacenar y administrar, son cada vez más frecuentes en los sistemas de TI y las organizaciones los utilizan en una variedad de aplicaciones de análisis e inteligencia comercial. Ejemplo : Word, PDF, texto, registros multimedia. 
     

Diferencias entre datos estructurados, semiestructurados y no estructurados: 

Propiedades Datos estructurados Datos semiestructurados Datos no estructurados
Tecnología Se basa en la tabla de base de datos relacional. Se basa en XML/RDF (Marco de descripción de recursos). Se basa en caracteres y datos binarios.
Gestión de transacciones Transacciones maduras y varias técnicas de concurrencia La transacción está adaptada de DBMS no madurada Sin gestión de transacciones y sin concurrencia
Gestión de versiones Versionado sobre tuplas, filas, tablas Es posible el control de versiones sobre tuplas o gráficos Versionado como un todo
Flexibilidad Depende del esquema y es menos flexible. Es más flexible que los datos estructurados pero menos flexible que los datos no estructurados Es más flexible y hay ausencia de esquema.
Escalabilidad Es muy difícil escalar el esquema DB Su escalado es más simple que los datos estructurados Es más escalable.
Robustez muy robusto Nueva tecnología, poco difundida
Rendimiento de consultas La consulta estructurada permite uniones complejas  Las consultas sobre Nodes anónimos son posibles Solo son posibles las consultas textuales

Publicación traducida automáticamente

Artículo escrito por AshishVishwakarma1 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *