Medidas de distancia en minería de datos

El agrupamiento consiste en agrupar ciertos objetos que son similares entre sí, se puede utilizar para decidir si dos elementos son similares o diferentes en sus propiedades. En un sentido de minería de datos , la medida de similitud es una distancia con dimensiones que describen las características del objeto. Eso significa que si la … Continue reading «Medidas de distancia en minería de datos»

Restricciones en el modelo de base de datos relacional

Al modelar el diseño de la base de datos relacional , podemos poner algunas restricciones, como qué valores se permiten insertar en la relación, qué tipo de modificaciones y eliminaciones se permiten en la relación. Estas son las restricciones que imponemos en la base de datos relacional.  En modelos como los modelos ER, no teníamos … Continue reading «Restricciones en el modelo de base de datos relacional»

Conjuntos de elementos frecuentes y sus aplicaciones en análisis de datos

Conjuntos de elementos frecuentes: una de las principales familias de técnicas para distinguir datos es el descubrimiento de conjuntos de elementos frecuentes. El problema principal rara vez se ve como el descubrimiento de «reglas de asociación», cuyo descubrimiento depende radicalmente del descubrimiento de conjuntos de elementos frecuentes. Patrones frecuentes: Los patrones frecuentes son patrones (por … Continue reading «Conjuntos de elementos frecuentes y sus aplicaciones en análisis de datos»

Cómo encontrar la forma normal más alta de una relación

Para comprender este tema, debe tener una idea básica sobre  la Dependencia funcional y las claves candidatas  y las formas normales  . Pasos para encontrar la forma normal más alta de la relación:  Encuentre todas las posibles claves candidatas de la relación. Divida todos los atributos en dos categorías: atributos principales y atributos no principales. … Continue reading «Cómo encontrar la forma normal más alta de una relación»

Diferencia entre almacenes de datos orientados a filas y orientados a columnas en DBMS – Part 1

Un almacén de datos es básicamente un lugar para almacenar colecciones de datos, como una base de datos, un sistema de archivos o un directorio. En el sistema de base de datos se pueden almacenar de dos maneras. Estos son los siguientes: Almacenes de datos orientados a filas Almacenes de datos orientados a columnas Las … Continue reading «Diferencia entre almacenes de datos orientados a filas y orientados a columnas en DBMS – Part 1»

SQL | Unirse (unión cartesiana y autounión)

SQL| JOIN (Inner, Left, Right y Full Joins) En este artículo, discutiremos sobre los dos JOINS restantes: UNIÓN CARTESIANA UNIRSE AUTOMÁTICAMENTE Considere las dos tablas a continuación: EstudianteCurso JOIN CARTESIAN : El JOIN CARTESIAN también se conoce como JOIN CRUZADO. En una UNIÓN CARTESIANA hay una unión para cada fila de una tabla con cada … Continue reading «SQL | Unirse (unión cartesiana y autounión)»

Diferencia entre Hive y HBase

Hive: Hive es un paquete de almacenamiento de datos construido sobre Hadoop. Se utiliza principalmente para el análisis de datos. Por lo general, se dirige a usuarios que ya se sienten cómodos con el lenguaje de consulta estructurado (SQL). Es muy similar a SQL y se llama Hive Query Language (HQL). Hive administra y consulta … Continue reading «Diferencia entre Hive y HBase»

Diferencia entre álgebra relacional y cálculo relacional

Tanto el álgebra relacional como el cálculo relacional son lenguajes de consulta formales.  Álgebra relacional: El álgebra relacional es un lenguaje procedimental. En Álgebra Relacional, se especifica el orden en que se deben realizar las operaciones. En Álgebra Relacional , se crean marcos para implementar las consultas. Las operaciones básicas incluidas en el álgebra relacional … Continue reading «Diferencia entre álgebra relacional y cálculo relacional»

¿Qué son los datos estructurados?

Los datos estructurados son los datos que se ajustan a un modelo de datos, tienen una estructura bien definida, siguen un orden consistente y una persona o un programa informático pueden acceder y utilizarlos fácilmente. Los datos estructurados generalmente se almacenan en esquemas bien definidos, como bases de datos. Generalmente es tabular con columnas y … Continue reading «¿Qué son los datos estructurados?»

Diferencia entre base de datos centralizada y base de datos distribuida

1. Base de datos centralizada:  Una base de datos centralizada es básicamente un tipo de base de datos que se almacena, ubica y mantiene en una sola ubicación. Este tipo de base de datos se modifica y administra desde esa misma ubicación. Esta ubicación es, por lo tanto, principalmente cualquier sistema de base de datos … Continue reading «Diferencia entre base de datos centralizada y base de datos distribuida»