Minería de datos en ciencia e ingeniería

La minería de datos es un proceso automático de descubrir patrones implícitos, correlaciones, anomalías e información estadística dentro de grandes cantidades de datos almacenados en repositorios. Esta información puede interpretarse por hipótesis o teoría y usarse para hacer pronósticos. Es un área interdisciplinaria que incorpora ideas de una variedad de disciplinas matemáticas y computacionales que … Continue reading «Minería de datos en ciencia e ingeniería»

ML | Pérdida de registro y error cuadrático medio

Pérdida de registro Es la medida de evaluación para comprobar el rendimiento del modelo de clasificación. Mide la cantidad de divergencia de la probabilidad predicha con la etiqueta real. Entonces, cuanto menor sea el valor de pérdida de registro, mayor será la perfección del modelo. Para un modelo perfecto, el valor de pérdida de registro … Continue reading «ML | Pérdida de registro y error cuadrático medio»

Seis pasos del proceso de análisis de datos

La recopilación, transformación y organización de datos para sacar conclusiones, hacer predicciones para el futuro y tomar decisiones informadas basadas en datos se denomina análisis de datos. La profesión que maneja el análisis de datos se llama Analista de datos. Existe una gran demanda de analistas de datos ya que los datos se están expandiendo … Continue reading «Seis pasos del proceso de análisis de datos»

Métodos estadísticos en minería de datos

Cualquier situación se puede analizar de dos formas en la minería de datos: Análisis estadístico: en estadística, los datos se recopilan, analizan, exploran y presentan para identificar patrones y tendencias. Alternativamente, se le conoce como análisis cuantitativo. Análisis no estadístico: este análisis proporciona información generalizada e incluye sonido, imágenes fijas e imágenes en movimiento. En … Continue reading «Métodos estadísticos en minería de datos»

Diferencia entre Kimball e Inmon

El diseño de un almacén de datos es una parte esencial del desarrollo empresarial. Para el diseño, hay dos arquitecturas más comunes llamadas Kimball e Inmon , pero la pregunta es cuál es mejor y cuál sirve a los usuarios con baja redundancia. Comparemos ambos en algunos factores.  1. Kimball: Ralph Kimball presentó el enfoque … Continue reading «Diferencia entre Kimball e Inmon»

Regla de asociación multinivel en minería de datos

Regla de asociación multinivel: Las reglas de asociación creadas a partir de información de minería en diferentes grados de reflexión se denominan reglas de asociación de varios niveles o escalonadas. Las reglas de asociación multinivel se pueden extraer de manera efectiva utilizando progresiones de ideas bajo un sistema de certeza de soporte. Las reglas con … Continue reading «Regla de asociación multinivel en minería de datos»

Reducción de la numerosidad en la minería de datos

Requisito previo: Preprocesamiento de datos ¿Por qué reducción de datos? El proceso de reducción de datos reduce el tamaño de los datos y los hace adecuados y viables para el análisis. En el proceso de reducción, se debe preservar la integridad de los datos y se reduce el volumen de datos. Hay muchas técnicas que … Continue reading «Reducción de la numerosidad en la minería de datos»

Comprensión básica del algoritmo CURE

CURE (agrupación mediante representantes) Es una técnica de agrupamiento de base jerárquica, que adopta un término medio entre el centroide basado y los extremos de todos los puntos. El agrupamiento jerárquico es un tipo de agrupamiento que comienza con un clúster de un solo punto y se mueve para fusionarse con otro clúster, hasta que … Continue reading «Comprensión básica del algoritmo CURE»

Big Data como tecnología

Citando las palabras de Pat Gelsinger, CEO de VMware “ Los datos son la nueva ciencia, Big Data tiene las respuestas ”. A juzgar por esta declaración, los datos son la clave del mundo actual. En el pasado, teníamos que confiar en profesionales experimentados con respecto a decisiones críticas relacionadas con negocios, marketing, compras, etc. … Continue reading «Big Data como tecnología»

Agrupación en Minería de Datos

Agrupación :  El proceso de convertir un grupo de objetos abstractos en clases de objetos similares se conoce como agrupación.  Puntos para recordar:  Un grupo se trata como un grupo de objetos de datos En el proceso de análisis de conglomerados, el primer paso es dividir el conjunto de datos en grupos con la ayuda … Continue reading «Agrupación en Minería de Datos»