Extracción de características en minería de datos

“Los datos son el nuevo petróleo para la industria de TI”. – por Clive Humby “El mundo es un gran problema de datos”. – por Andrew McAfee, codirector de la Iniciativa MIT “Los datos son la nueva ciencia. Big Data tiene las respuestas”. – Por Pat Gelsinger De hecho, esto es cierto porque tenemos una … Continue reading «Extracción de características en minería de datos»

Las 15 herramientas de almacenamiento de datos más populares

Un almacén de datos es un sistema de gestión de datos que se utiliza para almacenar, informar y analizar datos. Es el componente principal de la inteligencia empresarial y también se conoce como almacén de datos empresarial. Los almacenes de datos son repositorios centrales que almacenan datos de una o más fuentes heterogéneas. Los almacenes … Continue reading «Las 15 herramientas de almacenamiento de datos más populares»

Métodos estadísticos en minería de datos

Cualquier situación se puede analizar de dos formas en la minería de datos: Análisis estadístico: en estadística, los datos se recopilan, analizan, exploran y presentan para identificar patrones y tendencias. Alternativamente, se le conoce como análisis cuantitativo. Análisis no estadístico: este análisis proporciona información generalizada e incluye sonido, imágenes fijas e imágenes en movimiento. En … Continue reading «Métodos estadísticos en minería de datos»

Teorema de Bayes en minería de datos

El teorema de Bayes describe la probabilidad de un evento, con base en el conocimiento previo de las condiciones que podrían estar relacionadas con el evento. En otras palabras, el teorema de Bayes es el complemento de la probabilidad condicional.  Con la ayuda de la probabilidad condicional, uno puede encontrar la probabilidad de X dado … Continue reading «Teorema de Bayes en minería de datos»

Enfoque Data Cube u OLAP en Data Mining

La agrupación de datos en una array multidimensional se denomina cubos de datos. En el alojamiento de Dataware, generalmente tratamos con varios modelos de datos multidimensionales, ya que los datos estarán representados por múltiples dimensiones y múltiples atributos. Estos datos multidimensionales se representan en el cubo de datos como el cubo representa un espacio de … Continue reading «Enfoque Data Cube u OLAP en Data Mining»

Diferencia entre métodos de clasificación y predicción en minería de datos

La clasificación y la predicción son dos métodos principales utilizados para extraer los datos . Usamos estas dos técnicas para analizar los datos, para explorar más acerca de los datos desconocidos. Clasificación:  La clasificación es el proceso de encontrar un buen modelo que describa las clases de datos o conceptos, y el propósito de la … Continue reading «Diferencia entre métodos de clasificación y predicción en minería de datos»

Enfoques basados ​​en agrupamiento para la detección de valores atípicos en la minería de datos

El análisis de agrupamiento es el proceso de dividir un conjunto de objetos de datos en subconjuntos. Cada subconjunto es un grupo tal que los objetos son similares entre sí. El conjunto de conglomerados obtenidos del análisis de conglomerados se puede denominar conglomerados. Por ejemplo: Segregar clientes en un mercado Retail como cliente frecuente, cliente … Continue reading «Enfoques basados ​​en agrupamiento para la detección de valores atípicos en la minería de datos»

Privacidad, seguridad e impactos sociales de la minería de datos

La minería de datos consiste en descubrir de forma inteligente información útil a partir de grandes cantidades de datos para resolver problemas de la vida real. Es una combinación de dos palabras: datos y minería. Los datos son una colección de instancias, y la minería está diseñada para filtrar información útil. La minería de datos, … Continue reading «Privacidad, seguridad e impactos sociales de la minería de datos»

Modelo de ciclo de vida de desarrollo de almacén de datos

Un almacén de datos es un sistema de gestión de datos que se desarrolló principalmente para respaldar actividades de inteligencia comercial, especialmente análisis. Los almacenes de datos están diseñados exclusivamente para realizar operaciones y análisis impulsados ​​por consultas y, a menudo, contienen una gran cantidad de datos históricos. ¿Qué es el almacenamiento de datos? El … Continue reading «Modelo de ciclo de vida de desarrollo de almacén de datos»

Enfoques basados ​​en clasificación en minería de datos

La clasificación es el procesamiento de encontrar un grupo de modelos (o funciones) que describen y distinguen clases de datos o conceptos, con el objetivo de tener la capacidad de usar el modelo para predecir la categoría de objetos cuya etiqueta de clase se desconoce. El modelo determinado depende de la investigación de un conjunto … Continue reading «Enfoques basados ​​en clasificación en minería de datos»