Enfoques basados ​​en agrupamiento para la detección de valores atípicos en la minería de datos

El análisis de agrupamiento es el proceso de dividir un conjunto de objetos de datos en subconjuntos. Cada subconjunto es un grupo tal que los objetos son similares entre sí. El conjunto de conglomerados obtenidos del análisis de conglomerados se puede denominar conglomerados. Por ejemplo: Segregar clientes en un mercado Retail como cliente frecuente, cliente … Continue reading «Enfoques basados ​​en agrupamiento para la detección de valores atípicos en la minería de datos»

Optimización univariante: ciencia de datos

Wikipedia define la optimización como un problema en el que maximizas o minimizas una función real eligiendo sistemáticamente valores de entrada de un conjunto permitido y calculando el valor de la función. Eso significa que cuando hablamos de optimización siempre estamos interesados ​​en encontrar la mejor solución. Entonces, digamos que uno tiene alguna forma funcional … Continue reading «Optimización univariante: ciencia de datos»

Diferencia entre contenido web, estructura web y minería de uso web

La minería web es una aplicación de la técnica de minería de datos que se utiliza para encontrar patrones de información a partir de los datos web. Web Mining ayuda a mejorar el poder de los motores de búsqueda web al identificar las páginas web y clasificar los documentos web. Tipos de minería web: 1. … Continue reading «Diferencia entre contenido web, estructura web y minería de uso web»

Arquitectura multinivel de Data Warehouse

Un almacén de datos se puede representar mediante la integración de datos de múltiples fuentes heterogéneas. Fue definido por Bill Inmon en 1990. El almacén de datos es una recopilación de datos integrada, orientada a temas, variable en el tiempo y no volátil. Un almacén de datos está estructurado por la integración de datos de … Continue reading «Arquitectura multinivel de Data Warehouse»

Selección de subconjuntos de atributos en minería de datos

La selección de subconjuntos de atributos es una técnica que se utiliza para la reducción de datos en el proceso de minería de datos. La reducción de datos reduce el tamaño de los datos para que se puedan utilizar con fines de análisis de manera más eficiente. Necesidad de selección de subconjuntos de atributos : … Continue reading «Selección de subconjuntos de atributos en minería de datos»

Agregación en minería de datos

La agregación en la minería de datos es el proceso de encontrar, recopilar y presentar los datos en un formato resumido para realizar análisis estadísticos de esquemas comerciales o análisis de patrones humanos. Cuando se recopilan numerosos datos de varios conjuntos de datos, es crucial recopilar datos precisos para proporcionar resultados significativos. La agregación de … Continue reading «Agregación en minería de datos»

Aprendizaje activo en minería de datos

El aprendizaje activo es un tipo iterativo de aprendizaje supervisado y este método de aprendizaje generalmente se prefiere si los datos están altamente disponibles, pero las etiquetas de clase son escasas o costosas de obtener. El algoritmo de aprendizaje consulta las etiquetas. El número de tuplas que utilizan el aprendizaje activo para aprender el concepto … Continue reading «Aprendizaje activo en minería de datos»

¿Cómo se pueden usar las redes neuronales para la minería de datos?

Como todos somos conscientes de que la tecnología crece día a día y se produce una gran cantidad de datos cada segundo, el análisis de los datos va a ser muy importante porque nos ayuda a detectar fraudes, identificar correos electrónicos no deseados, etc. Entonces, Data Mining surge para ayudarnos a encontrar patrones ocultos, descubrir … Continue reading «¿Cómo se pueden usar las redes neuronales para la minería de datos?»

Ventajas y desventajas de ANN en minería de datos

Las redes neuronales son una serie de algoritmos que actúan como un cerebro humano para reconocer patrones y entre grandes cantidades de datos. Una red neuronal artificial (ANN), también denominada simplemente «Red neuronal» (NN), podría ser un modelo de proceso respaldado por redes neuronales biológicas. Consiste en una colección interconectada de neuronas artificiales. Una red … Continue reading «Ventajas y desventajas de ANN en minería de datos»

Las 15 herramientas de almacenamiento de datos más populares

Un almacén de datos es un sistema de gestión de datos que se utiliza para almacenar, informar y analizar datos. Es el componente principal de la inteligencia empresarial y también se conoce como almacén de datos empresarial. Los almacenes de datos son repositorios centrales que almacenan datos de una o más fuentes heterogéneas. Los almacenes … Continue reading «Las 15 herramientas de almacenamiento de datos más populares»