La minería de datos es el proceso de analizar un gran tamaño de información para descubrir los patrones, las tendencias. Se puede utilizar para que las empresas conozcan las opciones de los clientes, establezcan una buena relación con los clientes, aumenten los ingresos y reduzcan los riesgos. La minería de datos se basa en algoritmos complejos que permiten la segmentación de datos para descubrir numerosas tendencias y patrones, detectar desviaciones y estimar la probabilidad de que ocurran ciertas ocurrencias. Los datos sin procesar pueden estar en formatos tanto analógicos como digitales, y dependen esencialmente de la fuente de los datos. Las empresas deben mantenerse al día con las últimas tendencias de minería de datos y mantenerse al día para tener éxito en la industria y vencer a la competencia.
Tipos de secuencias de minería en minería de datos:
- Serie temporal de minería
- Secuencia simbólica minera
- Secuencia biológica minera
1. Series temporales de minería
Se registra un número específico de puntos de datos en un momento específico o se obtienen eventos a través de mediciones repetidas de tiempo en una serie de tiempo de minería. Los valores o datos generalmente se miden en intervalos de tiempo iguales, como por hora, semanalmente, diariamente. En los datos de series de tiempo también se registran intervalos regulares o los componentes característicos de las series de tiempo son de tendencia, estacionales, cíclicos, irregulares.
Aplicación de Series Temporales:
- Financiero: análisis bursátil
- Industria: Consumo de energía
- Científico: resultado del experimento
- Meteorológico: Precipitación
Métodos de análisis de series temporales:
- Análisis de Tendencias: Categorías de movimientos de Series Temporales:
- Movimientos de largo plazo o de tendencia: Dirección general en la que se mueve una serie de tiempo durante un largo intervalo de tiempo.
- Movimientos Cíclicos: Oscilación a largo plazo sobre una línea o curva de tendencia.
- Movimientos estacionales: una serie temporal parece seguir patrones sustancialmente idénticos durante los meses correspondientes de los años siguientes.
- Movimientos Irregulares o Aleatorios: Cambios que ocurren al azar debido a eventos no planificados.
- Búsqueda de similitud:
- Reducción de datos
- Métodos de indexación
- Métodos de búsqueda de similitud
- Idiomas de consulta
2. Secuencia Simbólica Minera
Una secuencia simbólica se compone de una lista ordenada de elementos que pueden registrarse con o sin sentido del tiempo. Esta secuencia se puede utilizar de diversas formas, incluidas las secuencias de compras de los consumidores, los flujos de clics web, las secuencias de ejecución de software, las secuencias biológicas, etc.
La minería de patrones secuenciales implica identificar las subsecuencias que aparecen con frecuencia en una o más secuencias. Como resultado de una importante investigación en esta área, se han desarrollado una serie de algoritmos escalables. Alternativamente, solo podemos extraer el conjunto de patrones secuenciales cerrados, donde un patrón secuencial s es cerrado si es una subsecuencia correcta de s’ y s’ tiene el mismo soporte que s.
Por ejemplo:
si donde a, b, c, d y e son elementos, entonces S es una subsecuencia de S’.
3. Secuencia Biológica Minera
Las secuencias biológicas están formadas por secuencias de nucleótidos o de aminoácidos. En bioinformática y biología moderna, el análisis de secuencias biológicas compara, alinea, indexa y analiza secuencias biológicas. El análisis de secuencias biológicas juega un papel crucial en la bioinformática y la biología moderna. Dicho análisis se puede dividir en dos tareas: alineación de secuencias por pares y alineación de secuencias múltiples.
Métodos de secuencia biológica:
- Alineación de Secuencias Biológicas:
- Alineación por pares
- El algoritmo de alineación local BLAST
- Métodos de alineación de secuencias múltiples
- Análisis de secuencias biológicas utilizando un modelo oculto de Markov:
- String de Markov
- Modelo oculto de Markov
- Algoritmo de reenvío
- Algoritmo de Viterbi
- Algoritmo de Baum-Welch
Aplicación de Minería de Datos:
- Análisis de Información Financiera:
- Predicción de pagos de préstamos/análisis de políticas de crédito al consumo
- Diseño y construcción de almacén de información.
- La información financiera recopilada en las unidades de área de bancos y establecimientos monetarios suele ser comparativamente completa, confiable y de alta calidad.
- Industria minorista:
- Análisis multidimensional (ventas, clientes, productos, tiempo, etc.)
- Análisis de campaña de ventas.
- Retención de clientes
- Recomendación de producto
- Uso de herramientas de visualización para el análisis de datos
- Ciencia e Ingenieria:
- Procesamiento de datos y almacén de datos
- Minería de tipos de datos complejos
- Minería basada en red
- Minería basada en gráficos
Tendencias de la minería de datos:
- Exploración de aplicaciones: abordar problemas específicos de la aplicación
- Enfoques de minería de datos escalables e interactivos
- Integración de minería de datos con motores de búsqueda web, sistemas de bases de datos, sistemas de almacenamiento de datos y sistemas de computación en la nube
- Minería de redes sociales y de información
- Minería espaciotemporal, objetos en movimiento y sistemas ciberfísicos
- Minería de datos multimedia, de texto y web
- Minería de datos biológicos y biomédicos
- Minería de datos visuales y de audio
- Minería de datos distribuida y minería de flujo de datos en tiempo real.
Publicación traducida automáticamente
Artículo escrito por sifa199910 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA