Los datos son un conjunto de hechos objetivos discretos sobre un evento o un proceso que tienen poca utilidad por sí mismos a menos que se conviertan en información. Hemos estado recopilando numerosos datos, desde simples medidas numéricas y documentos de texto hasta información más compleja, como datos espaciales, canales multimedia y documentos de hipertexto.
Hoy en día se están acumulando grandes cantidades de datos. Se dice que la cantidad de datos recopilados casi se duplica cada año. Para extraer datos o buscar conocimiento a partir de estos datos masivos, se utilizan técnicas de minería de datos. La minería de datos se utiliza en casi todos los lugares donde se almacena y procesa una gran cantidad de datos. Por ejemplo, los bancos suelen utilizar la «minería de datos» para encontrar a sus posibles clientes que también podrían estar interesados en tarjetas de crédito, préstamos personales o seguros. Dado que los bancos tienen los detalles de las transacciones y los perfiles detallados de sus clientes, analizan todos estos datos e intentan encontrar patrones que les ayuden a predecir que determinados clientes podrían estar interesados en préstamos personales, etc.
Básicamente, el motivo detrás de la minería de datos, ya sea comercial o científica, es el mismo: la necesidad de encontrar información útil en los datos para permitir una mejor toma de decisiones o una mejor comprensión del mundo que nos rodea.
“La extracción de información interesante o patrones de datos en grandes bases de datos se conoce como minería de datos”.
Según William J. Frawley, «La minería de datos o KDD (Descubrimiento de conocimientos en bases de datos), como también se le conoce, es la extracción no trivial de información implícita, previamente desconocida y potencialmente útil de los datos».
Técnicamente, la minería de datos es el proceso computacional de analizar datos desde diferentes perspectivas, dimensiones, ángulos y categorizarlos/resumirlos en información significativa. La minería de datos se puede aplicar a cualquier tipo de datos, por ejemplo, almacenes de datos, bases de datos transaccionales, bases de datos relacionales, bases de datos multimedia, bases de datos espaciales, bases de datos de series temporales, World Wide Web.
La minería de datos proporciona ventajas competitivas en la economía del conocimiento. Lo hace proporcionando el máximo conocimiento necesario para tomar rápidamente decisiones comerciales valiosas a pesar de la enorme cantidad de datos disponibles.
Hay muchos beneficios medibles que se han logrado en diferentes áreas de aplicación de la minería de datos. Entonces, analicemos las diferentes aplicaciones de la minería de datos:
Análisis científico: las simulaciones científicas generan grandes cantidades de datos todos los días. Esto incluye datos recopilados de laboratorios nucleares, datos sobre psicología humana, etc. Las técnicas de minería de datos son capaces de analizar estos datos. Ahora podemos capturar y almacenar más datos nuevos más rápido de lo que podemos analizar los datos antiguos ya acumulados. Ejemplo de análisis científico:
- Análisis de secuencias en bioinformática
- Clasificación de los objetos astronómicos
- Apoyo a la decisión médica.
Detección de intrusión: una intrusión en la red se refiere a cualquier actividad no autorizada en una red digital. Las intrusiones en la red a menudo implican el robo de valiosos recursos de la red. La técnica de minería de datos juega un papel vital en la búsqueda de detección de intrusos, ataques a la red y anomalías. Estas técnicas ayudan a seleccionar y refinar información útil y relevante de grandes conjuntos de datos. La técnica de minería de datos ayuda a clasificar los datos relevantes para el sistema de detección de intrusos. El sistema de detección de intrusos genera alarmas para el tráfico de la red sobre las invasiones extranjeras en el sistema. Por ejemplo:
- Detectar violaciones de seguridad
- Detección de uso indebido
- Detección de anomalías
Transacciones comerciales : cada industria comercial se memoriza a perpetuidad. Tales transacciones suelen estar relacionadas con el tiempo y pueden ser acuerdos entre empresas u operaciones intraempresariales. El uso efectivo y oportuno de los datos en un marco de tiempo razonable para la toma de decisiones competitivas es definitivamente el problema más importante a resolver para las empresas que luchan por sobrevivir en un mundo altamente competitivo. La minería de datos ayuda a analizar estas transacciones comerciales e identificar enfoques de marketing y toma de decisiones. Ejemplo :
- Segmentación por correo directo
- El comercio de acciones
- Segmentación de clientes
- Predicción de abandono (la predicción de abandono es uno de los casos de uso de Big Data más populares en los negocios)
Análisis de la cesta de la compra: El análisis de la cesta de la compra es una técnica que permite el estudio cuidadoso de las compras que realiza un cliente en un supermercado. Este concepto identifica el patrón de compra frecuente de artículos por parte de los clientes. Este análisis puede ayudar a promover tratos, ofertas, ventas por parte de las empresas y las técnicas de minería de datos ayudan a lograr esta tarea de análisis. Ejemplo:
- Los conceptos de minería de datos se utilizan en Ventas y marketing para brindar un mejor servicio al cliente, mejorar las oportunidades de venta cruzada y aumentar las tasas de respuesta de correo directo.
- La retención de clientes en forma de identificación de patrones y predicción de posibles deserciones es posible mediante la minería de datos.
- El área de Evaluación de Riesgos y Fraude también utiliza el concepto de minería de datos para identificar comportamientos inapropiados o inusuales, etc.
Educación: para analizar el sector de la educación, la minería de datos utiliza el método de minería de datos educativos (EDM). Este método genera patrones que pueden ser utilizados tanto por estudiantes como por educadores. Mediante el uso de minería de datos EDM podemos realizar algunas tareas educativas:
- Predicción de la admisión de estudiantes en la educación superior
- Predicción de perfiles de estudiantes
- Predecir el rendimiento de los estudiantes
- Docentes enseñando desempeño
- Desarrollo curricular
- Predecir las oportunidades de ubicación de los estudiantes
Investigación : una técnica de minería de datos puede realizar predicciones, clasificación , agrupamiento, asociaciones y agrupación de datos con perfección en el área de investigación. Las reglas generadas por la minería de datos son únicas para encontrar resultados. En la mayor parte de la investigación técnica en minería de datos, creamos un modelo de entrenamiento y un modelo de prueba. El modelo de entrenamiento/prueba es una estrategia para medir la precisión del modelo propuesto. Se llama Entrenamiento/Prueba porque dividimos el conjunto de datos en dos conjuntos: un conjunto de datos de entrenamiento y un conjunto de datos de prueba. Un conjunto de datos de entrenamiento que se usa para diseñar el modelo de entrenamiento, mientras que el conjunto de datos de prueba se usa en el modelo de prueba. Ejemplo:
- Clasificación de los datos inciertos.
- Agrupamiento basado en información.
- Sistema de soporte de decisiones
- Minería web
- Minería de datos basada en dominios
- IoT (Internet de las Cosas) y Ciberseguridad
- Agricultura inteligente IoT (Internet de las cosas)
Atención médica y seguros : un sector farmacéutico puede examinar su actividad de fuerza de nuevos acuerdos y sus resultados para mejorar el enfoque de médicos de alto valor y determinar qué actividades de promoción tendrán el mejor efecto en los próximos meses, mientras que el sector de seguros, minería de datos puede ayudar a predecir qué clientes comprarán nuevas pólizas, identificar patrones de comportamiento de clientes riesgosos e identificar el comportamiento fraudulento de los clientes.
- Análisis de reclamaciones, es decir, qué procedimientos médicos se reclaman juntos.
- Identificar terapias médicas exitosas para diferentes enfermedades.
- Caracteriza el comportamiento del paciente para predecir las visitas al consultorio.
Transporte: una empresa de transporte diversificada con una gran fuerza de ventas directas puede aplicar la minería de datos para identificar las mejores perspectivas para sus servicios. Una gran organización de productos de consumo puede aplicar la minería de información para mejorar su ciclo comercial para los minoristas.
- Determinar los horarios de distribución entre puntos de venta.
- Analizar patrones de carga.
Sector financiero/bancario: una compañía de tarjetas de crédito puede aprovechar su vasto almacén de datos de transacciones de clientes para identificar a los clientes que probablemente estén interesados en un nuevo producto de crédito.
- Detección de fraude con tarjetas de crédito.
- Identificar clientes ‘leales’.
- Extracción de información relacionada con los clientes.
- Determinar el gasto de la tarjeta de crédito por grupos de clientes.
Publicación traducida automáticamente
Artículo escrito por varshachoudhary y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA