Procesamiento de datos

En términos generales, » Minería » es el proceso de extracción de algún material valioso de la tierra, por ejemplo, minería de carbón, minería de diamantes, etc. En el contexto de la informática, la » Minería de datos» puede denominarse extracción de conocimiento a partir de datos, conocimiento extracción, análisis de datos/patrones, arqueología de datos y dragado de datos . Es básicamente el proceso que se lleva a cabo para la extracción de información útil de un cúmulo de datos o almacenes de datos. Uno puede ver que el término en sí mismo es un poco confuso. En el caso de la minería del carbón o del diamante, el resultado del proceso de extracción es el carbón o el diamante. Pero en el caso de la minería de datos, ¡el resultado del proceso de extracción no son datos! En cambio, los resultados de la minería de datos son los patrones y el conocimiento que obtenemos al final del proceso de extracción. En ese sentido, podemos pensar en la Minería de Datos como un paso en el proceso de Descubrimiento de Conocimiento o Extracción de Conocimiento.

Gregory Piatetsky-Shapiro acuñó el término «Descubrimiento de conocimiento en bases de datos» en 1989. Sin embargo, el término «minería de datos» se hizo más popular en las comunidades empresarial y de prensa. Actualmente, la minería de datos y el descubrimiento del conocimiento se usan indistintamente. 

Hoy en día, la minería de datos se utiliza en casi todos los lugares donde se almacena y procesa una gran cantidad de datos. Por ejemplo, los bancos suelen utilizar la «minería de datos» para encontrar a sus posibles clientes que también podrían estar interesados ​​en tarjetas de crédito, préstamos personales o seguros. Dado que los bancos tienen los detalles de las transacciones y los perfiles detallados de sus clientes, analizan todos estos datos e intentan encontrar patrones que les ayuden a predecir que determinados clientes podrían estar interesados ​​en préstamos personales, etc. 

Propósito principal de la minería de datos 

Procesamiento de datos

Básicamente, la minería de datos se ha integrado con muchas otras técnicas de otros dominios, como estadísticas, aprendizaje automático, reconocimiento de patrones, bases de datos y sistemas de almacenamiento de datos, recuperación de información, visualización, etc. para recopilar más información sobre los datos y ayudar a predecir patrones ocultos. , tendencias y comportamientos futuros y permite a las empresas tomar decisiones.

 Técnicamente, la minería de datos es el proceso computacional de analizar datos desde diferentes perspectivas, dimensiones, ángulos y categorizarlos/resumirlos en información significativa. 

La minería de datos se puede aplicar a cualquier tipo de datos, por ejemplo , almacenes de datos, bases de datos transaccionales, bases de datos relacionales, bases de datos multimedia, bases de datos espaciales, bases de datos de series temporales, World Wide Web. 
Minería de datos como proceso 
completo Todo el proceso de Minería de datos consta de tres fases principales: 

  1. Preprocesamiento de datos: se lleva a cabo la limpieza, integración, selección y transformación de datos
  2. Extracción de datos: ocurrencia de minería de datos exacta
  3. Evaluación y presentación de datos: análisis y presentación de resultados 

     

datamining

En futuros artículos, cubriremos los detalles de cada una de estas fases. 

Aplicaciones de Minería de Datos 

  1. Análisis financiero
  2. Análisis biológico
  3. Análisis Científico
  4. Detección de intrusos
  5. Detección de fraude
  6. Análisis de investigación

Ejemplos de la vida real de minería de datos 

Market Basket Analysis : Es una técnica que permite el estudio cuidadoso de las compras que realiza un cliente en un supermercado. El concepto se aplica básicamente para identificar los artículos que un cliente compra juntos. Digamos, si una persona compra pan, ¿cuáles son las posibilidades de que también compre mantequilla? Este análisis ayuda en la promoción de ofertas y acuerdos de las empresas. Lo mismo se hace con la ayuda de la minería de datos. 
 

Plegado de proteínas: es una técnica que estudia cuidadosamente las células biológicas y predice las interacciones y la funcionalidad de las proteínas dentro de las células biológicas. Las aplicaciones de esta investigación incluyen la determinación de causas y posibles curas para el Alzheimer, el Parkinson y el cáncer causado por el mal plegamiento de proteínas. 

Detección de fraude: hoy en día, en esta tierra de teléfonos celulares, podemos usar la minería de datos para analizar las actividades de los teléfonos celulares y comparar actividades sospechosas. Esto puede ayudarnos a detectar llamadas realizadas en teléfonos clonados. De manera similar, con las tarjetas de crédito, comparar compras con compras históricas puede detectar actividad con tarjetas robadas.

La minería de datos también tiene muchas aplicaciones exitosas, como inteligencia comercial, búsqueda en la web, bioinformática, informática de la salud, finanzas, bibliotecas digitales y gobiernos digitales. 

Este artículo es una contribución de Sheena Kohli . Si te gusta GeeksforGeeks y te gustaría contribuir, también puedes escribir un artículo usando write.geeksforgeeks.org o enviar tu artículo por correo a review-team@geeksforgeeks.org. Vea su artículo que aparece en la página principal de GeeksforGeeks y ayude a otros Geeks. 

Escriba comentarios si encuentra algo incorrecto o si desea compartir más información sobre el tema tratado anteriormente.
 

Publicación traducida automáticamente

Artículo escrito por GeeksforGeeks-1 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *