Tareas y Funcionalidades de Minería de Datos

Las funciones de minería de datos se utilizan para definir las tendencias o correlaciones contenidas en las actividades de minería de datos.

En comparación, las actividades de minería de datos se pueden dividir en 2 categorías:

  1. Minería de datos descriptiva:
    incluye ciertos conocimientos para comprender lo que está sucediendo dentro de los datos sin una idea previa. Las características comunes de los datos se resaltan en el conjunto de datos.
    Por ejemplo: recuento, promedio, etc.
  2. Minería de datos predictiva:
    ayuda a los desarrolladores a proporcionar definiciones de atributos sin etiquetar. Basado en pruebas anteriores, el software estima las características que están ausentes.
    Por ejemplo: a juzgar por los resultados de los exámenes médicos de un paciente, si padece alguna enfermedad en particular.

Funcionalidad de minería de datos:

1. Descripciones de clases/conceptos:
las clases o definiciones se pueden correlacionar con los resultados. De manera simplificada, descriptiva y, sin embargo, precisa, puede ser útil definir grupos y conceptos individuales.
Estas definiciones de clase o concepto se conocen como descripciones de clase/concepto.

  • Caracterización de datos:
    Se refiere al resumen de las características generales o rasgos de la clase que está bajo estudio. Por ejemplo. Para estudiar las características de un producto de software cuyas ventas aumentaron un 15% hace dos años, cualquiera puede recopilar este tipo de datos relacionados con dichos productos ejecutando consultas SQL.
  • Discriminación de datos:
    Compara las características comunes de la clase que se está estudiando. El resultado de este proceso se puede representar de muchas formas. Por ejemplo, gráficos de barras, curvas y gráficos circulares.

2. Extracción de patrones, asociaciones y correlaciones frecuentes:
los patrones frecuentes no son más que las cosas que se encuentran más comunes en los datos.

Hay diferentes tipos de frecuencia que se pueden observar en el conjunto de datos.

  • Conjunto de artículos frecuentes:
    esto se aplica a una serie de artículos que se pueden ver juntos regularmente, por ejemplo: leche y azúcar.
  • Subsecuencia frecuente:
    Esto se refiere a la serie de patrones que a menudo ocurre regularmente, como comprar un teléfono seguido de una cubierta posterior.
  • Subestructura frecuente:
    se refiere a los diferentes tipos de estructuras de datos, como árboles y gráficos, que se pueden combinar con el conjunto de elementos o la subsecuencia.

Análisis de asociación:
el proceso implica descubrir la relación entre los datos y decidir las reglas de la asociación. Es una forma de descubrir la relación entre varios elementos. por ejemplo, se puede usar para determinar las ventas de artículos que se compran juntos con frecuencia.

Análisis de correlación:
la correlación es una técnica matemática que puede mostrar si los pares de atributos están relacionados entre sí y con qué fuerza. Por ejemplo, las personas Highted tienden a tener más peso.

Publicación traducida automáticamente

Artículo escrito por pcp21599 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *