Análisis de Relevancia de Atributos en Minería de Datos

Método de análisis de atributos:
ha habido numerosas investigaciones en IA , ideas, hipótesis de conjunto esponjosas y duras sobre la investigación de la pertinencia de la calidad. La idea general detrás del examen de Pertinencia característica es procesar algún indicador que se utiliza para evaluar la importancia de un rasgo con respecto a una clase o idea determinada. Tales medidas incorporan la recogida de datos, el índice de Gini, la incertidumbre y el coeficiente de conexión.

Discutamos uno por uno.

  1. Recopilación de datos:
    recopile información tanto para la clase objetivo como para la clase diferenciadora mediante el manejo de consultas. Para la correlación de clases, el cliente en la pregunta de extracción de información proporciona tanto la clase objetiva como la clase diferenciadora. Para la representación de clases, la clase objetiva es la clase a representar, aunque la clase diferenciadora es la disposición de información similar que no está en la clase objetiva.
  2. Análisis de relevancia preliminar utilizando AOI conservador (inducción orientada a atributos):
    este paso reconoce un conjunto de medidas y características sobre las que se aplicará la medida de importancia elegida. Dado que varios grados de medición pueden tener una Importancia drásticamente única con respecto a una clase dada, cada cualidad que caracteriza los niveles calculados de la medición debe recordarse para el examen de importancia en un nivel fundamental.
    (AOI) se puede utilizar para realizar una evaluación inicial de la importancia de los datos al eliminar o resumir características que tienen una gran cantidad de características inconfundibles (por ejemplo, nombre y número de teléfono). Es probable que tales características no se descubran útiles para la representación de ideas. La relación obtenida por tal aplicación de inducción de atributos se denomina relación candidata de la tarea minera.
  3. Eliminar los atributos irrelevantes y débiles utilizando la medida de análisis de relevancia seleccionada:
    evaluamos cada cualidad en la relación candidata utilizando la medida de análisis de importancia de relevancia. Este paso genera una conexión de trabajo de clase objetiva subyacente y comienza una conexión de trabajo de clase diferenciadora. Luego, los atributos se clasifican (es decir, se clasifican) de acuerdo con su relevancia calculada para la tarea de minería de datos.
  4. Genere la descripción del concepto usando AOI:
    realice AOI utilizando un arreglo menos conservador de límites de especulación característicos. En el caso de que la tarea minera inconfundible sea una representación de clase, aquí solo se incorpora la conexión de trabajo de clase objetivo subyacente. Si la tarea de minería expresiva es un examen de clase, se incorporan tanto la conexión de trabajo de clase objetiva subyacente como la conexión de trabajo de clase diferenciadora subyacente.

Componentes de la medida de relevancia:

  1. Ganancia de información (ID3)
  2. Relación de ganancia (C4.5)
  3. Índice Gini
  4. Estadísticas de la tabla de contingencia Chi^2
  5. Coeficiente de incertidumbre

Publicación traducida automáticamente

Artículo escrito por swatidubey y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *