Transferencia de aprendizaje en minería de datos

El aprendizaje por transferencia es la forma en que los humanos aplican su conocimiento en una tarea para aprender otra tarea. El aprendizaje de transferencia obtiene el conocimiento de una o más tareas que se aprobaron con éxito y aplica este conocimiento para resolver el nuevo problema. En Transfer learning, las distribuciones y los dominios de datos utilizados para el entrenamiento y las pruebas pueden ser diferentes. El aprendizaje por transferencia admite dos tipos de aprendizaje:

  • Transferencia Positiva: Cuando el aprendizaje en una situación facilita el aprendizaje en otra situación se conoce como Transferencia Positiva. 
  • Transferencia negativa: cuando el aprendizaje de una tarea dificulta el aprendizaje de otra tarea, se conoce como transferencia negativa. 

Ventajas del aprendizaje por transferencia:

  • El aprendizaje por transferencia tiene una amplia área de investigación en aplicaciones más grandes, como el análisis de redes sociales y la clasificación de redes. 
  • El aprendizaje por transferencia ahorra costos y tiempo y nos permite desarrollar muchas aplicaciones similares relacionadas con ciertos conceptos. Por ejemplo, si sabemos tocar la flauta, podemos aplicar este conocimiento de anotar las pistas de música para aprender a tocar el piano.  
  • Transferir el aprendizaje es útil en escenarios donde los datos se vuelven obsoletos durante un período de tiempo particular o cuando los datos cambian dinámicamente. Por ejemplo, donde se aplica el aprendizaje por transferencia, es la clasificación de documentos web, donde es posible que hayamos entrenado el modelo con datos categóricos de diferentes grupos de noticias. Si usamos los datos web en los sitios web para entrenar, el clasificador puede quedar obsoleto fácilmente porque los datos de los temas se pueden cambiar en los sitios web con frecuencia. 
  • El filtrado de spam de correo electrónico es otra aplicación para el aprendizaje de transferencia. Podríamos filtrar los correos electrónicos de los usuarios como spam o ham entrenando el modelo con algoritmos de clasificación. Si aparecen nuevos correos electrónicos y esos correos electrónicos pueden ser diferentes de los correos electrónicos entrenados originalmente, por lo tanto, debemos adaptar el modelo aprendido para poder clasificar los nuevos correos electrónicos en diferentes categorías.
  •  La transferencia de conocimientos a través del aprendizaje por transferencia reduciría la necesidad de anotar grandes cantidades de datos. Esta es la principal ventaja del aprendizaje por transferencia.
  • Por lo tanto, el aprendizaje por transferencia ahorra tiempo y reduce el esfuerzo de reconstruir los diseños y modelos desde cero. 
Traditional Learning Vs Transfer Learning

 

 

Enfoques del Aprendizaje por Transferencia:

Existen diferentes enfoques para inculcar el aprendizaje por transferencia en la minería de datos. El enfoque más común es el algoritmo TrAdaBoost (Transfer AdaBoost) y este es un enfoque de aprendizaje de transferencia basado en instancias. En este enfoque, algunos de los datos entrenados se pueden ajustar y volver a ponderar los datos de las etiquetas de clase y usarlos para aprender la tarea objetivo. Considere el ejemplo discutido anteriormente de clasificación de documentos web, donde la distribución del clasificador entrenado de datos antiguos es diferente de los datos de destino. TrAdaBoost asume que tanto los datos de entrenamiento como los datos de prueba (datos de dominio de destino) tienen el mismo conjunto de dominios de atributos y también tienen el mismo conjunto de etiquetas de clase. Pero se vuelve difícil si la distribución del tren y los datos de prueba son de diferentes dominios. TrAdaBoost también configura las propiedades del método de conjunto AdaBoost. Los datos de origen antiguos o los datos de entrenamiento pueden ser más útiles ya que TrAdaBoost asume que la mayor parte puede ser útil para entrenar el otro modelo de clasificación nuevo. Podemos hacerlo filtrando los datos antiguos que son diferentes de los nuevos y debemos ajustar los pesos asignados a las tuplas de entrenamiento.

El aprendizaje por transferencia se convierte en una transferencia positiva si el modelo para el nuevo problema se construye con éxito a partir de los patrones de conocimiento base. La transferencia negativa ocurre si el modelo de diseño recién entrenado es hasta ahora independiente en comparación con el modelo base y heterogéneo con respecto a los datos de destino. La transferencia negativa ocurre si los datos de entrenamiento no se procesan previamente o si las características del modelo base no son adecuadas para los atributos de datos particulares.

Desafíos del Aprendizaje por Transferencia:

  • Uno de los desafíos para el aprendizaje por transferencia es la transferencia negativa. Esto hace que el aprendizaje de los modelos sea ineficiente. Por lo tanto, es necesario evitar la transferencia negativa.
  • Si los datos no se procesan previamente, el aprendizaje de Transferencia puede proporcionar modelos irrelevantes.  

Publicación traducida automáticamente

Artículo escrito por hasani y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *