Analicemos qué es el aprendizaje para una máquina como se muestra a continuación:
Se dice que una máquina está aprendiendo de Experiencias pasadas (alimentación de datos) con respecto a alguna clase de tareas si su Desempeño en una Tarea dada mejora con la Experiencia. Por ejemplo, suponga que una máquina tiene que predecir si un cliente comprará un producto específico, digamos “Antivirus”, este año o no. La máquina lo hará analizando los conocimientos previos/experiencias pasadas, es decir, los datos de los productos que el cliente ha comprado todos los años y si compra Antivirus todos los años, entonces hay una alta probabilidad de que el cliente compre un antivirus este año también. Así es como funciona el aprendizaje automático en el nivel conceptual básico.
El aprendizaje supervisado es cuando el modelo se entrena en un conjunto de datos etiquetado. Un conjunto de datos etiquetado es aquel que tiene parámetros de entrada y salida. En este tipo de aprendizaje, tanto el entrenamiento como la validación, los conjuntos de datos se etiquetan como se muestra en las siguientes figuras.
Las dos figuras anteriores han etiquetado el conjunto de datos de la siguiente manera:
- Figura A: es un conjunto de datos de una tienda de compras que es útil para predecir si un cliente comprará o no un producto en particular según su género, edad y salario.
Entrada: Género, Edad, Salario
Salida: Comprado, es decir, 0 o 1; 1 significa que sí, el cliente comprará y 0 significa que el cliente no lo comprará. - Figura B: es un conjunto de datos meteorológicos que sirve para predecir la velocidad del viento en función de diferentes parámetros.
Entrada: punto de rocío, temperatura, presión, humedad relativa, dirección del viento
Salida: velocidad del viento
Entrenamiento del sistema: mientras se entrena el modelo, los datos generalmente se dividen en una proporción de 80:20, es decir, 80 % como datos de entrenamiento y el resto como datos de prueba. En los datos de entrenamiento, alimentamos tanto la entrada como la salida para el 80 % de los datos. El modelo aprende solo de los datos de entrenamiento. Usamos diferentes algoritmos de aprendizaje automático (que discutiremos en detalle en los próximos artículos) para construir nuestro modelo. El aprendizaje significa que el modelo construirá alguna lógica propia.
Una vez que el modelo está listo, es bueno probarlo. En el momento de la prueba, la entrada se alimenta del 20% restante de datos que el modelo nunca antes había visto, el modelo predecirá algún valor y lo compararemos con la salida real y calcularemos la precisión.
Tipos de aprendizaje supervisado:
A. Clasificación: es una tarea de aprendizaje supervisado donde la salida tiene etiquetas definidas (valor discreto). Por ejemplo, en la Figura A anterior, Salida – Comprado tiene etiquetas definidas, es decir, 0 o 1; 1 significa que el cliente comprará y 0 significa que el cliente no comprará. El objetivo aquí es predecir valores discretos pertenecientes a una clase particular y evaluarlos sobre la base de la precisión.
Puede ser una clasificación binaria o multiclase. En la clasificación binaria , el modelo predice 0 o 1; sí o no, pero en el caso de clasificación multiclase , el modelo predice más de una clase. Ejemplo: Gmail clasifica los correos en más de una clase, como redes sociales, promociones, actualizaciones y foros.
B. Regresión: es una tarea de aprendizaje supervisado donde la salida tiene un valor continuo.
Por ejemplo, en la Figura B anterior, Salida: la velocidad del viento no tiene ningún valor discreto, sino que es continuo en un rango particular. El objetivo aquí es predecir un valor lo más cercano al valor de salida real que nuestro modelo pueda hacer y luego la evaluación se realiza calculando el valor de error. Cuanto menor sea el error, mayor será la precisión de nuestro modelo de regresión.
Ejemplo de algoritmos de aprendizaje supervisado:
- Regresión lineal
- Regresión logística
- Vecino más cercano
- Bayesiano ingenuo gaussiano
- Árboles de decisión
- Máquina de vectores de soporte (SVM)
- Bosque aleatorio
Publicación traducida automáticamente
Artículo escrito por Mohit Gupta_OMG 🙂 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA