Aprendizaje supervisado
El aprendizaje supervisado, como su nombre lo indica, cuenta con la presencia de un supervisor como docente. Básicamente, el aprendizaje supervisado es cuando enseñamos o entrenamos a la máquina usando datos que están bien etiquetados. Lo que significa que algunos datos ya están etiquetados con la respuesta correcta. Después de eso, la máquina recibe un nuevo conjunto de ejemplos (datos) para que el algoritmo de aprendizaje supervisado analice los datos de entrenamiento (conjunto de ejemplos de entrenamiento) y produzca un resultado correcto a partir de los datos etiquetados.
Por ejemplo , suponga que le dan una canasta llena de diferentes tipos de frutas. Ahora el primer paso es entrenar la máquina con todas las diferentes frutas una por una así:
- Si la forma del objeto es redondeada y tiene una depresión en la parte superior, es de color rojo, entonces se etiquetará como Apple .
- Si la forma del objeto es un cilindro largo y curvo de color verde-amarillo, entonces se etiquetará como – Plátano .
Ahora suponga que después de entrenar los datos, le ha dado una nueva fruta separada, digamos Plátano de la canasta, y le ha pedido que la identifique.
Dado que la máquina ya ha aprendido las cosas de los datos anteriores y esta vez tiene que usarla sabiamente. Primero clasificará la fruta con su forma y color y confirmará el nombre de la fruta como BANANA y la colocará en la categoría Banana. Por lo tanto, la máquina aprende las cosas a partir de los datos de entrenamiento (canasta que contiene frutas) y luego aplica el conocimiento a los datos de prueba (nueva fruta).
El aprendizaje supervisado se clasifica en dos categorías de algoritmos:
- Clasificación : un problema de clasificación es cuando la variable de salida es una categoría, como «Rojo» o «azul», «enfermedad» o «sin enfermedad».
- Regresión : un problema de regresión es cuando la variable de salida es un valor real, como «dólares» o «peso».
El aprendizaje supervisado trata o aprende con datos «etiquetados». Esto implica que algunos datos ya están etiquetados con la respuesta correcta.
Tipos:-
- Regresión
- Regresión logística
- Clasificación
- Clasificadores Naive Bayes
- K-NN (k vecinos más cercanos)
- Árboles de decisión
- Máquinas de vectores soporte
ventajas:-
- El aprendizaje supervisado permite recopilar datos y produce resultados de datos de experiencias previas.
- Ayuda a optimizar los criterios de rendimiento con la ayuda de la experiencia.
- El aprendizaje automático supervisado ayuda a resolver varios tipos de problemas de computación del mundo real.
Desventajas: –
- La clasificación de big data puede ser un desafío.
- La formación para el aprendizaje supervisado necesita mucho tiempo de cálculo. Por lo tanto, requiere mucho tiempo.
Aprendizaje sin supervisión
El aprendizaje no supervisado es el entrenamiento de una máquina que utiliza información que no está clasificada ni etiquetada y permite que el algoritmo actúe sobre esa información sin guía. En este caso, la tarea de la máquina es agrupar información desordenada según similitudes, patrones y diferencias sin ningún entrenamiento previo de datos.
A diferencia del aprendizaje supervisado, no se proporciona ningún maestro, lo que significa que no se dará capacitación a la máquina. Por lo tanto, la máquina está restringida para encontrar la estructura oculta en datos sin etiquetar por sí misma.
Por ejemplo , supongamos que se le da una imagen que tiene perros y gatos que nunca ha visto.
Por lo tanto, la máquina no tiene idea de las características de los perros y los gatos, por lo que no podemos categorizarla como ‘perros y gatos’. Pero puede clasificarlos según sus similitudes, patrones y diferencias, es decir, podemos clasificar fácilmente la imagen de arriba en dos partes. La primera puede contener todas las fotos que tengan perros y la segunda parte puede contener todas las fotos que tengan gatos . Aquí no aprendiste nada antes, lo que significa que no hay datos de entrenamiento ni ejemplos.
Permite que el modelo funcione por sí solo para descubrir patrones e información que antes no se detectaba. Se trata principalmente de datos no etiquetados.
El aprendizaje no supervisado se clasifica en dos categorías de algoritmos:
- Agrupamiento : un problema de agrupamiento es donde desea descubrir los agrupamientos inherentes en los datos, como agrupar clientes por comportamiento de compra.
- Asociación : un problema de aprendizaje de reglas de asociación es donde desea descubrir reglas que describan grandes porciones de sus datos, como que las personas que compran X también tienden a comprar Y.
Tipos de aprendizaje no supervisado: –
Agrupación
- Exclusivo (particionamiento)
- aglomerativo
- superposición
- probabilístico
Tipos de agrupamiento: –
- Agrupación jerárquica
- Agrupamiento de K-medias
- Análisis de componentes principales
- Valor singular de descomposición
- Análisis de componentes independientes
Aprendizaje automático supervisado y no supervisado
Parámetros | Aprendizaje automático supervisado | Aprendizaje automático no supervisado |
Datos de entrada | Los algoritmos se entrenan utilizando datos etiquetados. | Los algoritmos se utilizan contra datos que no están etiquetados. |
Complejidad computacional | Método más simple | Computacionalmente complejo |
Precisión | Alta precisión | Menos precisa |
Nº de clases | No. de clases es conocido | No se conoce el número de clases |
Análisis de los datos | Utiliza análisis fuera de línea | Utiliza análisis de datos en tiempo real |
Algoritmos utilizados |
Regresión lineal y logística, bosque aleatorio, Máquina de vectores de soporte, red neuronal, etc. |
Agrupamiento de K-Means, agrupamiento jerárquico, Algoritmo a priori, etc. |
Este artículo es una contribución de Shubham Bansal . Si te gusta GeeksforGeeks y te gustaría contribuir, también puedes escribir un artículo usando write.geeksforgeeks.org o enviar tu artículo por correo a contribuir@geeksforgeeksorg. Vea su artículo que aparece en la página principal de GeeksforGeeks y ayude a otros Geeks.
Publicación traducida automáticamente
Artículo escrito por GeeksforGeeks-1 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA