Arthur Samuel , un pionero en el campo de la inteligencia artificial y los juegos de computadora, acuñó el término “Aprendizaje automático” . Él definió el aprendizaje automático como: un «campo de estudio que le da a las computadoras la capacidad de aprender sin ser programadas explícitamente» . De una manera muy sencilla, Machine Learning (ML) puede explicarse como la automatización y mejora del proceso de aprendizaje de las computadoras en función de sus experiencias sin ser realmente programado, es decir, sin ninguna ayuda humana. El proceso comienza con la alimentación de datos de buena calidad y luego entrenando nuestras máquinas (computadoras) mediante la construcción de modelos de aprendizaje automático utilizando los datos y diferentes algoritmos. La elección de los algoritmos depende de qué tipo de datos tenemos y qué tipo de tarea estamos tratando de automatizar. Ejemplo: Formación de los alumnos durante los exámenes.Mientras se preparan para los exámenes, los estudiantes en realidad no abarrotan el tema, sino que intentan aprenderlo con una comprensión completa. Antes del examen, alimentan su máquina (cerebro) con una buena cantidad de datos de alta calidad (preguntas y respuestas de diferentes libros o notas del profesor, o conferencias en video en línea). En realidad, están entrenando su cerebro con entradas y salidas, es decir, qué tipo de enfoque o lógica tienen para resolver diferentes tipos de preguntas. Cada vez que resuelven los exámenes de práctica y encuentran el rendimiento (precisión/puntuación) comparando las respuestas con la clave de respuestas proporcionada. Gradualmente, el rendimiento sigue aumentando, ganando más confianza con el enfoque adoptado. Así es como en realidad se construyen los modelos, entrenar la máquina con datos (tanto las entradas como las salidas se le dan al modelo), y cuando llegue el momento, pruebe los datos (solo con entrada) y obtenga las puntuaciones de nuestro modelo comparando su respuesta con la salida real que no se ha alimentado durante el entrenamiento. Los investigadores están trabajando con asiduidad para mejorar los algoritmos y las técnicas para que estos modelos funcionen mucho mejor. ¿Diferencia básica en ML y programación tradicional?
- Programación tradicional: Alimentamos DATOS (Entrada) + PROGRAMA (lógica), lo ejecutamos en la máquina y obtenemos la salida.
- Aprendizaje automático: Alimentamos DATOS (Entrada) + Salida, lo ejecutamos en la máquina durante el entrenamiento y la máquina crea su propio programa (lógica), que puede evaluarse durante la prueba.
¿Qué significa exactamente aprender para una computadora? Se dice que una computadora está aprendiendo de Experiencias con respecto a alguna clase de Tareas si su desempeño en una tarea dada mejora con la Experiencia.
Se dice que un programa de computadora aprende de la experiencia E con respecto a alguna clase de tareas T y la medida de desempeño P , si su desempeño en las tareas en T , medido por P , mejora con la experiencia E Ejemplo: jugar a las damas. E = la experiencia de jugar muchos juegos de damas T = la tarea de jugar damas. P = la probabilidad de que el programa gane el próximo juego En general, cualquier problema de aprendizaje automático se puede asignar a una de dos clasificaciones amplias: aprendizaje supervisado y aprendizaje no supervisado. Cómo funcionan las cosas en la realidad :-
- Hablando de compras en línea, hay millones de usuarios con una gama ilimitada de intereses con respecto a marcas, colores, rango de precios y muchos más. Mientras compran en línea, los compradores tienden a buscar una serie de productos. Ahora, buscar un producto con frecuencia hará que el Facebook, las páginas web, los motores de búsqueda o las tiendas en línea de los compradores comiencen a recomendar o mostrar ofertas sobre ese producto en particular. No hay nadie sentado allí para codificar tal tarea para todos y cada uno de los usuarios, toda esta tarea es completamente automática. Aquí, ML juega su papel. Los investigadores, científicos de datos y aprendices automáticos construyen modelos en la máquina utilizando buena calidad y una gran cantidad de datos y ahora su máquina funciona automáticamente e incluso mejora con más y más experiencia y tiempo. Tradicionalmente, el anuncio solo se hacía utilizando periódicos,Publicidad dirigida (sistema de anuncios en línea), que es un método mucho más eficiente para dirigirse a la audiencia más receptiva.
- Incluso en el cuidado de la salud, ML está haciendo un trabajo fabuloso. Investigadores y científicos han preparado modelos para entrenar máquinas para detectar cáncer simplemente mirando imágenes de celdas de diapositivas. Para los humanos realizar esta tarea habría tomado mucho tiempo. Pero ahora, no más demoras, las máquinas predicen las posibilidades de tener o no tener cáncer con cierta precisión y los médicos solo tienen que dar una llamada de seguridad, eso es todo. La respuesta a cómo es esto posible es muy simple: todo lo que se requiere es una máquina de alto cálculo, una gran cantidad de datos de imagen de buena calidad, un modelo ML con buenos algoritmos para lograr resultados de última generación. Los médicos están utilizando ML incluso para diagnosticar pacientes en función de diferentes parámetros bajo consideración.
- Es posible que todos tengan que usar las clasificaciones de IMDB , Google Photos , donde reconoce caras, Google Lens , donde el modelo de reconocimiento de texto de imagen ML puede extraer texto de las imágenes que ingresa, y Gmail , que clasifica el correo electrónico como social, promoción, actualizaciones, o foros que usan clasificación de texto, que es parte de ML.
¿Cómo funciona ML?
- Recopilación de datos anteriores en cualquier forma adecuada para su procesamiento. Cuanto mejor sea la calidad de los datos, más adecuados serán para el modelado
- Procesamiento de datos: a veces, los datos recopilados están sin procesar y deben procesarse previamente. Ejemplo: algunas tuplas pueden tener valores faltantes para ciertos atributos y, en este caso, debe completarse con valores adecuados para realizar el aprendizaje automático o cualquier forma de minería de datos. Los valores perdidos de los atributos numéricos, como el precio de la casa, se pueden reemplazar con el valor medio del atributo, mientras que los valores perdidos de los atributos categóricos se pueden reemplazar con el atributo con la moda más alta. Esto depende invariablemente de los tipos de filtros que utilicemos. Si los datos están en forma de texto o imágenes, será necesario convertirlos a forma numérica, ya sea una lista, una array o una array. Simplemente, los datos deben ser relevantes y consistentes. Debe convertirse a un formato comprensible para la máquina.
- Divida los datos de entrada en conjuntos de entrenamiento, validación cruzada y prueba. La relación entre los respectivos conjuntos debe ser 6:2:2
- Construcción de modelos con algoritmos y técnicas adecuadas sobre el conjunto de entrenamiento.
- Probar nuestro modelo conceptualizado con datos que no se alimentaron al modelo en el momento del entrenamiento y evaluar su rendimiento utilizando métricas como puntaje F1, precisión y recuperación.
- Álgebra lineal
- Estadística y Probabilidad
- Cálculo
- Teoría de grafos
- Habilidades de programación: lenguajes como Python, R, MATLAB, C++ u Octave
Publicación traducida automáticamente
Artículo escrito por Mohit Gupta_OMG 🙂 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA