Arthur Samuel acuñó el término «Machine Learning» en 1959 y lo definió como un «campo de estudio que le da a las computadoras la capacidad de aprender sin ser programadas explícitamente».
¡Y ese fue el comienzo del aprendizaje automático! En los tiempos modernos, el aprendizaje automático es una de las opciones profesionales más populares (¡si no la más!). Según Indeed , el ingeniero de aprendizaje automático es el mejor trabajo de 2019 con un crecimiento del 344 % y un salario base promedio de $146 085 por año.
Pero todavía hay muchas dudas sobre qué es exactamente el Machine Learning y cómo empezar a aprenderlo. Entonces, este artículo trata sobre los conceptos básicos del aprendizaje automático y también el camino que puede seguir para convertirse eventualmente en un ingeniero de aprendizaje automático de pleno derecho. ¡¡¡Ahora empecemos!!!
¿Qué es el aprendizaje automático?
El aprendizaje automático implica el uso de inteligencia artificial para permitir que las máquinas aprendan una tarea a partir de la experiencia sin programarlas específicamente sobre esa tarea. (¡En resumen, las máquinas aprenden automáticamente sin la mano humana!) Este proceso comienza brindándoles datos de buena calidad y luego capacitando a las máquinas mediante la construcción de varios modelos de aprendizaje automático utilizando los datos y diferentes algoritmos. La elección de los algoritmos depende de qué tipo de datos tenemos y qué tipo de tarea estamos tratando de automatizar.
¿Cómo empezar a aprender ML?
Esta es una hoja de ruta aproximada que puede seguir en su camino para convertirse en un ingeniero de aprendizaje automático increíblemente talentoso. Por supuesto, ¡siempre puede modificar los pasos según sus necesidades para alcanzar el objetivo final deseado!
Paso 1: comprender los requisitos previos
En caso de que sea un genio, puede comenzar ML directamente, pero normalmente, hay algunos requisitos previos que necesita saber, que incluyen Álgebra lineal, Cálculo multivariante, Estadística y Python. Y si no los conoces, ¡nunca temas! No necesitas un doctorado. grado en estos temas para empezar, pero necesita una comprensión básica.
(a) Aprender álgebra lineal y cálculo multivariado
Tanto el álgebra lineal como el cálculo multivariado son importantes en el aprendizaje automático. Sin embargo, la medida en que los necesite depende de su rol como científico de datos. Si está más centrado en el aprendizaje automático pesado de aplicaciones, entonces no estará tan centrado en las matemáticas, ya que hay muchas bibliotecas comunes disponibles. Pero si desea centrarse en I+D en aprendizaje automático, entonces el dominio del álgebra lineal y el cálculo multivariado es muy importante, ya que tendrá que implementar muchos algoritmos de aprendizaje automático desde cero.
(b) Aprender estadísticas
Los datos juegan un papel muy importante en el aprendizaje automático. De hecho, alrededor del 80% de su tiempo como experto en ML lo dedicará a recopilar y limpiar datos. Y la estadística es un campo que maneja la recopilación, el análisis y la presentación de datos. ¡Así que no es de extrañar que necesites aprenderlo!
Algunos de los conceptos clave en estadística que son importantes son la significación estadística, las distribuciones de probabilidad, la prueba de hipótesis, la regresión, etc. Además, el pensamiento bayesiano también es una parte muy importante de ML que trata varios conceptos como probabilidad condicional, anteriores y posteriores. Máxima probabilidad, etc.
(c) Aprender Python
Algunas personas prefieren saltear Álgebra Lineal, Cálculo Multivariado y Estadística y aprenderlos sobre la marcha con prueba y error. ¡Pero la única cosa que absolutamente no puedes omitir es Python ! Si bien hay otros lenguajes que puede usar para Machine Learning como R, Scala, etc. Python es actualmente el lenguaje más popular para ML. De hecho, hay muchas bibliotecas de Python que son específicamente útiles para la inteligencia artificial y el aprendizaje automático, como Keras , TensorFlow , Scikit-learn , etc.
Entonces, si quieres aprender ML, ¡es mejor si aprendes Python! Puede hacerlo utilizando varios recursos y cursos en línea, como Fork Python , disponible de forma gratuita en GeeksforGeeks.
Paso 2: aprenda varios conceptos de ML
Ahora que ha terminado con los requisitos previos, puede continuar con el aprendizaje de ML (¡¡que es la parte divertida!) Es mejor comenzar con lo básico y luego pasar a las cosas más complicadas. Algunos de los conceptos básicos en ML son:
(a) Terminologías del aprendizaje automático
- Modelo: un modelo es una representación específica aprendida de los datos mediante la aplicación de algún algoritmo de aprendizaje automático. Un modelo también se llama hipótesis.
- Característica: una característica es una propiedad medible individual de los datos. Un conjunto de características numéricas puede describirse convenientemente mediante un vector de características. Los vectores de características se alimentan como entrada al modelo. Por ejemplo, para predecir una fruta, puede haber características como color, olor, sabor, etc.
- Objetivo (etiqueta): una variable objetivo o etiqueta es el valor que nuestro modelo va a predecir. Para el ejemplo de la fruta discutido en la sección de características, la etiqueta con cada conjunto de entrada sería el nombre de la fruta como manzana, naranja, plátano, etc.
- Entrenamiento: la idea es dar un conjunto de entradas (características) y sus resultados esperados (etiquetas), por lo que después del entrenamiento, tendremos un modelo (hipótesis) que luego asignará nuevos datos a una de las categorías entrenadas.
- Predicción: una vez que nuestro modelo está listo, se puede alimentar con un conjunto de entradas a las que proporcionará una salida predicha (etiqueta).
(b) Tipos de aprendizaje automático
- Aprendizaje supervisado: implica aprender de un conjunto de datos de entrenamiento con datos etiquetados utilizando modelos de clasificación y regresión. Este proceso de aprendizaje continúa hasta que se alcanza el nivel requerido de desempeño.
- Aprendizaje no supervisado: esto implica el uso de datos no etiquetados y luego encontrar la estructura subyacente en los datos para aprender más y más sobre los datos en sí mismos utilizando modelos de análisis de factores y conglomerados.
- Aprendizaje semisupervisado: implica el uso de datos no etiquetados, como el aprendizaje no supervisado, con una pequeña cantidad de datos etiquetados. El uso de datos etiquetados aumenta enormemente la precisión del aprendizaje y también es más rentable que el aprendizaje supervisado.
- Aprendizaje por refuerzo: esto implica aprender acciones óptimas a través de prueba y error. Entonces, la siguiente acción se decide aprendiendo comportamientos que se basan en el estado actual y que maximizarán la recompensa en el futuro.
(c) ¿Cómo practicar el aprendizaje automático?
- La parte que más tiempo consume en ML es en realidad la recopilación, integración, limpieza y preprocesamiento de datos. Así que asegúrese de practicar con esto porque necesita datos de alta calidad, pero una gran cantidad de datos a menudo están sucios. ¡Así que aquí es donde irá la mayor parte de su tiempo!
- Aprenda varios modelos y practique con conjuntos de datos reales. Esto lo ayudará a crear su intuición sobre qué tipos de modelos son apropiados en diferentes situaciones.
- Junto con estos pasos, es igualmente importante comprender cómo interpretar los resultados obtenidos mediante el uso de diferentes modelos. Esto es más fácil de hacer si comprende varios parámetros de ajuste y métodos de regularización aplicados en diferentes modelos.
(d) Recursos para el aprendizaje del aprendizaje automático:
Hay varios recursos en línea y fuera de línea (¡tanto gratuitos como de pago!) que se pueden usar para aprender Machine Learning. Algunos de estos se proporcionan aquí:
- Para una introducción amplia al aprendizaje automático, el curso de aprendizaje automático de Stanford de Andrew Ng es bastante popular. Se enfoca en el aprendizaje automático, la minería de datos y el reconocimiento de patrones estadísticos con videos explicativos que son muy útiles para aclarar la teoría y los conceptos básicos detrás de ML.
- Si desea una guía de autoaprendizaje para el aprendizaje automático, entonces el Curso intensivo de aprendizaje automático de Google es bueno para usted, ya que le proporcionará una introducción al aprendizaje automático con conferencias en video, estudios de casos del mundo real y ejercicios prácticos.
- En caso de que prefiera un curso fuera de línea, el curso básico de aprendizaje automático de Geeksforgeeks será ideal para usted. Este curso le enseñará sobre varios conceptos de aprendizaje automático y también experiencia práctica para implementarlos en un entorno de aula.
Paso 3 – Participa en Competiciones
¡Después de haber entendido los conceptos básicos del aprendizaje automático, puede pasar a la parte loca! Competiciones! Básicamente, esto lo hará aún más competente en ML al combinar su conocimiento principalmente teórico con la implementación práctica. Algunas de las competencias básicas con las que puede comenzar en Kaggle que lo ayudarán a generar confianza se brindan aquí:
- Titanic: Machine Learning from Disaster: El desafío Titanic: Machine Learning from Disaster es un proyecto para principiantes muy popular para ML, ya que tiene varios tutoriales disponibles. Por lo tanto, es una excelente introducción a los conceptos de ML como la exploración de datos, la ingeniería de características y el ajuste de modelos.
- Reconocedor de dígitos: El Reconocedor de dígitos es un proyecto después de tener algún conocimiento de los conceptos básicos de Python y ML. Es una excelente introducción al apasionante mundo de las redes neuronales utilizando un conjunto de datos clásico que incluye características extraídas previamente.
Después de que hayas completado estas competiciones y otros desafíos tan sencillos… ¡¡¡Enhorabuena!!! Está en camino de convertirse en un ingeniero de aprendizaje automático de pleno derecho y puede continuar mejorando sus habilidades trabajando en más y más desafíos y eventualmente creando proyectos de aprendizaje automático cada vez más creativos y difíciles.
Publicación traducida automáticamente
Artículo escrito por harkiran78 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA