Los 10 algoritmos principales que todo ingeniero de aprendizaje automático debe conocer

Las computadoras pueden ver, oír y aprender. Bienvenido al futuro. ” 

Y el aprendizaje automático es el futuro. Según Forbes , las patentes de aprendizaje automático crecieron a una tasa del 34 % entre 2013 y 2017 y se espera que aumente en los próximos tiempos. Además, un artículo de revisión de Harvard Business calificó a un científico de datos como el «trabajo más sexy del siglo XXI» (¡¡y eso es un incentivo justo ahí!!!). 

En estos tiempos altamente dinámicos, se han desarrollado varios algoritmos de aprendizaje automático para resolver problemas complejos del mundo real. Estos algoritmos están altamente automatizados y se automodifican, ya que continúan mejorando con el tiempo con la adición de una mayor cantidad de datos y con una mínima intervención humana requerida. Entonces, este artículo trata sobre los 10 mejores algoritmos de aprendizaje automático

Pero para entender estos algoritmos, en primer lugar, se explican brevemente los diferentes tipos a los que pueden pertenecer. 

Tipos de algoritmos de aprendizaje automático:

Los algoritmos de aprendizaje automático se pueden clasificar en 3 tipos diferentes, a saber: 

Algoritmos de aprendizaje automático supervisado: 
imagina a un profesor supervisando una clase. El maestro ya sabe las respuestas correctas, pero el proceso de aprendizaje no se detiene hasta que los estudiantes también aprenden las respuestas (¡pobres niños!). Esta es la esencia de los algoritmos de aprendizaje automático supervisado. Aquí, el algoritmo es el estudiante que aprende de un conjunto de datos de entrenamiento y hace predicciones que son corregidas por el profesor. Este proceso de aprendizaje continúa hasta que el algoritmo alcanza el nivel de rendimiento requerido. 

Algoritmos de aprendizaje automático no supervisados: 
en este caso, no hay un maestro para la clase y los estudiantes pobres deben aprender por sí mismos. Esto significa que para los algoritmos de aprendizaje automático no supervisados, no hay una respuesta específica para aprender y no hay un maestro. El algoritmo se deja sin supervisión para encontrar la estructura subyacente en los datos con el fin de aprender más y más sobre los datos en sí. 

Algoritmos de aprendizaje automático de refuerzo: 
Bueno, aquí hay estudiantes hipotéticos que aprenden de sus propios errores con el tiempo (¡así es como la vida!). Entonces, los algoritmos de aprendizaje automático de refuerzo aprenden acciones óptimas a través de prueba y error. Esto significa que el algoritmo decide la siguiente acción aprendiendo comportamientos que se basan en su estado actual y que maximizarán la recompensa en el futuro. 

Cursos GeeksforGeeks

Aprendizaje automático básico y avanzado: curso a su propio ritmo

Aprenda habilidades en demanda con nuestro curso de autoaprendizaje de aprendizaje automático . Aprenda de los datos profundizando en temas como Regresión, NLP, Clustering y mucho más. Obtenga más habilidades con proyectos basados ​​en aplicaciones del mundo real. Entonces, este es el mejor momento, si desea mejorar sus habilidades de aprendizaje automático y convertirse en un experto en aprendizaje automático.

Principales algoritmos de aprendizaje automático

Hay algoritmos de aprendizaje automático específicos que se desarrollaron para manejar problemas complejos de datos del mundo real. Entonces, ahora que hemos visto los tipos de algoritmos de aprendizaje automático, estudiemos los principales algoritmos de aprendizaje automático que existen y que realmente usan los científicos de datos. 

1. Algoritmo clasificador Naïve Bayes: 
¿qué sucedería si tuviera que clasificar textos de datos como una página web, un documento o un correo electrónico manualmente? ¡Pues te volverías loco! Pero, afortunadamente, esta tarea la realiza el algoritmo clasificador Naïve Bayes. Este algoritmo se basa en el Teorema de probabilidad de Bayes (probablemente lo hayas leído en matemáticas) y asigna el valor del elemento a una población de una de las categorías disponibles. 

P(y|X) = \frac{P(X|y) P(y)}{P(X)}

donde y es una variable de clase y X es un vector de características dependiente (de tamaño n ) donde: 

X = (x_1,x_2,x_3,.....,x_n)

Un ejemplo del uso del Algoritmo Clasificador Naïve Bayes es para el filtrado de spam de correo electrónico. Gmail utiliza este algoritmo para clasificar un correo electrónico como spam o no spam. 

2. K significa algoritmo 
de agrupamiento: imaginemos que desea buscar el término «fecha» en Wikipedia. Ahora, “cita” puede referirse a una fruta, un día en particular o incluso una velada romántica con tu amor!!! Entonces, Wikipedia agrupa las páginas web que hablan sobre las mismas ideas utilizando el algoritmo de agrupación en clústeres K Means (ya que es un algoritmo popular para el análisis de clústeres). 

El algoritmo de agrupamiento de medios K en general utiliza un número K de grupos para operar en un conjunto de datos determinado. De esta manera, la salida contiene K clústeres con los datos de entrada divididos entre los clústeres (como se dividieron las páginas con diferentes significados de «fecha»). 

3. Algoritmo de máquina de vectores de soporte: 
el algoritmo de máquina de vectores de soporte se utiliza para problemas de clasificación o regresión. En esto, los datos se dividen en diferentes clases al encontrar una línea particular (hiperplano) que separa el conjunto de datos en múltiples clases. El algoritmo de la máquina de vectores de soporte intenta encontrar el hiperplano que maximiza la distancia entre las clases (lo que se conoce como maximización del margen), ya que esto aumenta la probabilidad de clasificar los datos con mayor precisión. 

Un ejemplo del uso del algoritmo de máquina de vectores de soporte es para comparar el rendimiento de las acciones en el mismo sector. Esto ayuda en la gestión de la toma de decisiones de inversión por parte de las instituciones financieras. 

4. Algoritmo a priori: 
el algoritmo a priori genera reglas de asociación utilizando el formato IF_THEN. Esto significa que SI ocurre el evento A, entonces el evento B también ocurre con cierta probabilidad. Por ejemplo: SI una persona compra un automóvil, ENTONCES también compra un seguro de automóvil. El Algoritmo A priori genera esta regla de asociación al observar el número de personas que compraron un seguro de automóvil después de comprar un automóvil. 

Un ejemplo del uso del algoritmo Apriori es para el autocompletado de Google. Cuando se escribe una palabra en Google, el Algoritmo A priori busca las palabras asociadas que normalmente se escriben después de esa palabra y muestra las posibilidades. 

5. Algoritmo de regresión lineal: 
el algoritmo de regresión lineal muestra la relación entre una variable independiente y una dependiente. Demuestra el impacto en la variable dependiente cuando la variable independiente cambia de alguna manera. Entonces, la variable independiente se llama variable explicativa y la variable dependiente se llama factor de interés. 

Un ejemplo del uso del algoritmo de regresión lineal es para la evaluación de riesgos en el ámbito de los seguros. El análisis de regresión lineal se puede utilizar para encontrar el número de reclamaciones de clientes de varias edades y luego deducir el aumento del riesgo a medida que aumenta la edad del cliente. 

6. Algoritmo de regresión logística: 
el algoritmo de regresión logística maneja valores discretos, mientras que el algoritmo de regresión lineal maneja predicciones en valores continuos. Por lo tanto, la regresión logística es adecuada para la clasificación binaria en la que si ocurre un evento, se clasifica como 1 y, si no, se clasifica como 0. Por lo tanto, la probabilidad de que ocurra un evento en particular se predice en función de las variables predictoras dadas. 

Un ejemplo del uso del algoritmo de regresión logística es en la política para predecir si un candidato en particular ganará o perderá una elección política. 

7. Algoritmo de árboles de decisión: 
suponga que desea decidir el lugar de celebración de su cumpleaños. Entonces, hay muchas preguntas que influyen en su decisión, como «¿El restaurante es italiano?», «¿El restaurante tiene música en vivo?», «¿El restaurante está cerca de su casa?» etc. Cada una de estas preguntas tiene una respuesta SI o NO que contribuye a su decisión. 

Esto es lo que básicamente sucede en el algoritmo de árboles de decisión. Aquí, todos los resultados posibles de una decisión se muestran utilizando una metodología de ramificación de árboles. Los Nodes internos se prueban en varios atributos, las ramas del árbol son los resultados de las pruebas y los Nodes hoja son la decisión que se toma después de calcular todos los atributos. 

Un ejemplo del uso del Algoritmo de árboles de decisión es en la industria bancaria para clasificar a los solicitantes de préstamos por su probabilidad de incumplimiento de pago de dichos préstamos. 

8. Algoritmo de bosques aleatorios: 
el algoritmo de bosques aleatorios maneja algunas de las limitaciones del algoritmo de árboles de decisión, a saber, que la precisión del resultado disminuye cuando aumenta el número de decisiones en el árbol. 

Entonces, en el Algoritmo de Bosques Aleatorios, hay múltiples árboles de decisión que representan varias probabilidades estadísticas. Todos estos árboles están asignados a un solo árbol conocido como el modelo CART. (Árboles de Clasificación y Regresión). Al final, la predicción final del algoritmo Random Forests se obtiene sondeando los resultados de todos los árboles de decisión. 

Un ejemplo del uso del Algoritmo de Bosques Aleatorios está en la industria del automóvil para predecir el futuro desglose de cualquier pieza de automóvil en particular. 

9. Algoritmo de 
K vecinos más cercanos: el algoritmo de K vecinos más cercanos divide los puntos de datos en diferentes clases en función de una medida similar, como la función de distancia. Luego se hace una predicción para un nuevo punto de datos buscando en todo el conjunto de datos las K instancias más similares (los vecinos) y resumiendo la variable de salida para estas K instancias. Para problemas de regresión, esta podría ser la media de los resultados y para problemas de clasificación, esta podría ser la moda (clase más frecuente). 

El algoritmo K vecinos más cercanos puede requerir mucha memoria o espacio para almacenar todos los datos, pero solo realiza un cálculo (o aprende) cuando se necesita una predicción, justo a tiempo. 

10. Algoritmo de redes neuronales artificiales: 
el cerebro humano contiene neuronas que son la base de nuestro poder de retención y son nítidas (¡al menos para algunos de nosotros!). Entonces, las redes neuronales artificiales intentan replicar las neuronas en el cerebro humano creando Nodes que están interconectados entre sí. Estas neuronas toman información a través de otra neurona, realizan varias acciones según sea necesario y luego transfieren la información a otra neurona como salida. 

Un ejemplo de Redes Neuronales Artificiales es el reconocimiento facial humano. Las imágenes con rostros humanos se pueden identificar y diferenciar de las imágenes “no faciales”. Sin embargo, esto podría demorar varias horas dependiendo de la cantidad de imágenes en la base de datos, mientras que la mente humana puede hacerlo instantáneamente.
 

Publicación traducida automáticamente

Artículo escrito por harkiran78 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *