Los fanáticos están extasiados por una variedad de razones, incluido el hecho de que las GAN fueron los primeros algoritmos generativos en producir buenos resultados convincentes, así como el hecho de que han abierto muchas nuevas direcciones de investigación. En los últimos años, las GAN se consideran la investigación de aprendizaje automático más destacada y, desde entonces, las GAN han revolucionado los conceptos de aprendizaje profundo, lo que ha producido algunos avances tecnológicos importantes en la historia de la inteligencia artificial.
Redes adversarias generativas
Las redes adversas generativas (GAN) son una poderosa clase de redes neuronales que se utilizan para el aprendizaje no supervisado . Básicamente se compone de un sistema de dos modelos de redes neuronales que compiten entre sí y pueden analizar, capturar y copiar las variaciones dentro de un conjunto de datos.
Característica de la red adversaria generativa
- La primera y más importante característica de las GAN es su naturaleza de aprendizaje, es decir, prefieren seguir un aprendizaje poderoso no supervisado, razón por la cual no requieren datos etiquetados. Esto hace que las GAN sean muy potentes y fáciles de entender porque se elimina la tediosa tarea de etiquetar y anotar datos.
- En segundo lugar, sugirieron un modelo generativo que, cuando se combina con una red contradictoria, puede crear imágenes naturales de alta calidad que crecen progresivamente para generar datos cada vez más realistas. Este marco no solo puede producir datos sintéticos de muy alta calidad, sino que también se puede utilizar para mejorar los píxeles de las fotografías, generar imágenes a partir del texto de entrada, convertir imágenes de un dominio a otro, modificar la apariencia de la imagen facial y muchas más. otras cosas.
- Tercero, suponga que no tiene suficientes datos para un problema en el que está trabajando; en ese caso, puede usar redes antagónicas para “generar” más datos en lugar de recurrir a trucos como el aumento de datos; no solo eso, muchas tareas requieren la generación realista de muestras de alguna distribución, y las GAN han demostrado ser muy útiles en tales casos.
- Cuando tenemos varias tareas para completar, una sola entrada puede tener una estrecha relación con muchas salidas correctas alternativas, cada una de las cuales es aceptable. La mayoría de los modelos generativos, y las GAN, en particular, permiten que el aprendizaje automático funcione con salidas multimodales.
- Otra razón de la popularidad de las GAN es la fuerza del entrenamiento de confrontación, que produce resultados considerablemente más nítidos y discretos que los promedios confusos de MSE. Esto ha llevado a múltiples aplicaciones de GAN, incluidas las GAN de súper resolución, que superan a MSE y varias otras funciones de pérdida en tendencia.
- Por último, pero no menos importante, la investigación interminable centrada en las GAN es tan cautivadora que ha atraído el interés de todas las demás industrias. Como resultado, seremos testigos de varios avances tecnológicos clave en la historia de las GAN que las han elevado a la prominencia.
¿Puede GAN ser el futuro?
Las GAN han mejorado con el tiempo y, a pesar de todos los desafíos planteados por la última década de investigación, las GAN han generado contenido que será cada vez más difícil de distinguir del contenido real. Al comparar la generación de imágenes en 2014 con la actual, no se esperaba que la calidad mejorara tanto y, si el progreso continúa en esta dirección, las GAN seguirán siendo un proyecto de investigación muy importante en el futuro, suponiendo que las GAN sean aceptadas.
No sabemos «qué pueden hacer las GAN por nosotros» porque todavía estamos hablando de «lo que podemos hacer por las GAN» para hacerlas más estables, pero el futuro de las GAN parece brillante para la humanidad y podríamos ver máquinas. generó código, música, videos e incluso ensayos y blogs en muy poco tiempo. Sin embargo, puedo asegurarles que esta publicación de blog no fue escrita por un GAN (¿o sí?).
Aplicaciones de GANS
- Muchos académicos e investigadores de instituciones y laboratorios famosos utilizan las GAN para desarrollar medicamentos para el cáncer, los trastornos dermatológicos, la fibrosis, el Parkinson, el Alzheimer, la ELA, la diabetes, la sarcopenia y el envejecimiento.
- Una aplicación particularmente interesante será en el departamento dental, donde se cree que los investigadores están utilizando GAN para fabricar coronas dentales, lo que acelerará todo el proceso para el paciente porque un procedimiento que antes tomaba semanas ahora podría completarse con alta precisión en solo unas pocas horas
- Las GAN también se están utilizando para mejorar las escenas de realidad aumentada (AR) en entornos específicos, como completar mapas de entornos faltantes aprendiendo la estructura estadística del mundo utilizando las capacidades de generación creativa de las GAN. También se manejan otros casos de uso de GAN relacionados con AR que incluyen texturas ambientales, como habilitación, iluminación y reflejos.
- Otra aplicación en la que las GAN mostrarán su valor es en la generación de datos de entrenamiento para regímenes de datos bajos. Por ejemplo, un equipo de investigación de Apple demostró que se puede enviar una gran cantidad de datos sin etiquetar a un refinador impulsado por GAN, que luego se puede entrenar para generar datos de entrenamiento más realistas dados algunos datos sintéticos etiquetados de base, y esta técnica puede reducir el costo de generar conjuntos de datos supervisados y ayuda en una variedad de tareas de aprendizaje automático.
- Hay muchos temas de investigación interesantes que involucran GAN, como mejorar el desenredo, aplicar aprendizaje contrastivo y entrenar GAN más estables, que aún deben abordarse con la ayuda de varias herramientas de construcción que permiten a los profesionales e investigadores pasar rápidamente de la prueba de concepto a aplicaciones del mundo real, inspirando un uso más creativo de las GAN en el futuro.
- Las GAN privadas diferenciales son un tema importante para explorar en términos de privacidad de datos, y hay muchas perspectivas para entrenar modelos más eficientes para la representación rápida de datos y admitir tipos de datos multimodales, como es el caso de situaciones difíciles como los automóviles autónomos.
Publicación traducida automáticamente
Artículo escrito por Mohit Gupta_OMG 🙂 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA