Conceptos básicos de las redes adversarias generativas (GAN)

GAN es un enfoque para el modelado generativo que utiliza métodos de aprendizaje profundo como CNN (Red Neural Convolucional). El modelado generativo es un enfoque de aprendizaje no supervisado que implica descubrir y aprender automáticamente patrones en los datos de entrada, de modo que el modelo se pueda usar para generar nuevos ejemplos a partir del conjunto de datos original.

GAN es una forma de entrenar un modelo generativo enmarcando el problema como un problema de aprendizaje supervisado con dos submodelos. Hay dos componentes de las GAN:

  1. Generador: está capacitado para generar nuevos conjuntos de datos, por ejemplo, en visión por computadora genera nuevas imágenes a partir de imágenes existentes del mundo real.
  2. Discriminador: compara esas imágenes con algunos ejemplos del mundo real y clasifica imágenes reales y falsas.

Ejemplo:
el Generador genera algunas imágenes aleatorias (por ejemplo, tablas) y luego el discriminador compara esas imágenes con algunas imágenes de tablas del mundo real y envía la información a sí mismo y al Generador. Mire la estructura GAN en la fig. 1.

Figura 1: estructura GAN

¿Cómo funciona GAN? Tomemos un ejemplo de generación de imágenes de Perros.

Paso 1- Capacitación del discriminador

  1. En primer lugar, se envía una señal de ruido aleatorio a un generador que crea algunas imágenes inútiles que contienen ruido.
  2. (Ver figura 2)
  3. .

  4. Se dan dos entradas al Discriminador. En primer lugar, las imágenes de salida de muestra generadas a partir de Generator y, en segundo lugar, las muestras de imágenes de perros del mundo real.
  5. A continuación, The Discriminator rellena algunos valores (probabilidad) después de comparar las dos imágenes que se pueden ver en la fig. 2 . Calcula 0,8, 0,3 y 0,5 para las imágenes de salida del generador y 0,1, 0,9 y 0,2 para las imágenes del mundo real.
  6. Ahora, se calcula un error comparando las probabilidades de las imágenes generadas con 0 (Cero) y comparando las probabilidades de las imágenes de palabras reales con 1 (Uno). (Ej. 0-0.8, 0-0.3, 0-0.5 y 1-0.1, 1-0.9, 1-0.2).
  7. Después de calcular los errores individuales, calculará el error acumulativo (pérdida) que se propaga hacia atrás y se ajustan los pesos del discriminador. Así es como se entrena a un Discriminador.

Figura 2: GAN Paso 1

Paso 2 – Entrenamiento del Generador:

  1. Como anteriormente en el paso 1, la pérdida se retropropaga al discriminador para ajustar sus pesos. Ahora también necesitamos propagar un error al Generador para que también pueda ajustar sus pesos y entrenarse para generar imágenes mejoradas.
  2. Ahora, las imágenes generadas por el Generador se utilizan como entrada al propio generador en lugar de ruido aleatorio.
  3. Las imágenes recién generadas por el generador ahora serán una entrada para el Discriminador que nuevamente calcula probabilidades como 0.5, 0.1 y 0.2. (Ver figura 2)
  4. Ahora, se calculará un error comparando las probabilidades de las imágenes generadas con 1 (Uno).
  5. Después de calcular los errores individuales, calculará el error acumulativo (pérdida) que se propaga hacia atrás y se ajustan los pesos del Generador. Así es como se entrena Generator.

Figura 2: GAN Paso 2

Después de algunas iteraciones, verá que el Generador comienza a generar imágenes cercanas a las imágenes del mundo real.

Aplicaciones de GAN:

  1. Generación de imágenes
  2. súper resolución
  3. Modificación de imagen
  4. Imágenes fotorrealistas
  5. Envejecimiento facial

Publicación traducida automáticamente

Artículo escrito por sachingera y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *