Juego de serpientes impulsado por IA usando Deep Q Learning

Introducción: este proyecto se basa en el aprendizaje por refuerzo, que entrena a la serpiente para que coma los alimentos presentes en el entorno. A continuación se muestra un gif de muestra para que pueda tener una idea de lo que vamos a construir. Serpiente impulsada por IA Los requisitos previos para este proyecto son: … Continue reading «Juego de serpientes impulsado por IA usando Deep Q Learning»

Algoritmo de límite de confianza superior en el aprendizaje por refuerzo

En el aprendizaje por refuerzo, el agente o el tomador de decisiones genera sus datos de entrenamiento al interactuar con el mundo. El agente debe aprender las consecuencias de sus acciones a través de prueba y error, en lugar de que se le diga explícitamente la acción correcta. Problema de bandido con múltiples brazos En … Continue reading «Algoritmo de límite de confianza superior en el aprendizaje por refuerzo»