¿Cómo entrenar a una plataforma de inteligencia artificial? Jugando a Pac-Man, claro

¿Cómo entrenar a una plataforma de inteligencia artificial? Jugando a Pac-Man, claro
2 comentarios Facebook Twitter Flipboard E-mail

Las iniciativas que están tratando de avanzar en el desarrollo de sistemas cada vez más capaces de inteligencia artificial no dejan de sorprendernos, y de hecho son varios los proyectos que están en marcha. Uno de ellos es OpenAI, la plaaforma creada por Elon Musk, Sam Altman (Y Combinator) y Ilya Sutskever, científico que antes formó parte de Google Brain.

Esta plataforma abierta que quiere compartir sus avances con el resto del mundo -nada de soluciones propietarias como las de Google o Microsoft, predican sus creadores- ha dado un primer paso: un conjunto de herramientas que los desarrolladores ya pueden usar para ir trabajando en todo tipo de proyectos. De hecho entre ellas están herramientas de aprendizaje por refuerzo en las que se trata de aprender la mejor forma de jugar a juegos legendarios de Atari como el Pac-Man, Asteroids, Air Raid o Pitfall.

Aprendizaje por refuerzo, en la cresta de la ola

El llamado OpenAI Gym que se ha lanzado en fase beta trata de simular escenarios en los que esta plataforma de inteligencia artificial puede aprender y potenciar ese sistema de aprendizaje por refuerzo que de hecho es la clave de DeepMind, el motor de inteligencia artificial de Google que hace poco logró ese increíble hito de superar a uno de los mejores jugadores humanos del mundo de Go.

Pacman2

Los creadores de este conjunto de herramientas también han liberado una serie de utilidades que permiten comparar distintos algoritmos de aprendizaje por refuerzo que permitan ir afinando el comportamiento de los sistemas que vayan programando los desarrolladores a través de los resultados obtenidos.

OpenAI Gym es además compatible con algoritmos desarrollados con plataformas como Tensorflow o Theano, y aunque explican que de momento estas herramientas están restringidas al uso de Python pronto expandirán ese soporte a otros lenguajes de programación. En el caso del Arcade Learning Environment integrado dentro de esta plataforma, es curioso el uso de Stella, el emulador de las Atari 2600 que permite evaluar si nuestro sistema de inteligencia artificial puede aprender y lograr esa partida perfecta.

Vía | The Next Web
En Xataka | ¿Por qué las grandes empresas de tecnología están regalando o abriendo su tecnología de IA?

Comentarios cerrados
Inicio