Esta IA de Meta ha destrozado a rivales humanos en juegos complejos. Solo es una prueba de su potencial

Esta IA de Meta ha destrozado a rivales humanos en juegos complejos. Solo es una prueba de su potencial
8 comentarios Facebook Twitter Flipboard E-mail

Una inteligencia artificial capaz de persuadirte para lograr sus objetivos. CICERO es, según Meta, la primera IA capaz de "lograr un rendimiento humano en un juego como 'Diplomacy'. Para los que nunca hayan probado esta propuesta, se trata un juego de estrategia en el que vamos negociando con otros territorios para, entre otras cosas, pedirles amablemente que se rindan y nos cedan su terreno.

CICERO ha logrado obtener más del doble de la puntuación promedio de los jugadores de 'Diplomacy', siendo así capaz de utilizar el lenguaje natural para entender las estrategias de otras personas, y tratar de persuadirlas para cambiarlas.

Ten claras tus ideas, o la IA las cambiará

Desde Meta cuentan que uno de los grandes retos en los últimos años para la inteligencia artificial ha sido la diplomacia. Ser capaz de entener los planes y estrategias de una persona y tratar de llegar a acuerdos con la misma. Convencerlos para formar una alianza, atacar a otros, o participar en sus proyectos. Las claves para lograr este funcionamiento han sido desarrollar nuevas técnicas tanto en procesamiento del lenguaje natural como en el propio razonamiento estratégico.

Captura De Pantalla 2022 11 23 A Las 10 24 16 A M

"En el corazón de CICERO hay un modelo de diálogo controlable para la diplomacia junto con un motor de razonamiento estratégico. En cada punto del juego, CICERO mira el tablero del juego y su historial de conversaciones, y modela cómo es probable que actúen los otros jugadores. Luego utiliza este plan para controlar un modelo de lenguaje que puede generar un diálogo de forma libre, informando a otros jugadores de sus planes y proponiendo acciones razonables para los otros jugadores que se coordinan bien con ellos.

Primero se empezó con un modelo de diálogo. Se afinó con más de 40.000 partidas en webDiplomacy.net, y se recogían todos los datos de las mismas para que la IA fuese aprendiendo a mantener conversaciones y negociar en tiempo real.

  • Primero, CICERO hace una predicción de lo que harán los jugadores.
  • Posteriormente, refina la predicción en una segunda etapa.
  • Después, genera varios mensajes basados en la conversación que está analizando.
  • Por último, filtra las propias respuestas que ha escogido para escoger la mejor.

El enfoque de aprendizaje de CICERO es distinto al de una IA habitual. Aquí no basta solo con una base de datos de respuestas basadas en las acciones de los jugadores. El modelo de respuesta debe ir escalando e iterando en cada interacción, para generar respuestas con un mayor valor respecto a la que esperan los propios jugadores. Esto implica saber cómo hablar de forma clara y persuasiva.

Meta parece tenerlo claro. Indica que si CICERO es capaz de jugar a Diplomacy, esta tecnología tiene aplicaciones en el mundo real. Desde su perspectiva, modelos como este permiten aliviar las barreras de comunicación entre humanos e IA (chatbots, aplicaciones, videojuegos en los que los personajes aprenden según vamos jugando, etc.).

Comentarios cerrados
Inicio