La IA es realmente buena a la hora de identificar caras, objetos o animales. Esas prestaciones se han aprovechado tradicionalmente en ámbitos cotidianos como la gestión de fotos con Google Fotos o Apple Fotos, pero también en otros mucho más inquietantes como la vigilancia masiva que por ejemplo ha sido regulada en Europa. Ahora unos investigadores han descubierto una aplicación que también tiene aplicaciones prácticas estupendas... y preocupantes.
Todo empezó en clase. Tres estudiantes de la universidad de Stanford comenzaron a cursar la asignatura 'Computer Science 330: Deep Multi-task and Meta Learning'. Necesitaban un proyecto en el que trabajar, así que estos investigadores, llamados Michael Skreta, Silas Alberti y Lukas Haas, se dieron cuenta de que podían aplicar esos nuevos conocimientos a su afición por un singular juego online.
GeoGuessr. Este juego online, que lleva años disponible, se ha convertido en un singular éxito que ya tiene obsesionados a un buen grupo de sus jugadores. La idea es sencilla: se te presenta una foto de alguna localización, y tú tienes que intentar deducir dónde fue tomada señalándola en Google Maps a partir de los detalles de la propia foto. El juego cuenta con 50 millones de jugadores en todo el mundo y todos ellos compiten entre sí, y entre ellos ya hay celebridades de YouTube o Twitch, y también han comenzado a surgir jugadores realmente excepcionales.
Vamos a ganar a GeoGuessr. Estos estudiantes quisieron averiguar si podían crear un sistema de IA que pudiera jugar mejor que los humanos a GeoGuessr. Partieron de una plataforma de OpenAI llamada CLIP que es capaz de "aprender" datos de unas imágenes de entrada a partir del texto que existe sobre ellas.
Entrenamiento con Google Street View. Como señalan en NPR, para entrenar su modelo de IA comenzaron a "alimentarlo" con datos de Google Street View. "Creamos nuestro propio conjunto de datos con cerca de 500.000 imágenes de Google Street View. En realidad no son muchos datos, y aún así pudimos conseguir un rendimiento bastante espectacular", afirmaba Alberti.
PIGEON. El proyecto, conocido como Predicting Image Geolocations (PIGEON) acabó siendo el resultado de esa esfuerzo. El modelo de IA podía identificar la localización de una imagen de Google Street View de cualquier localización. Su precisión es asombrosa: deduce el país con un 95% de precisión, y normalmente sitúa la imagen en un radio de 25 km de donde fue tomada realmente.
Derrotando al campeón del mundo. Para evaluar su comportamiento, los investigadores se pusieron en contacto con Trevor Rainbolt, que se ha convertido en toda una leyenda en la comunidad GeoGuessr. A pesar de sus hazañas en este juego, al enfrentarse con PIGEON acabó perdiendo múltiples rondas. Como señalaba Alberti "no hemos sido la primera IA que ha jugado contra Rainbolt. Simplemente hemos sido la primera IA que ha ganado contra él".
Más allá de PIGEON. Los responsables del proyecto han ido más allá y han creato también PIGEOTTO, una versión más ambiciosa que ha sido entrenada con más de cuatro millones de imágenes procedentes de Flickr y Wikipedia, lo que permite aumentar aún la capacidad y prestaciones del sistema. No han liberado el desarrollo, que no es posible probar, pero sí han publicado el estudio con detalles y conclusiones del proyecto.
Expertos preocupados. Jay Stanley, de la American Civil Liberties Union (ACLU), explicaba que las empresas podrían usar sistemas como este para espiar dónde has viajado, y agencias gubernamentales podrían también detectar si un usuario que publica sus fotos ha viajado a cierto país que está en su punto de mira. También podría usarse para acosar a los usuarios, por ejemplo.