Mucho se ha hablado de las posibilidades de la inteligencia artificial, por ello cada semana vemos una gran cantidad de proyectos y avances que aprovechan esta nueva tecnología que apunta a estar presente en el día a día de nuestro futuro.
Hasta el momento todo se ha centrado en mostrarnos qué es lo que puede hacer, donde hemos visto cosas realmente sorprendentes y que significarán un cambio en la forma en que realizamos nuestras tareas diarias. Pero hoy es un buen momento para conocer cómo trabaja un sistema de inteligencia, ya que gracias a un nuevo vídeo, nos pondremos en "sus ojos".
Cuando un algoritmo mira un tráiler de película
Lasse Korsgaard y Andreas Refsgaard del estudio de codificación danés Støj están presentando el proyecto 'An algorithm watching a movie trailer', con el cual nos tratan de explicar cómo funciona la detección de objetos para un sistema de inteligencia artificial. Esta tarea es por demás importante, ya que es una de las funciones primordiales, por ejemplo, en la implementación de tecnología de conducción autónoma.
La detección de objetos no sólo permite saber qué es lo que está viendo, sino también entender el contexto, tratar de anticiparse a los hechos, y así poder actuar en consecuencia. Para los seres humanos es una tarea relativamente sencilla, ya que podemos determinar qué está ante nuestros ojos sin importar la distancia, el tamaño, la escala, rotación, o si lo está obstruyendo algún otro objeto.
A pesar de que nosotros lo realizamos con cierta facilidad y sin un esfuerzo significativo, para los sistemas de IA representa una tarea muy compleja que desde hace años se ha tratado de realizar con éxito. Hoy finalmente hay avances significativos, donde la capacidad de identificación es asombrosa, así como el procesamiento de la información.
En el proyecto de Støj han puesto a un algoritmo a mirar el tráiler de la película 'The Wolf of Wall Street', el cual se comporta como una prueba de fuego para el sistema de reconocimiento debido a su frenético ritmo, sus tomas cortas y complejas, así como la gran cantidad de objetos que aparecen en cada escena. El resultado ha sido impresionante, ya que como veremos a continuación, el sistema ha reconocido los objetos de forma precisa y veloz.
Este vídeo es uno de los tres que conforman el proyecto. En este primer caso se programó el algoritmo para que sólo mostrara los objetos detectados con una confianza del 15% o superior, y eliminado de la escena aquellos que no pudieron ser detectados.
En segundo vídeo se mantienen las mismas reglas, sólo que aquí únicamente veremos cuadros delimitadores y las etiquetas de los objetos, lo que sirve para no tener distracciones y saber que tipo de objetos están presentes en la escena. Esta configuración permite eliminar o destacar los objetos por su tamaño y naturaleza, que nos sirve para ver cuántas personas hay, qué objetos están en movimiento y cuáles están estáticos, entre otras cosas.
Y por último tenemos la configuración que han llamado 'censura automática', con la que será más sencillo reconocer y bloquear rostros de personas, direcciones o texto en pantallas o documentos, así como delimitarlo para que sólo censure ciertas cosas, como por ejemplo menores de edad.
Esta es apenas la primera muestra del potencial de este proyecto, en los próximos meses seguirán haciendo experimentos con otros tráilers de películas, lo que servirá para perfeccionar tanto la programación del algoritmo como la detección de objetos.
Más información | Støj En Xataka | En Europa quieren regular los aspectos éticos de los robots y clasificarlos como 'personas'
Ver 9 comentarios