Mucho se ha hablado de las posibilidades de la inteligencia artificial, por ello cada semana vemos una gran cantidad de proyectos y avances que aprovechan esta nueva tecnología que apunta a estar presente en el día a día de nuestro futuro.
Hasta el momento todo se ha centrado en mostrarnos qué es lo que puede hacer, donde hemos visto cosas realmente sorprendentes y que significarán un cambio en la forma en que realizamos nuestras tareas diarias. Pero hoy es un buen momento para conocer cómo trabaja un sistema de inteligencia, ya que gracias a un nuevo vídeo, nos pondremos en "sus ojos".
Cuando un algoritmo mira un tráiler de película
Lasse Korsgaard y Andreas Refsgaard del estudio de codificación danés Støj están presentando el proyecto 'An algorithm watching a movie trailer', con el cual nos tratan de explicar cómo funciona la detección de objetos para un sistema de inteligencia artificial. Esta tarea es por demás importante, ya que es una de las funciones primordiales, por ejemplo, en la implementación de tecnología de conducción autónoma.
La detección de objetos no sólo permite saber qué es lo que está viendo, sino también entender el contexto, tratar de anticiparse a los hechos, y así poder actuar en consecuencia. Para los seres humanos es una tarea relativamente sencilla, ya que podemos determinar qué está ante nuestros ojos sin importar la distancia, el tamaño, la escala, rotación, o si lo está obstruyendo algún otro objeto.
A pesar de que nosotros lo realizamos con cierta facilidad y sin un esfuerzo significativo, para los sistemas de IA representa una tarea muy compleja que desde hace años se ha tratado de realizar con éxito. Hoy finalmente hay avances significativos, donde la capacidad de identificación es asombrosa, así como el procesamiento de la información.
En el proyecto de Støj han puesto a un algoritmo a mirar el tráiler de la película 'The Wolf of Wall Street', el cual se comporta como una prueba de fuego para el sistema de reconocimiento debido a su frenético ritmo, sus tomas cortas y complejas, así como la gran cantidad de objetos que aparecen en cada escena. El resultado ha sido impresionante, ya que como veremos a continuación, el sistema ha reconocido los objetos de forma precisa y veloz.
Este vídeo es uno de los tres que conforman el proyecto. En este primer caso se programó el algoritmo para que sólo mostrara los objetos detectados con una confianza del 15% o superior, y eliminado de la escena aquellos que no pudieron ser detectados.
En segundo vídeo se mantienen las mismas reglas, sólo que aquí únicamente veremos cuadros delimitadores y las etiquetas de los objetos, lo que sirve para no tener distracciones y saber que tipo de objetos están presentes en la escena. Esta configuración permite eliminar o destacar los objetos por su tamaño y naturaleza, que nos sirve para ver cuántas personas hay, qué objetos están en movimiento y cuáles están estáticos, entre otras cosas.
Y por último tenemos la configuración que han llamado 'censura automática', con la que será más sencillo reconocer y bloquear rostros de personas, direcciones o texto en pantallas o documentos, así como delimitarlo para que sólo censure ciertas cosas, como por ejemplo menores de edad.
Esta es apenas la primera muestra del potencial de este proyecto, en los próximos meses seguirán haciendo experimentos con otros tráilers de películas, lo que servirá para perfeccionar tanto la programación del algoritmo como la detección de objetos.
Más información | Støj
En Xataka | En Europa quieren regular los aspectos éticos de los robots y clasificarlos como 'personas'
Ver 9 comentarios
9 comentarios
whisper5
Si bien es un avance, sigue teniendo bastantes limitaciones. Aparte de personas, corbatas y copas/vasos poco más se detecta, y algunas cosas se clasifican mal. Aparece un chimpancé que se etiqueta como una persona, una cortina que se etiqueta como un paraguas y un cuadro que se etiqueta como un televisor.
mariano.vizcaino
Me pido ser John Connor.
mauxxrtg
Hace tiempo vi un anime donde un pelado usa una herramienta similar para hacer un atraco con censura en "vivo" y por lo visto del tercer video, vamos en esa dirección :@
overmik
Incorrecto; cuando sale Margot Robbie cualquier robot interpretaría "ultra-hot person"
danisan2
Pues yo trabajo con sistemas de vision artificial y ejecución de algoritmos en aplicaciones destinadas a la robotica y viendo a la velocidad que transcurren las escenas, el numero de objetos que son los algoritmos capaces de reconocer, y la cantidad de ellos que hay en algunas escenas, pienso que el sistema falla mas bien poco. Skynet esta a la vuelta de la esquina 😂😂😂😂