¿Recordáis el 'mannequin challenge', ese reto viral que tanta popularidad alcanzó a finales de 2016 y que consistía en que un grupo de personas se mantuvieran totalmente inmóviles mientras eran grabados por una cámara en movimiento? Quizá tú mismo participaste en el reto y subiste tu vídeo a Youtube.
Pues bien, si fue así, enhorabuena por tu contribución a la ciencia. No, no has leído mal: un equipo de científicos de Google AI ha estado usando miles de esos vídeos para entrenar una red neuronal en una habilidad que los humanos disponemos de manera innata, la comprensión de escenas tridimensionales.
Tu imagen puede estar circulando por Internet por el bien de la ciencia
Esta habilidad, que nos permite calcular distancias entre elementos, resulta también útil para un cerebro artificial: es un modo de mejorar la visión por computador y ayudar a que los robots puedan desplazarse en entornos desconocidos. Y quien dice 'robots', dice cualquier clase de vehículo autónomo. De ahí el interés de los científicos en lograr avances en este campo.
Bien, pero ¿por qué recurrir precisamente a vídeos del Mannequin Challenge? Porque ofrece la visión de elementos estáticos (las personas participantes en el reto, vamos) desde todos los ángulos, lo que convierte este material es una magnífica fuente de datos para comprender a interpretar la profundidad en una imagen 2D.
Así, los investigadores convirtieron 2000 vídeos en imágenes 2D con datos de profundidad de alta resolución, y usaron todo eso para entrenar una red neuronal. Esto permitió a la red predecir la profundidad de los objetos en un vídeo con una precisión mayor que cualquier técnica anterior.
Según explican los científicos en el paper de la investigación,
"A la hora de realizar la labor de inferencia, nuestro método toma como referencia puntos estáticos para calcular el paralaje y predecir la profundidad de cada elemento".
Esos datos han sido publicados por los científicos de Google AI para ofrecer libre acceso al dataset y facilitar nuevas investigaciones. Así que una imagen tuya de 2016 puede estar difundiéndose por la Red a mayor gloria de la investigación científica, piensa en ello.
Esto es relativamente habitual: muchos de los datasets más relevantes usados en la investigación de la IA han sido recopilados a partir de fuentes abiertas de datos como Wikipedia, Flickr y Twitter, las únicas capaces de aportar las grandes cantidades de información necesaria para entrenar sistemas de deep learning.
Vía | MIT Technology Review
Imagen | Pixabay
Ver todos los comentarios en https://www.xataka.com
VER 4 Comentarios