La herramienta de conversión de imágenes a tres dimensiones leva presente en Facebook desde hace unos años. Con la popularización de los smartphones con doble cámara que permiten capturar profundidad, llegó esta opción para crear imágenes con curiosos efectos 3D para la plataforma. Ahora la red social anuncia que su algoritmo ya puede convertir cualquier fotografía en 3D, aunque no se tenga información de profundidad sobre ella.
Según ha anunciado la compañía, los ingenieros del departamento de inteligencia artificial de Facebook han mejorado el algoritmo para que entienda mejor las fotografías y la profundidad que hay en ellas. Dicen haber enseñado a una red neuronal a cómo entender y descubrir las tres dimensiones de una fotografía aunque se hayan tomado con cámaras de una sola lente.
Ni son los primeros ni son los últimos en generar fotografías con profundidad usando una sola cámara y procesamiento por software. El ejemplo más claro de ello son las primeras generaciones del Pixel de Google, donde con una sola lente en la parte trasera se podía obtener un mood bokeh/retrato desenfocando el fondo. Incluso es posible hacer el desenfoque (que en cierto modo es darle profundidad) sólo con Google Fotos. Aparte de Google, Nvidia también ha hecho sus avances en este sentido.
Cuestión de entender la escena (y ver muchas fotos)
La compañía ha explicado en líneas muy generales cómo se las ingenia la red neuronal para entender que hay profundidad en la imagen. De un modo parecido al humano, que aunque ve una fotografía en 2D, es capaz de entender que existe una profundidad porque conoce los objetos y sujetos de la fotografía y puede ponerlos en contexto. Además de valerse de las luces, sombras, superposiciones y perspectivas que aparecen.
Facebook dice usar diferentes técnicas para conseguir esto. Por ejemplo explican que han entrenado a la IA con "millones de fotografías 3D públicas" para que entienda los mapas de profundidad. También se ha aprovechado todo el bagaje del ecosistema Facebook y técnicas previamente desarrolladas en fotografía móvil. En un ejemplo mostrado por Facebook vemos cómo una fotografía frontal de la Fontana di Trevi se convierte en un mapa 3D respetando la posición de las columnas y el resto de elementos arquitectónicos en su correcta posición.
Según explican los ingenieros de Facebook, este nuevo algoritmo hace que las fotografías 3D sean "fácilmente accesibles por primera vez a muchos millones de personas". Dado que siguen habiendo muchos usuarios con smartphones con una sola cámara, con la herramienta será posible obtener la profundidad de las fotos tomadas. Eso sí, habrá que verlo en la práctica, aunque de momento los ejemplos dados por Facebook parecen prometedores.
La herramienta de Facebook para convertir fotografías 2D en 3D es gratuita y está disponible en la app de la red social. Comenta Facebook que lo único que se requiere es que se utilice un iPhone 7 o superior, en caso de ser un Android uno de gama media reciente es el requisito mínimo.
Más información | Facebook AI
Ver 1 comentarios