Lo que puedes ver en este vídeo que se ha publicado recientemente en Twitter no es ninguna cámara rápida de alguien, ni tampoco un vuelo de dron grabando vídeo con agilidad. Es un escenario tridimensional, creado por una red neuronal de renderizado a partir de unas cuantas fotografías estáticas. A principios de 2020 veíamos algo similar, pero la mejora respecto a entonces es enorme.
Unas fotos desde ahí, otras desde allá y ya tenemos la escena montada
ADOP: Approximate Differentiable One-Pixel Point Rendering
— AK (@_akhaliq) October 14, 2021
abs: https://t.co/npOqsAstAx pic.twitter.com/LE4ZdckQPO
Como puedes ver en el vídeo, el detalle es tremendo (especialmente en las letras de la placa del barco en el minuto 1:18). El motor se llama ADOP (Approximate Differentiable One-Pixel Point Rendering) y se expone en la web ArXiv de la Universidad de Cornell, desde donde detallan que el escenario se genera a partir de fotografías tomadas arbitrariamente. Un motor adicional se encarga de ir modificando la tonalidad de cada fotografía para que el resultado quede uniforme.
De cada fotografía se tienen en cuenta variables como el balance de blancos o la exposición de la cámara, y por supuesto la posición y la dirección a la que apunta el objetivo. ADOP es capaz de gestionar más de 100 millones de puntos en tiempo real. Es algo similar a lo que logró Denis Shiryaev con los fotogramas del vídeo calificado como el más antiguo jamás grabado:
Rodolfo Rosini, fundador de la inversora ConceptionX, ha difundido el vídeo mencionando algunas posibles aplicaciones de esta tecnología. Con escenarios reproducibles a resoluciones tan altas piensa en replicar conciertos o eventos de gran envergadura, o crear escenarios realistas en videojuegos o películas.
También podemos pensar en las posibilidades de estos motores usando fotografías tomadas con smartphones avanzados, con sensores LiDAR. Podríamos ser capaces de generar un escenario tridimensional navegable de lo que queramos a base de unas cuantas fotografías tomadas alrededor. O como dice Rosini, "poder rotar el ángulo de las fotos" que tengamos en nuestro carrete. ¿Quizás a Google le interese esta tecnología para futuras versiones de Street View?
Ver 10 comentarios
10 comentarios
ppcc
La noticia es incorrecta.
Como explican el su página web (https://arxiv.org/abs/2110.06635), los inputs son imágenes y una nube de puntos, es decir, un modelo 3D.
Lo que haría este programa es mapear las imágenes como texturas en el modelo 3D, no generar el modelo 3D. Y lo que destacan es el filtrado de esas imágenes, es decir, que diferentes fotos con exposiciones algo variables se vean fluidas al mezclarlas.
igor_g
Tiene muy buena pinta pero la foto con la que se compara en las paradas tendría que ser una foto que no se ha utilizado en la edición, si no sería trampa.
Me explico, tenemos 5 fotos desde distintos ángulos, el algoritmo calcularía todas las fotos intermedias, pero la foto con la que se comparan los resultados con la realidad debería ser distinta a cualquiera de las 5 fotos iniciales.
canrauxa
Es bueno...pero todavía perceptible por el cerebro humano.
Cada vez estamos más cerca de una realidad virtualizada. ¿O estamos ya dentro de ella?
(me ha quedado un comentario digno de El Guardián de las Estrellas...)
siliconbrain
Increíble cuando podamos crear escenarios a partir de nuestras antiguas fotos y vivir una experiencia inmersiva 3d dentro de la foto, y si a eso le añadiremos la animación de la misma, poder dialogar o interactuar con el escenario y quien sabe que más.
El abanico de posibilidades es muy amplio. Cuando puedes crear una realidad paralela, lo puedes llegar a crear todo.
raist1
Lo de generar entornos 3D a partir de fotografías se llama fotogrametría y se viene haciendo hace tiempo. Cada vez es más fácil y se puede hacer incluso con fotos de un móvil, pero es un proceso que requiere mucha potencia de cálculo, RAM,...
Se utiliza para modelos de juegos, pelis, rehabilitación de edificios antiguos, metrología,...
¿Por qué creeis que los de Epic Games acaban de comprar a Reality Capture?
catusmalvatus
¿Sabe el autor lo que son las redes neuronales y en qué consiste exactamente la mal llamada y terriblemente sobrevalorada "inteligencia artificial" ?
asfwe
A ver como son los juegos de ps6 si la cosa sigue así xD