Maxine es la nueva plataforma de Nvidia y llega dispuesta a revolucionar las videollamadas. Se trata de un nuevo servicio en la nube que Nvidia ofrecerá a otros desarrolladores, donde mediante inteligencia artificial se incorporan una serie de efectos para mejorar las videollamadas. No hablamos de unos simples filtros de belleza, sino de aplicar el potencial de los deepfakes a las videollamadas para incrementar "significativamente" su calidad, según explica la compañía.
Entre los curiosos efectos que promete Nvidia Maxine se encuentra la superresolución, la cancelación del ruido de fondo, iluminación facial, reducción del ancho de banda y hasta la corrección de la mirada, para que parezca que siempre estamos mirando a cámara.
Nvidia Maxine: el nuevo objetivo de la IA es mejorar las videollamadas

Aprovechando la GTC 2020, Nvidia ha anunciado actualizaciones sobre cerca de 80 SDKs de su catálogo. Otra de las novedades es Maxine, un servicio para videollamadas que está disponible en beta desde esta semana. Maxine aprovecha las 'redes generativas antagónicas', más conocidas sencillamente como GANs, para analizar la imagen de la videollamada y recrearla parcialmente con el objetivo de introducir una mejora.
Una de las primeras herramientas que ofrece Maxine es la de analizar el rostro de la persona y mediante algoritmos identificar los píxeles clave. Con esto, Maxine promete reducir hasta un 90% el ancho de banda de las videollamadas con el estándar H.264. Consiste en que en vez de emitir todos los píxeles, el servicio emite únicamente los puntos del rostro más importantes y el resto está recreado. En vez de intentar transmitir todos y cada uno de los píxeles, que en muchas ocasiones no ofrecen una imagen precisa, solo se transmite lo estrictamente necesario.

No es la primera vez que vemos una inteligencia artificial recreando el rostro de personas, pues en el pasado ya hemos visto a las GANs haciendo representaciones de lo más realistas, incluso partiendo de una base muy poco sólida como un simple garabato.
Otra de las incorporaciones de Nvidia Maxine es la corrección de mirada. La IA identificar la alineación del rostro y lo ajusta automáticamente recreando las partes faltantes. Maxine promete incluso ser capaz de simular la mirada aunque la cámara no esté directamente enfrente del usuario.
La nueva plataforma de Nvidia añade otras correcciones como una mejora de la iluminación, reducción del ruido ambiental y en general una mejora de la resolución de las videollamadas. Por el momento se trata de una primera versión, pero Nvidia anticipa un futuro donde servicios de videollamadas como Google Meet o Zoom permitan automáticamente transmitir una imagen nuestra mejorada, gracias a la interpretación que hagan de nosotros los algoritmos.
Más información | NVIDIA
Ver 18 comentarios
18 comentarios
togepix
Si si, seguimos con cámaras de 720p en ordenadores de 1500 pavos
pererecuda
Bien. Todavía para hacer más artificial y falso las interacciones digitales. Ahora, se trata de parecer que estamos atendiendo al otro y mirándole a la cara cuando podemos estar mirando al móvil o a la tele. Vomitivo. No entiendo la idea de esto.
danielmartinez8
Hasta una videollamada se va a convertir en algo falso
mord
No es algo tan absurdo como algunos comentan. Con el móvil no se nota, pero con el portatil o el sobremesa hay más diferencia entre la posición de la cámara y la dirección a la que miramos (El centro de la pantalla, donde normalmente vemos a la vez a nuestros interlocutores); de manera que con frecuencia nuestro interlocutor no nos ve "mirarle a él".
Aún más incluso: Tu ordenador de trabajo es un portátil conectado a una pantalla externa más grande que hace las veces de pantalla principal. Sin embargo, la cámara sigue siendo la del portátil, de manera que estás en la reunión y todo el mundo te ve mirando a un lado. Aún gana más puntos extra esta funcionalidad.
Creo que tiene su punto que en las videoconferencias parezca que nuestros interlocutores nos miran (miran a la cámara) como si de youtubers se tratase. Bienvenido sea el invento en lo que a mí respecta.
guillermogimenez
para eso que corten el video y dejen la imagen estatica de la cara en la pantalla
elpableras
Impresionante. Menudo futuro nos espera con la IA. Qué bueno lo bueno y qué malo lo malo.
elindividuo
Lo veo más como demostración de lo que pueden llegar a hacer, porque no lo veo útil en esta aplicación específica. Si digo que lo usaré para completar el rostro y hacer reconocimiento facial con un rostro incompleto es totalmente válido y útil, mucho más que mirar a la cámara en una videoconferencia.
Rawl Draw
Por el camino se harán con una interesante base de datos de caretos perfectamente escaneados
El anti-fanboys
Al fin, es cansado eso de exponer y que te digan que estás leyendo xD
jujuan lolopez
Ya me lo imagino: "Pepe, tienes cara rara... ¿te pasa algo?"
celduques.ulrikvonca
Jajaja se ve tan falso como un videojuego pero mola.
christianramosfonseca
Esos ingenieros de Nvidia están haciendo maravillas con la IA.
freeipad
Pues va a cargarse los softwares que se usan para exámenes online. Una de las cosas que controlan es que no se desvíe la mirada de la pantalla.
aliciamendez
El catfishing que se va a generar a partir de esto va a ser impresionante, solo imaginen a un montón de viejos solitarios pagandole el pasaje a sus novias rubias y blancas en india como 4 veces antes que siquiera se imaginen que los están estafando
death_punch
Es justo lo que necesito, cuando hablo no me gusta estar mirando a la pantalla, se me hace incomodo y suelo mirar al lado o por la ventana.