OpenAI parece estar marcando el ritmo del desarrollo de la IA generativa. Después del lanzamiento de ChatGPT en noviembre de 2022 asistimos al lanzamiento de una oleada de chatbots alternativos como Gemini de Google y Claude Chat de Anthropic.
La compañía dirigida por Sam Altman presentó en febrero de este año un generador de vídeos llamados Sora. Y claro, el movimiento de la industria ha sido fácil de predecir: las compañías tecnológicas están trabajando para entrar a competir en la generación de vídeo.
Un generador de vídeos ‘Made in China’
El material que OpenAI mostró de Sora dejó a muchas personas sorprendidas, incluidos editores de vídeos profesionales. Hasta el momento no habíamos visto nada parecido. El modelo no solo podría generar vídeos, sino también simular nuestro mundo.
Pero, al igual que está sucediendo con los chatbots, tenemos razones para creer que es cuestión de tiempo que aparezcan herramientas con similares capacidades. Adobe ya está trabajando en su propio generador de vídeos, pero no todo nace en Estados Unidos. Las compañías chinas también están trabajando incansablemente en este sentido.
La Shengshu Technology y la Universidad de Tsinghua han presentadoal mundo un generador de vídeos llamado Vidu. Estamos frente a una herramienta basada en inteligencia artificial que convierte indicaciones textuales simples en fragmentos de vídeo de hasta 16 segundos de duración (frente a los 60 segundos de Sora) con una resolución máxima de 1080p.
Como podemos ver en el vídeo de arriba, la compañía asiática no duda en comparar indirectamente su herramienta con la desarrollada por OpenAI. En otras palabras, han tomado el concepto de algunos de los clips de Sora y nos han mostrado cómo se verían con Vidu.
Se trata de escenas con cierto grado de complejidad para una IA. Por ejemplo, un ojo humano en plano detalle, un vehículo pasando por un bosque, televisores apilados, una mujer caminando de noche por una ciudad iluminada por luces de neón, entre otras escenas.
A simple vista Sora parece ser una herramienta capaz de arrojar resultados de mejor calidad. Sin embargo, en este punto debemos hacer una importante mención: ninguna de las dos alternativas está abierta al público en general, por lo que no hemos podido probarlas.
Los creadores de Vidu señalan que su modelo tiene una serie de características muy destacadas. Aseguran que, al igual que Sora, puede simular el mundo físico. También dicen que puede crear escenas consistentes y que es capaz de comprender elementos chinos.
Imágenes | OpenAI | Shengshu-ai
Ver 5 comentarios