Google Veo e Imagen 3: qué son, qué ofrecen y cuándo llegarán estos dos modelos de inteligencia artificial

Te hablamos de los dos nuevos modelos de IA generativa creados por Google, para imagen y vídeo.

15 mayo 2024, 12:51

Yúbal Fernández

Vamos a decirte qué son Google Veo e Imagen 3, dos nuevos modelos de inteligencia artificial presentados por la empresa del buscador. Se trata de dos modelos que serán capaz de crear tanto vídeos como imágenes a partir de tus peticiones.

En este artículo, vamos a explicarte de una manera sencilla qué es exactamente cada uno de estos dos modelos y qué va a ser capaz de hacer. Además, al final también te hablaremos de lo que se sabe sobre su llegada y cuándo podrás probarlos.

Qué es Google Veo

Google Veo es un modelo de inteligencia artificial creado por Google, y que permite generar vídeos a partir de texto. De esta manera, tú le escribes lo que quieres que genere mediante un prompt o comando textual, y Veo lo generará desde cero. Es el modelo de la IA, lo que quiere decir que es la tecnología que luego se usará en los servicios en los que se aplique y se te permita crear los vídeos.

Esta inteligencia artificial es muy similar a los modelos que crean imágenes a partir de texto, y que a la vez se basa en parte de la tecnología de modelos de lenguaje como Gemini. Este sistema es capaz de entender lo que le pides con un lenguaje natural, ya que ha sido entrenada para entender la manera en las que solemos hablar y cómo nos expresamos para pedir o preguntar algo.

Después de entender lo que le has pedido en tu comando o prompt, Veo generará un vídeo en movimiento en el que aparezcan los elementos o características que le hayas pedido. Por lo tanto, va a ser un competidor directo de la IA de Sora creada por OpenAI también para generar vídeo.

Google Veo permite crear clips en resolución FullHD de 1080p, con una duración que puede llegar a más de un minuto. Además de entender el lenguaje natural como te hemos dicho, también entiende términos técnicos y cinematográficos, como "timelapse" o "tomas aéreas de paisajes". Esto te va a permitir describir mucho mejor lo que le pidas.

Los vídeos que se creen con esta inteligencia artificial tendrán una marca de agua que nosotros no podremos ver, pero que en caso de ser necesario permitirá que ciertos sistemas puedan identificarlo. Así, las plataformas online podrán saber siempre que este vídeo está generado por IA.

En Xataka

Qué es Vizard AI, cómo funciona y cómo puedes usar su IA para extraer clips verticales para redes sociales de tus vídeos

Qué es Google Imagen 3

Imagen 3 es la nueva versión del modelo de inteligencia artificial para generar imágenes a partir de texto de la empresa del buscador. Es la evolución de Imagen 2.0, que fue presentada hace solo unas semanas, de manera que marca lo mucho que se está esforzando Google por avanzar en este campo.

Este tipos de sistema de inteligencia artificial entenderán la petició nescrita que le hagas, con lo que le digas que quieres que aparezca en la imagen y otros aspectos como enfoques, texturas, estilos etcétera. Entonces, luego generará una imagen a partir de la interpretación de tu petición.

Imagen 3 destaca porque puede producir imágenes fotorrealistas. También ha mejorado la manera en la que interpreta el lenguaje natural, y sobre todo, la capacidad que tiene para añadir detalles muy específicos a partir de prompts muy extensos. Vamos, que entiende mejor el texto de los prompts y los detalles que puedes añadir en ellos.

Según Google, esta nueva versión de su IA generativa de imágenes te permite tener una mayor gama de estilos para pedirle, y también más precisión a la hora de representar lo que le has pedido.

Por último, Imagen 3 también mejora la representación de textos dentro de la imagen. Porque en las IA de hoy en día, cuando le pides que una imagen tenga un determinado texto puede tardar varios intentos en mostrarlo correctamente, y esto es algo que Google dice haber mejorado en esta versión.

En Xataka

DALL-E 3: 23 ideas, consejos y algún truco para exprimir al máximo tus dibujos con inteligencia artificial

Cuándo y cómo podrás probarlas

Estos dos modelos de inteligencia artificial empezarán a llegar muy poco a poco. Primero estará disponible en acceso anticipado privado solo para algunos creadores seleccionados que usen VideoFX e ImageFX. Aquí, hay una lista de espera y se empezará a activar poco a poco.

No sabemos planes para su llegada al público general, pero está claro que la idea es centrarse primero en los creadores de contenido. Lo que parece claro es que se apostará por ofrecerlos dentro de estas plataformas. Más adelante, Google pretende llevar Veo a YouTube Shorts y otros productos.

En Xataka Basics | 36 funciones y cosas que puedes hacer con Google Gemini

Ver todos los comentarios en https://www.xataka.com

VER 0 Comentario

Portada de Xataka