He creado estas imágenes solo con la voz y la nueva función de Gemini. Estoy impresionado con los resultados

Crear imágenes nunca había sido tan fácil, sencillo y preciso en Android

Google acaba de implementar el motor de creación de imágenes Imagen 3 en Gemini, abriendo las puertas a que cualquier usuario de esta inteligencia artificial pueda crear imágenes. Esta IA se puede usar en la web, pero su potencial en móviles me parece algo bastante salvaje. En mi caso, tengo Gemini como remplazo a Google Assistant, por lo que me basta con pulsar el botón de encendido para activarla.

Al abrir Gemini directamente, puedo darle instrucciones con la voz, y no necesito escribir el prompt. Darle a un botón y decirle que "genere una imagen de un Mercedes SLR McLaren en un circuito de velocidad" y que la cree a la perfección es algo que no esperaba.

Imagen 3 es la nueva versión del modelo de inteligencia artificial que, a partir de ahora, utilizará Gemini para generar imágenes. Es la versión más reciente y, según Google, ha mejorado estos tres pilares respecto a versiones anteriores:

  • Las imágenes tienen mucho más detalle y menos imperfecciones.
  • Las imágenes son mucho más realistas que antes.
  • Ahora es posible generar imágenes con muchos más estilos.

Usar Imagen 3 en Gemini es más que sencillo. Solo tienes que descargar la app de Gemini desde Play Store, y generar el prompt. Puede ser escrito, pero hacerlo con voz es mucho más cómodo.

Como buen amante de los coches, le he pedido a Gemini que genere una imagen de un Mercedes SLR McLaren en un circuito de velocidad. He escogido este modelo por ser bastante particular a nivel de diseño y, para mi sorpresa, lo ha recreado -casi- a la perfección. Se sigue notando que es una imagen generada por IA, pero para ser una foto creada en cinco segundos con mi voz, ni tan mal.

En la segunda imagen, he creado algo más sencillo, un perro y un gato caminando juntos. El bokeh que ha creado es sencillamente espectacular y, a nivel de nitidez, la imagen es brutal.

Para complicarle un poco y ver cómo interpreta los estilos, le he pedido una calle de una calle de Nueva York, con luces de fondo y al estilo CyberPunk. El resultado, de nuevo, es sorprendente.

Como fin de fiestas, le he pedido la imagen de un iMac, en un escritorio, y en cuyo fondo de pantalla aparece la palabra 'Xataka'. La generación de texto es todo un problema para muchas IAs gratuitas. No es el caso de Imagen 3. Tampoco tiene problemas para generar logos de marcas, aunque aquí no es tan fino.

Imagen | Xataka

En Xataka | 19 páginas y servicios para crear imágenes desde cero utilizando inteligencia artificial

Ver todos los comentarios en https://www.xataka.com

VER 1 Comentario

Portada de Xataka