Meta se une a la fiesta de DALL-E y presenta su propio generador de imágenes a partir de texto

15 julio 2022, 20:30

Javier Marquez

A DALL-E le empiezan a aparecer rivales. La inteligencia artificial (IA) de Open AI no está sola en el campo de generar imágenes a partir de cualquier texto. Hace unas semanas veíamos como Google Research presentaba IMAGEN y recientemente un laboratorio de investigación independiente daba a conocer Midjourney. Ahora es el turno de Meta y su propuesta llamada "Make-A-Scene"

La IA de la compañía liderada por Mark Zuckerberg, según explica en una publicación de blog, tiene una esencia artística ya que los resultados se asemejan al trabajo realizado a mano por una persona (y se basan en ellos). Permite a los usuarios "crear una pintura digital sin siquiera tomar un pincel" y está pensada para, en el futuro, potenciar la creatividad de artistas y no artistas por igual. Veamos.

Cómo funciona la nueva IA de Meta para generar imágenes

Make-A-Scene tiene un funcionamiento algo diferente a las otras IA que hemos visto en los últimos meses. IMAGEN, por ejemplo, funciona con un modelo de difusión, utilizado también para otras tareas, como la de aumentar la resolución de imágenes, que genera una representación ultrarrealista a partir de texto. La solución de Meta, en cambio, requiere de una composición o bosquejo como base.

Pero, ¿qué es eso de la base? Según la compañía, es parte de un nuevo concepto de investigación que busca abordar uno de los mayores problemas de los generadores de imágenes de su tipo: el que no reflejan exactamente lo que pedimos. Por ejemplo, si ingresamos el texto "una pintura de una cebra andando en bicicleta", en el resultado, la bicicleta podría estar mirando hacia otro lado y la cebra ser demasiado grande o pequeña.

¿La solución? Guiar a la IA con un bosquejo que le permita delimitar claramente su área de trabajo. Como podemos ver en las imágenes no es un trabajo demasiado elaborado. En este sentido, el modelo se enfoca primero en aprender los aspectos clave de la imagen base para después generar la representación artística en base al texto ingresado en imágenes de 2048 x 2048 píxeles.

Make-A-Scene no solo está pensada para artistas, asegura Meta. El jefe de programas de la compañía, Andy Boyatzis utilizó la IA con sus hijos de dos y cuatro años. Uno de ellos preparó un bosquejo para la entrada de texto "A monster robot bear riding a train" y el resultado fue muy interesante y bastante preciso, pues se mostraba con un aspecto nada delirante al oso mecánico montado sobre un tren.

En Xataka

Una inteligencia artificial ha escrito e interpretado un monólogo de Seinfeld. El resultado es asombroso

Esta IA de Meta, al igual que muchas otras que se encuentran en desarrollo, está limitada a pruebas cerradas. La compañía ha brindado acceso, de momento, a un puñado de artistas, pero no ha especificado si más adelante estará abierta para todos. "Continuaremos ampliando los límites de lo que es posible utilizando esta nueva clase de herramientas creativas", aseguran, por lo que posiblemente en un tiempo sepamos más sobre sus avances.

En Xataka | Las IA tienen un problema: son opacas y cerradas. BLOOM es el gran proyecto open source que quiere cambiarlo todo

Ver todos los comentarios en https://www.xataka.com

VER 0 Comentario

Portada de Xataka