Han pasado más de dos años desde que OpenAI presentara DALL·E. En 2021, aquel modelo de generación de inteligencia artificial (IA) nos sorprendía por su gran capacidad para generar estupendas imágenes a partir de texto. Estábamos presenciando en directo lo que se convertiría en una carrera que involucraba a varios participantes.
Alternativas como Midjourney y Stable Diffusion aparecieron en escena muy cerca de la llegada de una versión renovada de la propuesta impulsada por la compañía dirigida por Sam Altman, DALL·E 2, y en el último tiempo fueron superándola considerablemente. OpenAI no está dispuesta a perder posiciones, así que ha presentado DALL·E 3.
DALL·E 3, da un enorme salto de calidad y se integra a ChatGPT
Resultaba un tanto curioso pensar que una compañía líder en el mercado de la IA como OpenAI había empezado a perder terreno con su generador de imágenes. DALL·E 2 no era malo, ni mucho menos, pero en este mundo tan dinámico en el que vivimos se había quedado atrás en calidad, versatilidad y arrastraba algunos problemas.
El momento de volver a posicionarse a la vanguardia de modelos de IA para entornos visuales creativos parece que ha llegado para OpenAI. Con DALL·E 3 no solo se abordan algunas de las falencias más notables del modelo anterior (y de los modelos en general), sino que también se lo integra al famoso chatbot conversacional ChatGPT.
Lo último de OpenAI en generación de imágenes por IA nos presenta la posibilidad de aprovechar al máximo las indicaciones complejas. Sabemos que los ‘prompts’ son clave para obtener los resultados que queremos (tenemos una guía de estos para Midjourney), pero la escenas no siempre son tan precisas como nos imaginamos.
Este es uno de los puntos que se pretende solucionar. DALL· E 3 será más cuidadoso a la hora de representar con precisión escenas de objetos específicos. Entonces, ¿tendremos que ser unos auténticos “prompt engineers” para aprovechar al máximo todas sus ventajas? Aparentemente no, y aquí es donde entra en juego ChatGPT.
Al estar integrado en ChatGPT Plus y ChatGPT Enterprise, los usuarios del chatbot podrán pedirle con indicaciones textuales menos elaboradas desde el punto de vista técnico qué es lo que quieren ver. Así se elimina uno de los obstáculos más grandes para aprovechar al máximo esta tecnología desde el punto de vista creativo.
En este momento, está disponible para uso interno (solo para investigadores en calidad de evaluación). No obstante, a partir de octubre se podrá utilizar directamente desde los mencionados chatbots. Recordemos, eso sí, que se trata de alternativas de pago. ChatGPT, la versión gratuita, no tendrá este complemento.
Imágenes: OpenAI
En Xataka: Google Bard se integra en Gmail, Drive o Maps para planificar tus vacaciones (o encontrarte trabajo)
Ver 3 comentarios