A principios de este año, DALL-E 2 nos mostraba su enorme capacidad para generar imágenes a partir de cualquier texto y una notable mejora con respeto a la primera generación. Sin embardo, durante todos estos meses, esta inteligencia artificial de OpenAI ha tenido una importante limitación: las condiciones de uso impedían que los investigadores que tienen acceso a ella pudieran compartir imágenes de rostros autogenerados, pero esto acaba de cambiar.
Como recogen nuestros compañeros de Genbeta, DALL-E 2 ha sido capaz de generar rostros fotorrealistas desde un principio, pero los responsables del proyecto no permitían su circulación puertas afuera debido al riesgo de creación de deepfakes y contenido falso. Entonces, ¿qué ha cambiado para que los investigadores puedan compartir rostros autogenerados? OpenAI ha implementado una serie de cambios para mejorar la seguridad de esta tecnología.
DALLE-2 puede generar rostros, pero con estas limitaciones
Para reducir los riesgos, OpenAI asegura que DALL-E 2 ahora impide que los investigadores puedan generar rostros fotorrealistas a partir de cualquier "cara realista". Además, la plataforma rechaza cualquier intento de generar rostros de celebridades y figuras públicas. Cabe señalar que anteriormente no se permitía generar rostros de figuras políticas destacadas, pero tras esta actualización, las limitaciones comprenden a cualquier personalidad famosa.
En todo momento hablamos de investigadores porque, a diferencia de DALL-E Mini, DALL-E 2 está actualmente en una fase cerrada de pruebas, por lo que aún no está disponible para el público en general. Incluso, quienes tienen acceso a esta tecnología todavía tienen ciertas limitaciones. No obstante, en las redes sociales se pueden encontrar numerosos ejemplos sobre su funcionamiento. Y algunas publicaciones nos dejan ver cómo se ven los rostros fotorrealistas generados por esta tecnología.
Danielle Baskin, a través de la cuenta de Twitter @djbaskin_images describe cómo ha utilizado DALL-E 2 para generar rostros fotorrealistas con diferentes diseños de maquillaje. "Agregué la frase 'amarillo neón geométrico triangular' a mis indicaciones y obtuve estas increíbles ideas para el cabello y el maquillaje", dice, y añade "cuando miras a los ojos [a las imágenes generadas], sabes que se trata de inteligencia artificial".
Un ejemplo de cómo se puede utilizar DALL-E 2 para generar imágenes a partir de otra imagen lo podemos ver en un Tweet de Ken Kocienda. Partiendo de la famosa pintura de Johannes Vermeer 'La joven de la perla', este usuario pidió generar una escena de estudio, con fotógrafos, cámaras en trípodes y muchas luces, eso sí, en "pintura al óleo extremadamente detallada". El resultado, que es sorprendente, deja en evidencia el potencial de este tipo de herramientas en constante evolución.
Detrás de DALLE-2 está GPT-3, un poderoso modelo de lenguaje presentado en 2020 capaz de generar diversos tipos de contenido a través de indicaciones escritas, y un modelo de "difusión", que comienza con un patrón de puntos aleatorios y altera gradualmente ese patrón para generar una imagen cuando reconoce aspectos específicos. En este campo también nos encontramos con otras propuestas prometedoras, como la recientemente presentada Parti de Google, que utiliza un modelo autorregresivo" y permite permite entradas de texto más extensas.
Ver todos los comentarios en https://www.xataka.com
VER 8 Comentarios