De Aquiles al compositor ruso Chaikovski, de quien se cuenta que era tan rematadamente tímido que le resultaba imposible dirigir sus propias sinfonías, todos tenemos nuestros puntos débiles. Quizás se trate del cálculo, la memoria, una incapacidad patológica para recordar fechas o bailar con menos ritmo que una marioneta de hojalata… Puede que te ocurra también lo que a las inteligencias artificiales (IA) generativas y seas incapaz de dibujar cierto detalles.
Que a IAs como Midjourney, Stable Diffusion o DALL-E2 se les da bastante bien generar imágenes no es ningún secreto. Premios hay que lo demuestran, como el de pintura que ganó en 2022 Jason Allen en Colorado con ayuda de Midjourney u otro más reciente, de fotografía, conquistado por Absolutely Ai echando mano también de una IA. En ambos casos, por cierto, con polémica incluida.
Con un simple vistazo a sus creaciones, cada vez más impresionantes, más logradas, precisas y detalladas, queda clara su potencial. Y sin embargo… y sin embargo muchas inteligencias artificiales han encallado cuando intentaban representar algo tan "simple" y a priori anodino como unas manos.
Sus tropezones artísticos son tan épicos que por la red circulan antologías varias, imágenes que muestran extremidades con un número imposible de dedos, manos que más parecen muñones, uñas que harían correr a cualquier en busca de ayuda médica o articulaciones turbadoras que recuerdan a aquella arquitectura de geometría no euclidiana que, escribía Lovecraft, se alza en la terrorífica R´lyeh.
Semejante "talón de Aquiles" no pasó inadvertido para los desarrolladores y lo cierto es que en su V5 Midjourney ha logrado una mejora bastante notable. Quizás cometa aún algunos errores en las composiciones más complejas, pero el avance es notable: manos más realistas, anatómicamente correctas… con sus cinco dedos.
En lo que todavía parece encallar la inteligencia artificial generativa es otro punto débil, uno tan o más inesperado incluso que las manos: los monociclos.
¿La razón? El programador Rasmus Lerdof deslizaba hace poco, en un tuit que acompañó de una secuencia de imágenes con monociclos imposibles, que quizás la IA no acabe de entener de qué va eso de un vehículo de una sola rueda y a pedales. "Aparentemente, es difícil para una IA comprender cómo funciona un monociclo", reflexiona Lerdorf, acompañando su comentario del hashtag #midjourney 5.
No es el único que ha llegado a semejante conclusión. "No me preguntes cómo descubrí esto, pero el nuevo 'la AI no puede hacer manos' es 'la AI no puede hacer monociclos'", publicaba hace unos días Luke Bailey, también en Twitter, frase que acompañaba de nuevo de una colección de imágenes casi oníricas en las que se muestra a gente pedaleando sin pedales, en el aire, o modelos sin sillín.
No son los únicos fallos. En la selección de Lerdof se ven ruedas deformes, posturas imposibles, gente sentada directamente encima o delante de la rueda, poses forzadas, pedales que están donde no deberían… Una variedad de diseños imposibles que apuntan al nuevo punto débil de la inteligencia artificial.
Al fin y al cabo para mejorar es importante detectar las flaquezas, ¿no?
Imagen de portada: Noel Nichols (Unsplash)
Ver todos los comentarios en https://www.xataka.com
VER 5 Comentarios