Muchos humanos (los más versados en cocina) son capaces de hacernos una idea aproximada del aspecto que debería tener un plato tan sólo en base a la lectura de su receta, sin que nadie tenga que describirnos el resultado final.
Hasta ahora, eso era algo que la inteligencia artificial no era capaz de hacer: lo más parecido es la tecnología que Microsoft presentó hace un año, capaz de formar imágenes a partir de su descripción, pero no contábamos con IAs capaces de "imaginar" todo el proceso de cocinado. Hasta ahora.
Y es que un equipo de científicos de la Universidad de Tel Aviv ha publicado una serie de algoritmos capaces de generar fotos falsas de alimentos a partir de recetas de texto, siempre que éstas recojan detalladamente los ingredientes y el proceso de preparación. En palabras de Ori Bar El, director del estudio:
"Nuestro sistema coge como input una receta y genera, desde cero, una imagen que refleja los alimentos que el sistema 'cree' que esa receta describe".
El secreto está en la GAN
Para evitar que la IA "hiciera trampa", incluso se le impidió tener en cuenta el título de la receta, pues podía resultar demasiado descriptiva por sí misma.
"La relación entre el texto de la receta (sin su título) y el contenido visual de la imagen es vaga", como explica el resumen del paper publicado por los investigadores. Establecer dicha relación requiere de una capacidad de abstracción que no estamos acostumbrados a pensar que la IA pueda emular.
El primer paso de este proceso tiene lugar cuando la IA analiza el texto de la receta para convertirlo en vectores numéricos, un proceso denominado "incrustación de texto" que permite a la IA "entender" la receta encontrando elementos similares entre sí.
Tras ese paso, entran en funcionamiento las redes generativas antagónicas (GAN), dos redes neuronales en la que una va realizando propuestas de interpretación gráfica de la receta y la otra va analizando dichas imágenes y comparándolas con otras descripciones de más de 50.000 fotos reales de alimentos.
Este proceso que se se repita una y otra vez hasta dar con una imagen lo suficientemente realista y ajustada a la receta (según el algoritmo).
Mejor una sopa que una hamburguesa
No, no hablamos de aspectos nutricionales. Sino que, por lo que han mostrado los investigadores, a este sistema de generación de imágenes se le dan mejor unos platos que otros.
Y es que la IA hace un trabajo bastante bueno al abordar alimentos como sopas y arroces, pero cuando le toca generar imágenes de asados o hamburguesas, alimentos que poseen formas más definidas, el resultado es parecido a un experimento fallido de 'Cocina para torpes'.
Pero ellos lo justifican con el uso de fotos de baja calidad como materia prima para el entrenamiento de las redes neuronales En el propio paper afirman que
"esto se refleja en muchas imágenes borrosas con malas condiciones de iluminación que parece como si fueran gachas de avena y el hecho de que las fotos no son cuadradas, lo que dificulta la formación de los modelos".
En el estudio también se recoge la encuesta realizada a 30 personas para valorar (del 1 al 5) las imágenes generadas: de media, obtuvieron un 2,9 en el apartado de ejecución de la receta presentada por la IA (en relación a la receta real) y un 3,7 cuando valoraron el realismo de las imágenes.
En cualquier caso, estamos ante una novedad en el campo de la IA que, sin duda, puede cambiar el modo en que analizamos y creamos imágenes.
Ver todos los comentarios en https://www.xataka.com
VER 0 Comentario