Los motores de inteligencia artificial generativa como Stable Diffusion llevan meses mostrando su espectacular potencial a la hora de crear imágenes alucinantes, pero hasta ahora su funcionamiento parecía requerir recursos ingentes. Qualcomm acaba de demostrar que sus chips se bastan y se sobran para ofrecer dicha opción.
De la nube al PC y al móvil. El modelo de Stable Diffusion hace uso de más de 1.000 millones de parámetros, y eso parecía obligar a que estuviese confinado en la nube o usado en PCs con potentes tarjetas gráficas capaces de manejar ese caudal de datos. Ahora Qualcomm ha logrado realizar diversas optimizaciones en ese modelo y ha mostrado que es posible usarlo en un smartphone Android.
La optimización es clave. Como explican en Qualcomm, tomaron de partida el modelo Stable Diffusion v1-5 FP32 de Hugging Face y realizaron optimizaciones mediante cuantización (para reducir el modelo), compilación y aceleración hardware. Con ello lograron que el modelo, normalmente gigantesco en requisitos de almacenamiento, pudiera ejecutarse en un móvil gobernado por un Snapdragon 8 Gen 2.
Casi como lo usaras en la nube. Todos esos procesos permiten que Stable Diffusion genere imágenes de 512 x 512 píxeles con 20 pasos de inferencia en menos de 15 segundos, lo que según Qualcomm es comparable a la latencia que plantean los servicios en la nube que ofrecen esa generación de imágenes.
Esto es, sobre todo, una demo técnica. Poder usar Stable Diffusion en el móvil es sin duda sorprendente, pero aquí Qualcomm ha querido demostrar lo que son capaces tanto sus chips —en especial con el Hexagon integrado en los SoC Snapdragon— como su plataforma de desarrollo de servicios de IA.
La era del "Edge AI". Esto, afirman en la compañía, abre las puertas de esa nueva era de la inteligencia artificial en local, en el dispositivo, o como lo llaman los sajones, el "filo" ("Edge"). Hemos visto como empresas como Apple por ejemplo presumen de que Siri puede funcionar en local y sin conexión a la nube, y aquí Qualcomm plantea esa opción pero para propósitos más ambiciosos como el de las IA que generan imágenes.
Del móvil al coche. Y eso lleva a un futuro en el que este tipo de procesos sean factibles en otras plataformas como gafas de realidad mixta o coches conectados. "Ejecutar todo el procesamiento IA en la nube es demasiado costoso, y por eso el procesamiento eficiente de IA en local es tan importante". De hecho, hay otra ventaja más: la privacidad. Este tipo de demos evitan tener que usar servicios en la nube y que estos recolecten más datos de nuestra actividad.
Ver 5 comentarios