Meta acaba de lanzar su modelo de inteligencia artificial (IA) más grande y avanzado. Estamos hablando de Llama 3.1, una propuesta de “código abierto” que rivaliza directamente con GPT-4o de OpenAI y Claude 3.5 Sonnet de Anthropic, superándolos en varios puntos de referencia utilizados comúnmente por la industria para evaluar el rendimiento y la eficiencia de estas tecnologías.
El nuevo modelo insignia de la compañía de redes sociales aterriza en Meta AI, el asistente de IA que está presente en WhatsApp, Facebook e Instagram en algunos mercados, pero que todavía no tiene una fecha de llegada a los países que integran la Unión Europea (UE). No obstante, aquellos con hardware compatible pueden descargarlo desde cualquier parte del mundo para utilizarlo de manera local.
Sobresaliente en matemáticas, traducción y más
Como sabemos, no todos los modelos son perfectos para todo. En este caso, nos encontramos con una alternativa que, según Meta, destaca en conocimientos generales, matemáticas, uso de herramientas y traducción multilingüe. Como podemos ver en la imagen de a continuación, Llama 3.1 405B (405.000 millones de parámetros) destaca en varios aspectos frente a sus principales competidores.
Pero Llama 3.1 no es únicamente este enorme modelo de lenguaje. La compañía también ha lanzado versiones de tamaño reducido que pueden ser muy útiles para un abanico de tareas más concreto. Llama 3.1 70B apunta a la creación de contenido, la IA conversacional, la comprensión de idiomas y las aplicaciones empresariales. Puede desde resumir texto hasta generar código de programación.
Llama 3.1 8B es la más pequeña de las alternativas. Con 8.000 millones de parámetros, puede ejecutarse en ordenadores menos potentes. Por su parte, también promete ser muy útil en el análisis y la clasificación de textos. Aquí destaca la velocidad de las respuestas. No sabemos cuántos parámetros tiene el nuevo GPT-4o mini de OpenAI, pero probablemente podrían competir en la misma categoría de soluciones.
El enfoque abierto de Llama 3.1
La compañía liderada por Mark Zuckerberg lleva trabajando desde hace tiempo en modelos de “código abierto”, aunque no todos están de acuerdo con la utilización de este término. Algunos apuntan a que la licencia de los mismos tiene limitaciones que no permiten que sea catalogado de esa manera. Llama 3.1, precisamente, vuelve a hacer uso del “código abierto”, con novedades a nivel de licencia.
El último modelo de la compañía está disponible para uso gratuito, incluso con fines comerciales, a menos que esté expuesto a cientos de millones de usuarios. Zuckerberg, de hecho, ha publicado una carta en la que ha señalado que “la IA de código abierto es el camino a seguir” y que los modelos de código abierto son cada vez mejores y que acabarán superando a los modelos cerrados en algún momento.
Tener la posibilidad de descargar un modelo de estas características para utilizarlo con cierta libertad no es algo menor. La preparación de Llama 3.1 405B ha requerido de varios meses de entrenamiento con 16.000 tarjetas gráficas NVIDIA GPU H100. Meta, además, ha liberado los pesos del modelo para que las empresas puedan entrenarlo con datos personalizados y ajustarlo a sus propias necesidades.
Más allá de que las variantes de este modelo puedan ejecutar localmente, vivimos en un mundo donde la computación en la nube es una realidad. Mover un coloso de 405.000 millones de parámetros no es algo que pueda hacerse con cualquier hardware. Aquí, precisamente, los clientes empresariales podrán contratar diversos servicios, como AWS, Google Cloud, Databricks o Microsoft Azure.
¿Qué está pasando con Meta en la UE?
Estamos siendo testigos de la intención de la UE de imponer estrictas regulaciones a la industria de la IA. Lo que está sucediendo es que muchas compañías están retrasando sus lanzamientos. Meta, la protagonista de este artículo, anunció hace escasos días que no lanzaría su próximo modelo multimodal en el territorio comunitario debido a la naturaleza impredecible del entorno regulatorio europeo”.
Llama 3.1 tiene disponibilidad global, por lo que los usuarios de los países miembros de la UE podrán utilizarlo, según ha indicado la compañía. No podrán acceder a él a través de ciertas herramientas que, como señalamos arriba, todavía no aterrizan oficialmente en la UE, como Meta AI. Toca esperar para saber cómo evolucionarán los lanzamientos de los productos de IA en la UE.
Imágenes | Meta
En Xataka | Elon Musk enciende el "clúster de IA más potente del mundo". Uno con 100.000 GPUs NVIDIA H100
Ver 14 comentarios