Large 2 es el nuevo modelo de lenguaje de Mistral. Es una oda europea a la eficiencia

Logra resultados similares o superiores a Llama 3.1 de Meta con menos de un tercio de sus parámetros. Y pone a Europa en el mapa de la IA

Mistral Dest
10 comentarios Facebook Twitter Flipboard E-mail

Mistral AI, la prometedora startup francesa de IA respaldada por Microsoft, ha anunciado Large 2, su nuevo modelo de lenguaje, el más potente hasta la fecha. Busca competir con los últimos lanzamientos de Meta u OpenAI.

Por qué es importante. Este anuncio no solo demuestra la rápida evolución de Mistral, joya nacional francesa y esperanza europea en la IA de solo un año de vida, sino que también desafía a las grandes empresas estadounidenses de su sector, mucho más establecidas y capitalizadas.

Los detalles:

  • Arquitectura: Large 2 tiene 123.000 millones de parámetros. Es menos de un tercio que Llama 3.1 de Meta (405.000 millones), lanzado un día antes.
  • Contexto amplio: ofrece una ventana de contexto de 128.000 tokens, equivalente a unas 300 páginas de texto, igualando a competidores como GPT-4.
  • Rendimiento: supera a modelos como Claude 3.5 Sonnet y se acerca al rendimiento de GPT-4o en tareas de codificación o matemáticas, según las pruebas sintéticas.
  • Versatilidad: puede generar código en más de 80 lenguajes distintos con alta precisión.
  • Políglota: soporta docenas de idiomas, incluyendo francés, alemán, italiano, español, portugués, árabe, ruso, chino, japonés o coreano.

Enfoque en la eficiencia. Mistral ha puesto mucho énfasis en la eficiencia de Large 2. Pese a su tamaño reducido en comparación a Llama 3.1 consigue un rendimiento similar o superior en varias métricas.

Esto puede traducirse en menores costes de implementación y operación paralos usuarios finales.

Comparativa con otros modelos. Large 2, al igual que Llama 3.1 (no disponible en Europa), no es completamente open source en el sentido tradicional. Su uso está permitido sin licencia para fines no comerciales y de investigación, pero cualquier uso comercial requiere el pago de una licencia. Este enfoque híbrido se está convirtiendo en la norma para los modelos de IA.

Disponibilidad y acceso. Large 2 está disponible a través de 'la Plateforme' de la empresa, bajo el nombre "mistral-large-2407". También se puede acceder mediante nubes corporativas: Google Cloud (Vertex AI), AWS (Bedrock), Azure (AI Studio) e IBM (watsonx.ai).

Los interesados también pueden experimentar con la prueba gratuita del modelo en 'le Chat', el rival de ChatGPT desarrollado por Mistral.

Implicaciones. El rápido avance de Mistral intensifica la competencia, marca la diferencia en su eficiencia y ayuda a democratizar la IA avanzada, disponible en varias plataformas.

Además, pone a Europa en el mapa de la IA, dominado por estadounidenses y chinos.

En Xataka | Siete estupendos usos que puedes darle a Meta AI en WhatsApp (y por qué este asistente se diferencia de cualquier otro)

Imagen destacada | Mistral, Mockuuups Studio

Inicio