Mustafa Suleyman lidera el desarrollo de este LLM, llamado MAI-1
Cuenta con 500.000 millones de parámetros, aproximadamente la mitad de GPT-4
Microsoft parece jugar a dos bandas, y eso plantea un futuro incierto para su alianza con OpenAI
La alianza entre Microsoft y OpenAI ha permitido a la primera integrar las opciones de GPT-4 en sus copilotos y a la segunda contar con una inversión que la permitía crecer y seguir trabajando con recursos ingentes en el desarrollo de sus modelos de IA. Las cosas podrían cambiar más temprano que tarde.
Contigo, pero también sin ti. Según The Information, Microsoft está trabajando en un nuevo LLM propio llamado MAI-1 que teóricamente rivalizará con desarrollos como GPT-4, Gemini o el modelo usado en Claude 3, el chatbot de Anthropic.
Suleyman al frente. El desarrollo está liderado por Mustafa Suleyman, que ya trabajó en la división de IA de Google y luego fue CEO de Inflection, la startup que creó el chatbot Pi. Microsoft acabó contratando a la mayoría de la plantilla y adquiriendo la propiedad intelectual de esa empresa en marzo por 650 millones de dólares, y Suleyman acabó siendo designado como máximo responsable de los esfuerzos de Microsoft en el ámbito de la IA.
MAI-1 es enorme. Los datos apuntan a que MAI-1 contará con 500.000 millones de parámetros (500B), aproximadamente la mitad de los que se estima que tiene GPT-4. Estamos ante un modelo que es mucho más ambicioso que Phi-3, y que al menos por número de parámetros es también más prometedor que los modelos 70B de Meta o Mistral.
Jugando a dos bandas. Crear un LLM propio es un movimiento especialmente interesante de Microsoft, que tenía casi una relación de simbiosis con OpenAI. Gracias a esa alianza GPT-4 se ha convertido en parte integral de servicios y productos de Microsoft, pero MAI-1 parece ser un plan B, y la pregunta es si este desarrollo acabará haciendo que esa alianza deje de serlo.
Propósito desconocido. En The Information dejan claro que por ahora el propósito exacto de MAI-1 no está definido y dependerá de su rendimiento y capacidades. Para entrenarlo Microsoft ha usado un gran número de GPUs de NVIDIA y ha usado datos de distinta procedencia, entre los cuales están textos generados pro GPT-4 y también datos públicos de internet.
Posible aparición en BUILD 2024. El nuevo LLM de Microsoft podría ser presentado en sociedad durante las jornadas para desarrolladores BUILD 2024 que Microsoft celebrará entre el 21 y el 23 de mayo. Será entonces cuando probablemente conozcamos más detalles sobre MAI-1.
Imagen | Steve Juvetson
En Xataka | Meta, IBM y otras forman The AI Alliance. Su objetivo: defender el desarrollo de modelos de IA Open Source
Ver todos los comentarios en https://www.xataka.com
VER 3 Comentarios