Hace un año Google presentaba PaLM, un modelo que presumía de ser tres veces superior a GPT-3 en su número de parámetros: de los 175.000 de aquel se pasaba a 540.000, lo que teóricamente lo hacía más capaz que el desarrollo de OpenAI.
Sin embargo la empresa de Mountain View no ha aprovechado esa teórica superioridad. OpenAI lanzó en noviembre ChatGPT y desde entonces se ha convertido en el referente absoluto en el ámbito de las IAs conversacionales. Google está yendo con pies de plomo —entre otras cosas, para evitar daños reputacionales— y su propia alternativa a ChatGPT, llamada Google Bard, ha protagonizado un lanzamiento muy cauteloso y no exento de polémicas.
Todo eso cambia ahora.
PaLM 2 razona y programa mejor que nunca
Lo hace con el lanzamiento de PaLM2, “nuestro modelo de lenguaje de próxima generación”. En Google destacan la mejora de este modelo frente a su predecesor en tres grandes áreas:
- Multiidioma: PaLM 2 está entrenado con textos de distintos idiomas —más de 100, aseguran— y eso ha permitido mejorar de forma significativa su capacidad de comprender, generar y traducir textos —incluyendo modismos, poemas y acertijos—, uno de los problemas más complejos de resolver para una IA. PaLM 2 de hecho aprueba los exámenes de competencia de idioma con un nivel “maestro”, aseguran en Google.
- Razonamiento: la diversidad protagonizada por el conjunto de datos con el que ha sido entrenado PaLM2 incluye estudios científicos y sitios web que contienen expresiones matemáticas. Eso ha permitido ganar terreno en campos como la lógica, el razonamiento de sentido común y las matemáticas.
- Programación: También ha habido un claro enfoque a incluir código fuente para entrenar al modelo, y según Google PaLM 2 destaca a la hora de escribir código en lenguajes como Python o JavaScript, pero también puede generar código especializado en otros lenguajes como Prolog, Fortran o Verilog.
Los responsables de este desarrollo explican que para entrenar este nuevo modelo se han usado un “diverso conjunto de fuentes: documentos web, libros, código, matemáticas y datos conversacionales”.
Ese conjunto de datos es “significativamente más grande” que el usado en PaLM, y además se incluyen un gran número de fuentes que están en otros idiomas que no son el inglés. No se especifican, eso sí, el número de parámetros del nuevo modelo, algo que tampoco indicó OpenAI cuando lanzó el nuevo GPT-4.
PaLM 2 estará disponible en cuatro tamaños, que del más pequeño al más grande se denominan Gecko, Otter, Bison y Unicorn. El primero de ellos “es tan ligero que puede funcionar en dispositivos móviles y es lo suficientemente rápido para ofrecer aplicaciones interactivas en el propio dispositivo incluso estando offline”.
Google Bard se basa a partir de ahora en PaLM 2. No es el único
La empresa ha aprovechado el evento Google I/O para anunciar 25 nuevos productos y características que están basadas en PaLM 2. El más importante es Google Bard, el chatbot de Google que “a partir de hoy” se actualiza para basarse en las capacidades de PaLM 2. Eso incluye la capacidad de programar de Bard, que ahora es mucho mayor gracias a las mejoras realizadas en este ámbito.
Este modelo también se integrará en Google Workspace. La propuesta es similar a la que conocimos recientemente con el lanzamiento de Microsoft 365 Copilot. Al igual que este, el objetivo es lograr que la inteligencia artificial (en este caso, PaLM 2) se convierta en un asistente permanentemente disponible para ayudarnos a hacer mejor y más rápido nuestro trabajo en las aplicaciones de esa suite. Así, PaLM 2 nos ayudará a escribir textos en Gmail o Docs, o a organizar mejor los datos en Google Sheets.
El modelo también se ha aplicado al campo de la ciberseguridad a través del llamado Sec-PaLM, una versión especializada que permite analizar y explicar el comportamiento de scripts potencialmente maliciosos, así como detectar cuáles pueden plantear una amenaza tanto a los usuarios como a las empresas.
Google ya ofrecía acceso limitado a la API del anterior modelo, PaLM, pero a partir de ahora los interesados podrán solicitar el acceso a la API de PaLM 2.
PaLM 2, mira esta radiografía y dime qué tengo
Otra de las herramientas que sacarán partido de este modelo es la llamada Med-PaLM 2, una aplicación específica del proyecto al ámbito de la medicina y que también es una iteración del modelo que se lanzó anteriormente, Med-PaLM.
Este modelo ha sido entrenado por parte de equipos de investigación médica en Google, y según sus responsables “es capaz de contestar a preguntas y resumir una gran variedad de textos médicos densos. En Google aseguran que alcanzó el nivel “experto” en preguntas de los exámenes para obtener la licencia de medicina en Estados Unidos.
Este tipo de aplicación quiere ir mucho más allá. En Google están añadiendo “funciones multimodales” para “sintetizar información como radiografías y mamografías con el fin de mejorar algún día los resultados de los pacientes".
El despliegue de este modelo, eso sí, se hará con mucha precaución. Med-PaLM 2 estará inicialmente disponible para un pequeño grupo de clientes de la nube para que envíen sus comentarios a finales de este verano con el fin de identificar casos de uso seguros y útiles.
Duet AI quiere competir con CoPilot, DALL-E 2 y Whisper
Hay otro producto protagonista de todo este despliegue. Se trata de Duet AI for Google Cloud, una propuesta que trata de ofrecer todas las capacidades de la inteligencia artificial generativa a usuarios de servicios en la nube.
Este conjunto de servicios está, como su propio nombre indica, orientado a usuarios de Google Cloud, y el enfoque empresarial es notable. Duet AI consta de tres grandes módulos integrados en la plataforma Vertex AI: Codey, para asistir a desarrolladores, Imagen, para generar imágenes, y Chirp, para transcribir de voz a texto.
La idea de Google es ofrecer a desarrolladores y científicos de datos más opciones y herramientas para crear aplicaciones de IA generativa, y desde luego puede ser un buen competidor de referentes como CoPilot, DALL-E 2 y Whisper para clientes de Google Cloud que ahora tendrán estas herramientas disponibles de forma nativa en sus paneles de control.
Un modelo que promete ser mucho mejor que su predecesor
En la publicación científica de los investigadores de Google que son responsables del desarrollo de PaLM 2 se ofrecen aún más datos, pero además se habla de cómo este modelo ha logrado superar la capacidad de su predecesor.
Así, el rendimiento de PaLM 2 es muy superior al de PaLM en los exámenes que evalúan la capacidad de comunicación profesional. En muchos el anterior modelo suspendía, pero con PaLM 2 Google ha logrado notas excelentes y plantea la capacidad de un modelo muy superior.
La evaluación de este nuevo modelo se ha hecho además en áreas específicas en las que Google explicaba cómo el rendimiento es notablemente superior al de PaLM. Eso es cierto, aseguran, en el soporte de idiomas hasta ahora poco contemplados, en razonamiento y seguimiento de conversaciones, en razonamiento matemático, en la traducción y, cómo no, en programación de código.
En el estudio publicado por Google se muestra cómo por ejemplo PaLM 2 es capaz de corregir un fragmento de código y añadir comentarios en coreano. También va más allá de la traducción de idiomas y es capaz de traducir expresiones populares o modismos.
Por ejemplo: la frase alemana “Ich vertele nur Bahnhof” se traduciría literalmente como “Solo entiendo la estación de tren”, pero en realidad es un modismo que significa “no entiendo nada”, y gracias a PaLM 2 es posible obtener una traducción mucho más precisa de este tipo de frases.
Estos ejemplos muestran algunas de las novedades de un modelo de inteligencia artificial que tratará de darle la vuelta a una situación preocupante para Google. Ahora queda por ver si PaLM 2 será en efecto la respuesta que Google necesitaba para competir con GPT-4 y ChatGPT.
El despliegue de PaLM 2 se producirá a partir de ahora, y en Google han querido destacar que quieren realizar su despliegue de forma responsable. Veremos si el enfoque de este gigante logra al fin comenzar a plantear un competidor en un área que cada vez parece más determinante para su futuro.
Imagen: Umanoide
En Xataka | GPT-4 gratis: cinco maneras de utilizarlo sin pagar ChatGPT Plus
Ver 6 comentarios