Estamos en pleno Google I/O y, como parte de la batería de novedades presentadas por la compañía, llegan mejoras en Gemini 1.5. Gemini una familia de modelos de inteligencia artificial que potencia tecnologías como el nuevo asistente de voz que vendrá para remplazar a Google Assistant, por lo que las mejoras en los tiempos de ejecución del modelo resultan cruciales para sus diversas implementaciones (ya sea en web, apps o asistentes).
Actualmente, Gemini tiene tres versiones: Ultra, Pro y Nano. Ultra es el principal rival de GPT4, Pro compite con soluciones gratuitas como GPT 3.5, y Nano es la integración que vemos en dispositivos con IA de Google integrada como los Google Pixel 8 o los Samsung Galaxy S24. Las novedades de este IO se centran en Gemini 1.5 , disponible a través de la suscripción Gemini Advanced.
Un modelo más ligero y rápido. Gemini Flash es el nombre que ha dado Google a su propuesta más ligera, con menor latencia y, sobre todo, veloz. Es una apuesta con una capacidad de respuesta más rápida que 1.5 Pro, diseñado para aquellas aplicaciones en las que lo que prima es la celeridad.
Supone la última incorporación a la familia de modelos Gemini, y está optimizado para tareas de gran volumen. Pese a ser más ligero que Pro, Google promete una gran capacidad de razonamiento multimodal, siendo especialmente bueno en resúmenes, aplicaciones de chat, subtitulación de imágenes o extracción de datos en documentos.
Mejoras en la capacidad de cálculo. Gemini 1.5 Pro es un modelo que aumenta la capacidad de cálculo respecto a versiones anteriores. Ahora es capaz de de analizar documentos de gran tamaño: archivos de hasta 1.500 páginas en total, resumen de hasta 100 correos electrónicos de forma simultánea, una hora de vídeo o bases de código de más de 30.000 líneas.
Dado que la principal bondad de Gemini 1.5 Pro es esta capacidad de cálculo, Google quiere una mayor integración de Drive con Gemini, permitiendo subir archivos de este último servicio a Gemini. En otras palabras, podremos acceder al poder de cálculo de Gemini 1.5 Pro en los documentos.
Mejoras en la comprensión de imágenes. Gemini 1.5 Pro promete importantes mejoras a la hora de entender las imágenes que le estamos mostrando. Como ejemplo, Google presume de que su modelo puede resolver problemas matemáticos paso a paso con tan solo analizar una foto, o darte recetas de un plato con tan solo ver su composición y aspecto.
No solo aplica a multimedia: también a apps. Gemini será capaz de analizar el contenido de aplicaciones como Google Meet o Gmail para hacer resúmenes, descripciones de lo que ve transcritas a texto y más funciones.
Gemini 1.5 Pro estará disponible para los suscriptores de Gemini Advanced en algo más de 150 países y en más de 35 idiomas. Desde Google nos han confirmado que la suscripción llegará a España.
Gemini será más compatible con móviles. Con el fin de mejorar las capacidades conversacionales de Gemini, Google anuncia el lanzamiento de Gemini Live para los suscriptores de Gemini Advanced, así como nuevas funciones que integrarán Gemini en Android.
Entre ellas, llegará la búsqueda mediante IA a Google Fotos, pudiendo analizar el contexto de las mismas, hablarnos sobre lo que ve, e ir mucho más allá de la actual búsqueda. También habrá integración de Gemini en apps como Mensajes, donde servirá de apoyo para las conversaciones.
Respecto a Gemini Live, es una nueva interfaz de conversación con Gemini exclusiva para teléfonos móviles. Al igual que mostró hace unas horas OpenAI con GPT-4o, podremos interrumpir al bot, como en una conversación habitual.
Del mismo modo, Gemini Live puede ver a través de nuestra cámara, describiendo con precisión el entorno en el que estamos. Estas novedades por el momento, se están probando en inglés, por lo que no llegarán en primera instancia a España.
Mejoras en la planificación. Además de las mejoras que llegan de la mano de Gemini Flash, Gemini Live, y las capacidades de Gemini Pro, Google quiere dotar a Gemini Advanced de mejoras en planificaciones complejas. Itinerarios de viaje, planes, actividades en las que tenemos que escoger entre diversas opciones, etc.
Una de las funciones que llegará al plan Advanced dentro de "los próximos meses" tendrá que ver con las planificaciones. Si, por ejemplo, le pedimos que nos planifique un viaje, será capaz de tener en cuenta los horarios de vuelo, llegada a hotel, preferencias de comida que le indiquemos e demás para ofrecernos una planificación personalizada.
Lo hará obteniendo datos de apps como Gmail, Google Maps y la búsqueda de Google, y modificará la planificación completa si hacemos algún cambio en el itinerario.
Imagen | Google
En Xataka | 36 funciones y cosas que puedes hacer con Google Gemini
Ver 0 comentarios