Cuando nos hablan de un chatbot de inteligencia artificial puede que se nos venga a la mente ChatGPT, pero esta no es la única herramienta que tenemos a nuestra disposición en la actualidad. En los últimos meses hemos visto aparecer en escena alternativas como Gemini de Google, Le Chat de Mistral AI y Claude de Anthropic. Este último, precisamente, acaba de actualizarse con tres modelos de última generación.
La compañía estadounidense ha anunciado Claude 3 Haiku, Claude 3 Sonnet y Claude 3 Opus. Estamos hablando de una serie de propuestas que, según prometen sus creadores, llegan con mayor capacidad para abordar tareas complejas, generar contenido, responder a consultas científicas y resolver problemas matemáticos. Además, la familia de modelos Claude 3 ahora tiene capacidades de visión artificial.
Claude 3 supera en varios benchmarks de referencia a GPT-4 y Gemini 1.0
Uno de los recursos que tiene la industria para medir la capacidad de los modelos de IA son los benchmarks. GPT-4, el modelo de OpenAI que impulsa productos como ChatGPT Plus y Microsoft Copilot, ha destacado durante mucho tiempo, pero los modelos de compañías rivales parecen estar acercándosele. Claude dice que su modelo más potente supera a sus pares en la mayoría de las pruebas de referencia.
En la imagen de abajo podemos ver una tabla compartida por Anthropic donde se compara la capacidad entre modelos. Claude 3 Opus muestra una mejor capacidad en los benchmarks de conocimiento experto a nivel de pregrado (MMLU), el razonamiento experto a nivel de posgrado (GPQA), matemáticas básicas (GSM8K) entre otros. Además, aseguran, tiene “niveles casi humanos de compresión y fluidez”.

Claude 3 Sonnet y Claude 3 Haiku son modelos más pequeños. El primero se presenta como una propuesta que busca el equilibro entre rendimiento y velocidad, y que puede ser utilizado para tareas de marketing, generación de código y análisis de texto. El segundo es el más compacto y rápido, pensado para responder a solicitudes sencillas como moderación de contenido, logística e inventarios.
La familia Claude 3, como señalamos arriba, es multimodal. Esto quiere decir que podremos cargar imágenes, documentos con gráficos otro tipo de archivos para análisis y obtención de respuestas. Cabe señalar que el chatbot Claude no tiene la capacidad de genera imágenes, algo que sí es posible hacer, por ejemplo, en Copilot. En este último caso lo que ha hecho Microsoft es integrar DALL·E para admitir esta característica.

Otra de las grandes novedades de los nuevos modelos de Anthropic es la ventana de contexto. En todos los casos se ofrece una ventana de contexto de 200.000 tokens. A mayor cantidad de tokens, mayor es la capacidad del modelo para absorber información en una consulta. Claude 3, sobre el papel, admite aproximadamente 150.000 palabras por consulta, lo que equivale a enviar la novela ‘Moby Dick’ completa.
Anthropic ha querido destacarse en el apartado de ventana de contexto desde un principio. La versión anterior del modelo tenía una ventana de contexto de 100.000 tokens. GPT-4, en su versión estándar, ofrece una ventana de contexto de 8.000 tokens, aunque también hay una versión especial de 32.000 tokens y la llamada GPT-4 Turbo de 128.000 tokens. Gemini 1.5, recordemos, tiene una ventana estándar de 128.000 tokens.
Pero hay más en relación a los tokens. Cuando Google presentó Gemini 1.5 el pasado 15 de febrero dijo que habían alcanzado de manera experimental la ventana de contexto más ambiciosa: hasta 1 millón de tokens por solicitud. Anthropic apunta en la misma dirección. Dicen que sus modelos pueden aceptar solicitudes que “superen 1 millón de tokens”, pero esto estará disponible para “clientes seleccionados”.
¿Cómo probar el Claude 3 de Anthropic?
Claude 3 Opus y Claude Sonnet ya están disponible en 159 países, incluido España (Haiku llegará más adelante). Podemos acceder a los nuevos modelos a través del chatbot Claude y de la API. El chatbot es accesibles a través de claude.ai/chat. Para acceder hay que registrarse y, al igual que otras alternativas del mercado, permite su utilización de manera gratuita con limitaciones. También existe una versión de pago (20 dólares al mes) que promete una mejor experiencia.
Los modelos de nueva generación de Anthropic también están disponibles a través de la API y de la plataforma en la nube Google Cloud. En este caso hablamos de la opción avanzada de acceder a ellos que sirve para impulsar otras aplicaciones o proyectos. En ambos casos se trata de opciones de pago cuyo precio varía de acuerdo al modelo elegido y al uso del mismo.
Ver 1 comentario
1 comentario
Usuario desactivado
Tampoco pasa el test del pentagono.
No se para que hacen benchmarks de quien da la respuesta incorrecta mas rapido.
-----
To draw a regular pentagon using only a ruler, compass, pencil, and paper, follow these steps:
1. Draw a straight line segment of any desired length using your ruler. Let's call this line segment AB.
2. With the compass, put the point at A and open the compass to a radius longer than half the length of AB.
3. Draw an arc from A that intersects the line AB at a point C, on the other side of B.
4. Without changing the radius of the compass, put the point at B and draw another arc that intersects the previous arc at a point D.
5. Connect the points A and D to create a line segment AD.
6. With the compass point at D and radius equal to the length of AD, draw an arc that intersects the line segment AB at a point E.
7. Connect the points E and D to create a line segment DE.
8. The line segments AB, BC, CD, DE, and EA form the five sides of a regular pentagon.
9. Go over the constructed pentagon with your pencil to make the lines darker and more visible.
Following these steps precisely will allow you to construct a regular pentagon with perfect angles and side lengths using only a ruler, compass, pencil, and paper.