GPT-4: así es la IA más avanzada de OpenAI, cómo funciona y todas las novedades

El mundo lleva explorando las posibilidades de la inteligencia artificial (IA) desde la década de 1950, periodo de tiempo en el que el matemático Alan Turing sentó las bases de esta disciplina con su artículo ‘Computing Machinery and Intelligence’. Sin embargo, en siete décadas de desarrollo, la sensación de que la IA está avanzando a pasos agigantados nunca había estado tan presente.

La era de la IA, denominada así por personalidades como Bill Gates, comenzó a hacerse evidente en noviembre de 2022, fecha en la que la startup OpenAI puso a disposición del público ChatGPT. Desde ese entonces, y por primera vez de forma gratuita, el mundo tuvo acceso a las ventajas de un modelo grande de lenguaje bajo una interfaz de usuario amigable. Y el mundo se fascinó.

Aquel importantísimo suceso que nos permitió "conversar" en lenguaje natural con un modelo de IA capaz de entender el contexto y brindar respuestas simples como complejas fue tan solo un paso inicial de lo que estaba por venir. ChatGPT estaba basado en GPT-3.5 (y su versión gratuita lo sigue estando), pero modelos más avanzados como GPT-4 no tardaron llegar con muchas mejoras.

Índice de Contenidos (4)

¿Qué es GPT-4?

GPT-4 es un modelo de la familia GPT (Generative Pre-trained Transformer) presentado en 2023 por OpenAI, una startup de IA fundada en por varios empresarios, entre ellos el multimillonario Elon Musk, aunque se retiró de esta en 2018.

Estamos hablando del que fue el modelo insignia de la compañía hasta la presentación de GPT-4o, una propuesta más prometedora que mejora sus capacidades en los campos del texto, la voz y la visión. OpenAI también ha lanzado otros modelos, como GPT (2018), GPT-2 (2019), GPT-3 (2020) y GPT-3.5 (2022). 

A diferencia de los modelos anteriores, GPT-4 tiene esencia multimodal. Esto quiere decir que, además de admitir entradas de texto, tiene la capacidad de analizar imágenes. Los usuarios podemos subir una imagen y pedirle a la IA que nos brinde detalles de la misma o incluso que nos ayude a identificar ciertos elementos que, a nuestra vista, pueden pasar desapercibidos.

En este punto es preciso señalar que GPT-4 no tiene por sí mismo la capacidad de generar imágenes. Esto, no obstante, no quiere decir que las aplicaciones que funcionan con él no puedan hacerlo. ChatGPT Plus y Copilot de Microsoft, por ejemplo, pueden devolver imágenes a las indicaciones de los usuarios gracias a su integración con DALL·E 3, un modelo complementario.

Una de las características más notables del nuevo modelo es su rendimiento de "nivel humano" en algunos escenarios. GPT-4, según OpenAI, es capaz de aprobar un examen simulado de abogacía con un puntaje que se sitúa un 10% por encima de la media de los humanos. Además, en general, presenta respuestas más precisas y coherentes que los modelos anteriores de la firma.

¿Cómo puedo probar GPT-4?

Dado que se trata uno de los modelos más avanzado de OpenAI, puede que sea de tu interés probar GPT-4. La buena noticia es que hay varias alternativas para hacerlo. Veamos. En primer lugar, el modelo está disponible a través de ChatGPT Plus, la versión de pago de ChatGPT. El modelo se puede utilizar, con ciertas limitaciones, por un precio de 20 dólares mensuales.

GPT-4 también está disponible a través de su API. En este caso estamos hablando del mecanismo avanzado que permite a los desarrolladores impulsar sus propias aplicaciones, como Duolingo y Be My Eyes. Aquí se puede acceder a la versión estándar de GPT-4 o la versión Turbo. En todos los casos se paga por token de salida, aunque el precio se ha reducido.

Microsoft Copilot te permite utilizar GPT-4 de manera gratuita

La tercera opción es acceder a GPT-4 a través de Copilot (antes Bing Chat). Microsoft, un socio e inversor clave de OpenAI, revitalizó su buscador con inteligencia artificial y, producto de este movimiento, incorporó un chatbot conectado a Internet. Este está impulsado por el modelo más reciente de OpenAI, así que es una buena oportunidad para utilizarlo de forma totalmente gratuita.

¿Cómo funciona GPT-4?

GPT-4 ha sido entrenado con un enorme dataset que le brinda la capacidad de dar respuesta a una enorme cantidad de temas. También se puede utilizar como asistente de redacción, para aprender idiomas, generar ideas e incluso aprender a programar. Todo esto, no obstante, se encuentra limitado por dos importantes temas que es necesario tener en cuenta a la hora de utilizarlo.

El modelo de inteligencia artificial, en muchos casos, necesita instrucciones muy elaboradas y específicas para hacer un buen trabajo, lo que conocemos como 'prompts'. Aquí es donde destaca el papel de los conocidos como 'prompts engineers', que se especializan en entender el modelo para sacarle el mayor provecho a través de indicaciones textuales. Pero esto no es todo.

Como modelo de IA, GPT-4 no tiene la capacidad de identificar qué conceptos son correctos o erróneos. Además, esta tecnología todavía padece de varios problemas como la reproducción de sesgos sociales y alucinaciones. Por todo esto es importante utilizar los modelos de IA con responsabilidad y teniendo en cuenta sus ventajas y limitaciones.

GPT-4 solo está disponible en la versión de pago de ChatGPT

Si te preguntas cómo ha obtenido toda la información que tiene ChatGPT, la respuesta es en base a un intenso entrenamiento. GPT-4 ha sido entrenado con los mencionados datasets con grandes cantidades de datos que le han servido para aprender y generar lenguaje similar al que manejamos los humanos. Detrás de este modelo se encuentra una arquitectura conocida como “Transformer”.

El objetivo de esta arquitectura, propuesta por Google en 2017, es innovar en la implementación de capas que permiten adaptar el modelo para que sea eficaz y eficiente en un amplio abanico de tareas. OpenAI, en sus modelos GPT, la ha utilizado para implementar varias capas que convierten cada palabra en un vector numérico que permite al modelo procesar el texto de manera matemática.

Pero no solo se trata de capas. En los modelos GPT también intervienen una gran cantidad de parámetros. Estos se conforman durante el proceso de aprendizaje automático y están directamente relacionados con el rendimiento y la precisión del modelo.

¿En qué se diferencia de GPT-3?

De acuerdo a la documentación de OpenAI, GPT-3 tiene 12 capas y 175.000 millones de parámetros. La principal diferencia entre el último modelo de OpenAI y su evolución, según recoge Wired, podría estar en los parámetros. GPT-4 puede tener 100 billones de parámetros, casi 600 veces más que su predecesor.

El contraste entre modelos también se presenta en la ventana de contexto, es decir, la capacidad que tienen para absorber palabras de una vez. 1.000 tokens equivalen a unas 750 palabras. Ahora bien, teniendo en cuenta este dato podemos mencionar que GPT 3.5 admite hasta 4.096 tokens. La versión estándar de GPT-4, 8.000 tokens y la llamada GPT-4 Turbo escala hasta los 128.000 tokens.

GPT-4, a diferencia de GPT-3 (y su variante GPT-3.5), admite imágenes además de texto. Como señalamos arriba, esto se debe a su naturaleza multimodal. Otro punto interesante es el salto a nivel de rendimiento entre modelos. Para medir sus capacidades, la compañía los ha puesto a prueba en exámenes diseñados específicamente para humanos, pero sin hacer ajustes específicos para aprobarlos. Como señala en un documento, GPT-4 superó las pruebas satisfactoriamente, consiguiendo mejores resultados que los arrojados por GPT-3.5.

Imágenes | Aideal Hwa |Rawpixel.com | OpenAI | Captura de pantalla ChatGPT | Microsoft

En Xataka | He jugado una partida de rol con ChatGPT y se ha montado una película digna de Oscar

Ver todos los comentarios en https://www.xataka.com

VER 20 Comentarios

Portada de Xataka