Con R1, DeepSeek ha logrado algo que parecía imposible: entrenar un modelo de IA con capacidades de razonamiento comparables a las de OpenAI... pero sin depender de enormes conjuntos de datos etiquetados.
Su enfoque basado en el aprendizaje por refuerzo abre la puerta a que haya muchos más grupos desarrollando IAs avanzadas.
Por qué es importante. Este avance cambia las reglas que asumíamos en el desarrollo de IA. Hasta ahora, crear modelos con capacidad de razonamiento requería enormes cantidades de datos etiquetados y recursos computacionales solo al alcance de gigantes como OpenAI, Meta o Google.
DeepSeek ha demostrado que hay un camino alternativo mucho más eficiente.
Entre bambalinas. El proceso de entrenamiento de DeepSeek R1 se divide en dos fases principales:
- Primero, R1-Zero aprende a razonar exclusivamente mediante aprendizaje por refuerzo, explorando soluciones por prueba y error.
- Después, R1 refina estas capacidades con una pequeña cantidad de datos de "arranque en frío" para mejorar aspectos como la legibilidad.
El modelo utiliza una arquitectura de Mezcla de Expertos (MoE) con 671.000 millones de parámetros totales, pero solo activa 37.000 millones por consulta. Esto es lo que le permite obtener un rendimiento comparable al de o1 de OpenAI con una fracción de los recursos computacionales.
El contraste. Mientras OpenAI invierte cientos de millones en datos etiquetados y computación, DeepSeek ha conseguido resultados similares con menos de 6 millones de dólares (inversión declarada).
Sus modelos destilados más pequeños, desde 1.500 millones hasta 70.000 millones de parámetros, también han logrado un rendimiento sorprendente.
El ejemplo. Es un ejemplo tonto, pero precisamente por eso queríamos comprobar su forma de razonar ante el tipo de pregunta que descoloca. Le hicimos la pregunta "Si Xataka fuese un equipo de fútbol español, ¿cuál sería?".
![X1](https://i.blogs.es/95ff8c/x1/450_1000.png)
Su larguísima respuesta iba autoreafirmándose y luego descartando la conclusión una y otra vez.
- Primero se limitó a describir Xataka y a hacer un repaso superficial de los principales clubes españoles.
- Luego se planteó si seríamos el Athletic, pero entendió que aunque su política de "solo jugadores vascos" es única, eso no es comparable con la innovación de Xataka. Hizo algo similar con Valencia, Barça y Rayo argumentando distintas causas para descartarlos.
- Nos vinculó al Real Madrid por nuestro, ejem, liderazgo en masa social... pero convino que eso no va ligado a la innovación.
- Pasó por Eibar y Getafe, descartando ambos... pero luego volvió al Eibar ya que "cayó" en que usan analítica y tecnología. Al final lo descartó por ser un club pequeño.
- Comentó que el liderazgo de Xataka encaja con un estilo ofensivo como el del Barça de Guardiola o el contraataque del Madrid de Ancelotti...
- ...y finalmente llegó a Villarreal y Girona.
- Tras algunos razonamientos, se quedó con el Girona, argumentando su fuerte cultura del dato, su enfoque innovador, su crecimiento reciente y su visión global (es parte del City Football Group), además de añadir algo llamativo: "Ambos combinan recursos limitados con inteligencia estratégica: el Girona maximiza su plantilla con scouting avanzado, mientras Xataka optimiza contenido relevante y accesible para una audiencia masiva".
Su conclusión final fue "El Girona FC encarna la esencia de Xataka: modernidad, adaptación tecnológica y una narrativa fresca que desafían el statu quo". 🚀⚽
Leer todo su razonamiento fue espectacular.
Punto de inflexión. Este desarrollo anticipa la entrada en una nueva era donde la innovación en IA no dependerá exclusivamente del acceso a grandes recursos, como ha venido ocurriendo hasta ahora.
Las técnicas de aprendizaje por refuerzo y destilación de modelos pueden nivelar el terreno de juego entre grandes empresas (o startups con inversiones de nueve ceros) y equipos mucho más pequeños.
Profundiza. Este avance va más allá de simples mejoras incrementales. DeepSeek ha demostrado que es posible construir modelos que razonen de forma autónoma sin tener que mostrarles miles y miles de ejemplos.
El aprendizaje por refuerzo permite que el modelo descubra por sí mismo estrategias efectivas de razonamiento, de forma similar a cómo los humanos aprendemos a resolver problemas.
En Xataka | He probado DeepSeek en la web y en mi Mac. ChatGPT, Claude y Gemini tienen un problemón
Imagen destacada | Xataka con Mockuuups Studio
Ver 20 comentarios
20 comentarios
RetroAficionado
Me quedo sin palabras... Buen artículo. Me da muchas esperanzas con las posibilidades que se abren en este campo, sin depender de los de siempre.
Aunque vengan los detractores de siempre con la dictadura y no sé qué más historias.
Esto va de tecnología, no de política.
Hoy he intentado registrarme con mi correo personal (tengo un dominio propio) y no me lo han aceptado. Luego he intentado usar mi dirección de Outlook, y tampoco me la aceptaba. Al final, curiosamente, he tenido que usar mi correo de Gmail y ha funcionado. Aunque, de momento, supongo que por la novedad y la sobrecarga por el efecto "barrapunto", las respuestas son bastante más lentas que ChatGPT.
También hay alguna funcionalidad que echo en falta, como que recuerde ciertos parámetros que le has dicho que recuerde entre conversaciones (y te especifica que no lo hace por temas de privacidad y seguridad), pero no tengo prisa. De momento, me gusta mucho más que los LLM basados en GPT.
vilani
Lo revolucionario es saber que casi cualquier país puede hacer su propia IA sin tener que pasa por el aro de los EEUU, y eso si es una buena noticia.
acresent90
Es difícil separar la tecnología o puestos cualquier cosa de la política. La política es como el aire está en todos lados. (Es mi opinión personal y no pretendo ofender a nadie) Dicho eso sí llega a ser cierto lo que dicen los chinos, deepseek es un avance revolucionario y que da un golpe en la mesa al mercado de la IA. No creo que los datos sean ciertos, por lo que se ha visto no es descartable que el dinero invertido sea muchísimo mayor, y que este sea dado por el gobierno chino. O que hayan usado millones mas de datos de todo el mundo saltandose los derechos de autor. (Igual que ha hecho meta e imagino que Open AI y los demás.)
acresent90
Una duda, ¿si este enfoque es tan revolucionario porque no lo han usado Open IA y Meta ? Dicen que ya consumieron todos los datos disponibles en la tierra, y a un costo enorme. Entonces me pregunto ¿Porque no probaron o prueban este método? La pregunta es en serio intento entender. ¿No sé les había ocurrido o hay gato encerrado y las cifras no son tan expectaculares?
deskrado
A destilar modelos y a desarollar como perros europeos de los huevs! Que nos estamos quedando irrelevantes y nuestros hijos tendran que emigrar a Marruecos a China y a Rusia y al espacio exterior por esta estrategia de marketing de un grupo de inversion para ganar dinero en bolsa pujando contra NVidia. Han ganado millones de trillones de billones... lo juro por Snoopy
jhoneshaspielk
Lo de los US$6M parece falso, se dice que está IA ha sido financiada por el gobierno Chino y ahí está el problema, no hay que dejarse llevar por las apariencias, DeepSeek puede ser la trampa china para occidente, ellos no son mejores que los gringos, por el contrario, terminamos siempre en lo mismo: La dictadura del partido comunista chino, para esa gracia tomo partido y prefiero millones de veces la dictadura del capitalismo con todos sus defectos! En definitiva, yo no confiaría en nada que tenga el aval del PCC
x2x1
Pues yo he preguntado a DeepSeek quien lo ha creado y ante mi asombro me ha dicho que OpenAI y que se basa en chatgpt. Le he pedido que me lo confirme y ha insistido en esa respuesta.
jorgekkkk
Será que los chinos preguntaron al ChatGPT como se puede mejorar el razonamiento de la IA y le pidieron crear uno nuevo y distinto desde cero. Así nació Deepseek...
Como las IA de Facebook quienes empezaron hablar en su propio lenguaje hasta que les desconectaron
ad0N
No tiene lógica, los chinos les enseña a los de EEUU que hay mucho margen para optimizar, sabiendo que ellos tienen un hardware muchísimo mejor.
¿Que hacen los chinos? ¿Ayudan a los de EEUU a tener aún más ventaja?
Lo dudo, y muchísimo.
Creo que los chinos intentan hacerles perder tiempo investigando cosas que son un callejón sin salida.
starter073
¿Cuánto os pagan los chinos?
ad0N
Son tonterías , significarían que usando la infraestructura de OpenAI ... ¿ya tenemos que?
Esto huele mal. Muy probable los chinos intenta hacerles perder tiempo.