por Genbeta

21 de julio de 2025

OpenAI gana el oro en la Olimpiada Internacional de Matemáticas. Desafía los límites de la IA, pero no veremos ese modelo en ChatGPT

OpenAI ha alcanzado un nuevo hito en su ambición por lograr desarrollar la 'IA General'. Y es que, un hecho que ya se cataloga como histórico, un modelo de lenguaje y razonamiento de la compañía (experimental y aún sin nombre oficial) ha logrado hacerse con una medalla de oro en la Olimpiada Internacional de Matemáticas (IMO, por sus siglas en inglés) de 2025, realizada en Sunshine Coast, Australia.

La IMO es considerada la competición matemática más prestigiosa del mundo, reservada a los mejores estudiantes de secundaria: cada año, países de todo el mundo envían equipos con un máximo de seis jóvenes prodigios para resolver problemas de matemáticas avanzadas —álgebra, geometría, teoría de números y combinatoria— que exigen no solo habilidad técnica sino también un nivel destacable de creatividad.

El modelo de OpenAI resolvió cinco de los seis problemas del examen oficial, obteniendo 35 de los 42 puntos posibles, una puntuación suficiente para alcanzar la codiciada medalla de oro. De hecho, sólo el 10% de los 630 participantes humanos logró tal distinción.

Condiciones de competencia humanas, sin atajos

La IA, además, fue evaluada bajo las mismas condiciones que los participantes humanos: dos sesiones de 4,5 horas, sin acceso a Internet ni a herramientas externas, y redactando las soluciones en lenguaje natural. Las soluciones del modelo (que están disponibles en GitHub) han sido evaluadas de forma anónima por exmedallistas de la IMO.

En palabras de Sebastien Bubeck, investigador de OpenAI,

"Solo para que quede claro: una máquina de predicción de palabras —porque eso es lo que es— acaba de producir demostraciones creativas genuinas para problemas matemáticos difíciles y novedosos, a un nivel sólo alcanzado por un puñado de prodigios humanos".

Generalidad, no especialización: la clave del avance

Lo más sorprendente no es solo el resultado, sino cómo se obtuvo. A diferencia de modelos anteriores como AlphaGeometry de DeepMind —diseñado específicamente para resolver problemas de geometría—, el modelo de OpenAI es un sistema de lenguaje de propósito general... que en ningún momento había recibido un entrenamiento específico para la IMO.

Según Alexander Wei, líder del proyecto, su rendimiento se alcanzó mediante nuevas técnicas en aprendizaje por refuerzo y escalamiento del cómputo en tiempo de prueba, sin necesidad de ajustes especializados.

"Este modelo piensa durante horas. No lo hace rápido, pero lo hace bien", explicó Noam Brown, otro miembro del equipo. La clave parece estar en la combinación de razonamiento prolongado, estructura lógica y capacidad de síntesis narrativa.

Todo esto contrasta con otros modelos de lenguaje, incluyendo el propio GPT-4 y competidores como Gemini 2.5 Pro, DeepSeek-R1 o Grok-4, que fueron incapaces de alcanzar siquiera la puntuación mínima para obtener una medalla de bronce en pruebas similares, según datos de la plataforma MathArena.

¿Un anticipo de lo que será la IA general?

El CEO de OpenAI, Sam Altman, no ha dudado en calificar esto como "un indicador significativo de cuánto ha avanzado la IA en la última década". Y es que, para OpenAI, esta hazaña representa no solo un paso en el dominio matemático, sino un avance crucial hacia la inteligencia general artificial (AGI).

Por eso, la compañía dejó claro que esta versión del modelo no será liberada al público en el corto plazo, aunque sí confirmó la próxima llegada de GPT-5, que no incluirá esta capacidad avanzada aún. La compañía subraya que se trata de un experimento de investigación y que pasarán meses antes de considerar una versión comercial del modelo con estas habilidades.

Aun así, afirman que el resultado fue tan sorprendente que incluso dentro de OpenAI no se esperaba obtener un rendimiento de este calibre tan pronto.

La competencia no duerme

Circulan incluso rumores de que DeepMind también habría logrado una medalla de oro este año, pero sin anuncio oficial hasta el momento. En cualquier caso, sí sabemos que en 2024, sus sistemas AlphaProof y AlphaGeometry alcanzaron medalla de plata resolviendo cuatro de seis problemas.

A diferencia de OpenAI, DeepMind ha seguido una ruta más especializada, combinando IA con algoritmos clásicos de búsqueda para abordar los desafíos matemáticos. Sin embargo, el generalista Gemini 2.5 Pro obtuvo apenas 13 puntos en las mismas pruebas, y entre sus respuestas se multiplicaron los errores lógicos y los argumentos incompletos.

¿Y qué opinan los escépticos?

Incluso críticos conocidos del optimismo en IA, como el científico Gary Marcus, calificaron de "genuinamente impresionante" el logro del modelo de OpenAI. Sin embargo, también lanzó algunas preguntas clave: ¿cuál fue el costo computacional por problema? ¿Cómo de reproducible es esta hazaña? Y, quizás lo más importante, ¿para qué sirve esto, más allá de una demostración espectacular? Aun así, reconoció que "no podemos ignorar esto".

Imagen | Marcos Merino

En Genbeta | GPT-5: qué es, cómo funcionará y toda la información que sabemos

-
La noticia OpenAI gana el oro en la Olimpiada Internacional de Matemáticas. Desafía los límites de la IA, pero no veremos ese modelo en ChatGPT fue publicada originalmente en Genbeta por Marcos Merino .

Más Noticias de Genbeta

Si has sido víctima de una estafa por Internet, así es como puedes recuperar tu dinero

Si has sido víctima de una estafa por Internet, así es como puedes recuperar tu dinero

Las estafas por Internet se han convertido en un problema creciente que afecta a miles de personas cada año en España. Phishing, smishing, fraudes en compraventas online, inversiones falsas o timos románticos son...

Hace 19 horas
Este es el mejor libro que he visto para aprender a programar en Python en castellano desde cero, gratis y online

Este es el mejor libro que he visto para aprender a programar en Python en castellano desde cero, gratis y online

Si echas un vistazo a los lenguajes de programación con más salidas de los últimos años (por ejemplo, esta lista de 2025), verás que Python aparece en los primeros puestos. Por eso aprender Python siempre es una...

Hace 23 horas
Me hackearon la cuenta de Instagram y no encontré a nadie en Meta que me ayudara. La recuperé semanas después empezando desde cero

Me hackearon la cuenta de Instagram y no encontré a nadie en Meta que me ayudara. La recuperé semanas después empezando desde cero

En enero hackearon la clásica cuenta de hotmail de toda la vida a mi pareja. En pocas palabras: no tenía la autenticación de doble factor y usaba una contraseña vieja y repetida, notó un mensaje raro en Skype,...

Hace 1 día
Hay gente que se niega a que Windows XP muera, y están consiguiendo que funcione en ordenadores modernos: así es el reto

Hay gente que se niega a que Windows XP muera, y están consiguiendo que funcione en ordenadores modernos: así es el reto

Windows XP es sin duda el sistema operativo que marcó a una generación entera, y que se resiste a desaparecer de nuestros días. Lanzado en 2001 y con su soporte oficial finalizado en 2014, podría ser una reliquia...

Hace 1 día
Lo mejor de la semana laboral de 4 días no es la productividad que se gana, sino qué hace con los grandes problemas de los trabajadores

Lo mejor de la semana laboral de 4 días no es la productividad que se gana, sino qué hace con los grandes problemas de los trabajadores

Esta semana, en Genbeta publicamos información mostrando cómo China ha tenido que dejar de lado una de sus señas de identidad: las jornadas laborables interminables del 996. Les trajo mucha manufactura internacional,...

Hace 2 días
Bill Gates tiene tan claro lo que quiere y cómo conseguirlo que llegó a intentar abordar un avión para no perderlo. Y lo consiguió

Bill Gates tiene tan claro lo que quiere y cómo conseguirlo que llegó a intentar abordar un avión para no perderlo. Y lo consiguió

Mucho se ha escrito sobre Bill Gates y su carácter que ayudan a entender mejor su trayectoria profesional y vital: desde cómo recuerda las líneas del primer programa que escribió para ejercitar su memoria a cómo...

Hace 2 días

"En 2049, tu inteligencia, en comparación con la de la IA, será como la de una mosca en comparación con la de Einstein", este ex-directivo de Google lo tiene claro

La inteligencia artificial está suponiendo un cambio de paradigma tanto en el mercado laboral como en cómo será nuestra vida (la de los humanos) dentro de pocos años. Aprender a usar la IA se ha tornado en una...

Hace 2 días
Escalar imágenes pequeñas con IA es más fácil que nunca con esta web que da hasta 100 usos gratis al mes sin tener que registrarse

Escalar imágenes pequeñas con IA es más fácil que nunca con esta web que da hasta 100 usos gratis al mes sin tener que registrarse

Por mi trabajo me toca lidiar con documentos gráficos de todo tipo, lo que implica cierto retoque fotográfico. No soy de complicarme demasiado y uso herramientas gratis, por lo que software como GIMP me resulta...

Hace 2 días