por Genbeta
21 de julio de 2025
OpenAI ha alcanzado un nuevo hito en su ambición por lograr desarrollar la 'IA General'. Y es que, un hecho que ya se cataloga como histórico, un modelo de lenguaje y razonamiento de la compañía (experimental y aún sin nombre oficial) ha logrado hacerse con una medalla de oro en la Olimpiada Internacional de Matemáticas (IMO, por sus siglas en inglés) de 2025, realizada en Sunshine Coast, Australia.
La IMO es considerada la competición matemática más prestigiosa del mundo, reservada a los mejores estudiantes de secundaria: cada año, países de todo el mundo envían equipos con un máximo de seis jóvenes prodigios para resolver problemas de matemáticas avanzadas —álgebra, geometría, teoría de números y combinatoria— que exigen no solo habilidad técnica sino también un nivel destacable de creatividad.
El modelo de OpenAI resolvió cinco de los seis problemas del examen oficial, obteniendo 35 de los 42 puntos posibles, una puntuación suficiente para alcanzar la codiciada medalla de oro. De hecho, sólo el 10% de los 630 participantes humanos logró tal distinción.
Condiciones de competencia humanas, sin atajos
La IA, además, fue evaluada bajo las mismas condiciones que los participantes humanos: dos sesiones de 4,5 horas, sin acceso a Internet ni a herramientas externas, y redactando las soluciones en lenguaje natural. Las soluciones del modelo (que están disponibles en GitHub) han sido evaluadas de forma anónima por exmedallistas de la IMO.
En palabras de Sebastien Bubeck, investigador de OpenAI,
"Solo para que quede claro: una máquina de predicción de palabras —porque eso es lo que es— acaba de producir demostraciones creativas genuinas para problemas matemáticos difíciles y novedosos, a un nivel sólo alcanzado por un puñado de prodigios humanos".
Generalidad, no especialización: la clave del avance
Lo más sorprendente no es solo el resultado, sino cómo se obtuvo. A diferencia de modelos anteriores como AlphaGeometry de DeepMind —diseñado específicamente para resolver problemas de geometría—, el modelo de OpenAI es un sistema de lenguaje de propósito general... que en ningún momento había recibido un entrenamiento específico para la IMO.
Según Alexander Wei, líder del proyecto, su rendimiento se alcanzó mediante nuevas técnicas en aprendizaje por refuerzo y escalamiento del cómputo en tiempo de prueba, sin necesidad de ajustes especializados.
"Este modelo piensa durante horas. No lo hace rápido, pero lo hace bien", explicó Noam Brown, otro miembro del equipo. La clave parece estar en la combinación de razonamiento prolongado, estructura lógica y capacidad de síntesis narrativa.
Todo esto contrasta con otros modelos de lenguaje, incluyendo el propio GPT-4 y competidores como Gemini 2.5 Pro, DeepSeek-R1 o Grok-4, que fueron incapaces de alcanzar siquiera la puntuación mínima para obtener una medalla de bronce en pruebas similares, según datos de la plataforma MathArena.
¿Un anticipo de lo que será la IA general?
El CEO de OpenAI, Sam Altman, no ha dudado en calificar esto como "un indicador significativo de cuánto ha avanzado la IA en la última década". Y es que, para OpenAI, esta hazaña representa no solo un paso en el dominio matemático, sino un avance crucial hacia la inteligencia general artificial (AGI).
Por eso, la compañía dejó claro que esta versión del modelo no será liberada al público en el corto plazo, aunque sí confirmó la próxima llegada de GPT-5, que no incluirá esta capacidad avanzada aún. La compañía subraya que se trata de un experimento de investigación y que pasarán meses antes de considerar una versión comercial del modelo con estas habilidades.
Aun así, afirman que el resultado fue tan sorprendente que incluso dentro de OpenAI no se esperaba obtener un rendimiento de este calibre tan pronto.
La competencia no duerme
Circulan incluso rumores de que DeepMind también habría logrado una medalla de oro este año, pero sin anuncio oficial hasta el momento. En cualquier caso, sí sabemos que en 2024, sus sistemas AlphaProof y AlphaGeometry alcanzaron medalla de plata resolviendo cuatro de seis problemas.
A diferencia de OpenAI, DeepMind ha seguido una ruta más especializada, combinando IA con algoritmos clásicos de búsqueda para abordar los desafíos matemáticos. Sin embargo, el generalista Gemini 2.5 Pro obtuvo apenas 13 puntos en las mismas pruebas, y entre sus respuestas se multiplicaron los errores lógicos y los argumentos incompletos.
¿Y qué opinan los escépticos?
Incluso críticos conocidos del optimismo en IA, como el científico Gary Marcus, calificaron de "genuinamente impresionante" el logro del modelo de OpenAI. Sin embargo, también lanzó algunas preguntas clave: ¿cuál fue el costo computacional por problema? ¿Cómo de reproducible es esta hazaña? Y, quizás lo más importante, ¿para qué sirve esto, más allá de una demostración espectacular? Aun así, reconoció que "no podemos ignorar esto".
Imagen | Marcos Merino
En Genbeta | GPT-5: qué es, cómo funcionará y toda la información que sabemos
-
La noticia
OpenAI gana el oro en la Olimpiada Internacional de Matemáticas. Desafía los límites de la IA, pero no veremos ese modelo en ChatGPT
fue publicada originalmente en
Genbeta
por
Marcos Merino
.