Hoy les traigo un resumen a una conferencia del Profesor Yang-Hui He, del Instituto para Ciencias Matemáticas de Londres. Explica cómo la Inteligencia Artificial (IA) y luego el Aprendizaje por Máquina surgen a partir de las matemáticas, y ahora an alcanzado un nivel tan alto, que se empieza a usar la IA para resolver problemas matemáticos complejos.
El enlace a este video, en inglés, es el siguiente:
Mathematics: The rise of the machines , por Yang-Hui He.
El resumen, la transcripción, y la traducción de este video fueron hechos usando herramientas de Inteligencia Artificial.
El resumen se presenta en forma de un diálogo entre dos personajes sintéticos, que llamaremos Alicia y Beto.
Resumen
Alicia
Si pasas algo de tiempo en internet o viendo las noticias últimamente, da la sensación de que todo el debate sobre la IA está atrapado en dos bandos, ¿no?
Beto
Sí, realmente lo está.
Alicia
Bueno, por un lado tienes a la gente que dice que la singularidad se acerca. La IA lo va a controlar todo.
Beto
El mundo va a cambiar de forma radical.
Alicia
Y luego, por el otro lado, están los que dicen que todo es puro bombo: es básicamente una calculadora sofisticada. Que la gente se calme, ¿no?
Beto
Solo estadísticas a escala. Y, honestamente, todo ese ruido, creo que pierde el punto. Si queremos ver de verdad lo que la IA puede hacer, no solo lo que la gente afirma, tenemos que mirar a algo puro, algo estructurado.
Alicia
Y eso es la matemática. Así que eso es nuestro análisis de hoy: la IA, específicamente en matemáticas —descubrimiento, demostración, todo el paquete—. Tratamos de averiguar, OK, si miramos cómo la IA maneja datos matemáticos puros, ¿podemos hacernos una idea real de dónde estamos?
Beto
Exacto. Y las matemáticas son, bueno, el lugar perfecto para esto porque los datos matemáticos, el lenguaje matemático, esa información estructurada es precisamente lo que estos modelos de IA, estas redes neuronales, son buenos procesando. Está cambiando el campo ahora mismo de forma fundamental.
Alicia
Bien. Entonces quizá expliquemos la IA para un matemático. La idea central ahora, oirás este término, "conectivismo → emergencia". Suena elegante, pero ...
Beto
... Solo significa que construyes estas redes enormes, ¿vale? Redes neuronales; en realidad son sistemas complejos de funciones, todas conectadas entre sí, intentando imitar cómo pensamos que funciona el cerebro con todas sus conexiones.
Alicia
Y hay matemática real que respalda esto: que pueden realmente imitar cosas.
Beto
Ah, sí, absolutamente. Existen los llamados "teoremas de aproximación universal". Básicamente nos dicen que si haces una red neuronal lo bastante compleja y le das suficientes datos, teóricamente puede modelar cualquier relación, cualquier entrada a cualquier salida. No es solo cálculo: puede aprender patrones.
Alicia
Así que el potencial está ahí. Podría modelar cualquier cosa, desde, no sé, patrones climáticos hasta cómo planear movimientos, si la construyes bien.
Beto
Esa es la idea.
Y sabes, parece muy nuevo, pero el término "inteligencia artificial" en sí mismo se remonta bastante atrás. John McCarthy lo acuñó para esa conferencia de Dartmouth en 1955. Aparentemente pensó que “inteligencia computacional” no sonaba lo bastante emocionante para la propuesta de financiación.
Alicia
Huh. Hay que amar el marketing académico. Pero la idea de una máquina pensante es muchísimo más antigua, ¿no?
Beto
Oh, siglos más antigua.
Alicia
Siempre vuelvo a Descartes hablando de la “bestia máquina” en el siglo XVII, pensando que los animales eran solo robots complejos. Pero para mí, el presagio real es Ada Lovelace. En 1842, mirando la máquina de Babbage, predijo que quizá algún día una máquina así podría componer música, música compleja, que es exactamente lo que cosas como ChatGPT están haciendo ahora con el lenguaje. Es asombroso.
Beto
Ese es un gran punto. Y esos primeros pensamientos llevaron a referencias reales, ¿no? Como el test de Turing en el ’49 —¿puede una máquina engañarte?—
Alicia
Correcto. Luego Deep Blue venciendo a Kasparov en ajedrez en el ’97. Eso se sintió enorme en su momento.
Beto
Fue enorme. Y luego AlphaGo venciendo al campeón mundial de Go en 2012, un juego mucho, mucho más difícil que el ajedrez.
Alicia
Así que si la IA trata de encontrar patrones mediante estas conexiones y las matemáticas son, como dijo G. H. Hardy, bueno, “un matemático es como un pintor, un poeta, un creador de patrones”.
Beto
Esa es la cita perfecta. Literalmente cazamos patrones, patrones en números, formas, datos.
Alicia
Así que desatas la herramienta suprema de caza de patrones —la IA— en el campo de las matemáticas.
Beto
Y sí, las cosas tienen que cambiar. El propio trabajo empieza a verse diferente.
Alicia
Ok, vamos a mapear esto para todos. ¿Cómo está cambiando la IA realmente la forma en que se hace la matemática en el día a día? Lo hemos dividido en tres maneras principales. Está la vía de abajo hacia arriba: certeza, pruebas.
Beto
Ajá, axiomas primero.
Alicia
Luego la vía de arriba hacia abajo: más intuición, descubrimiento, jugar, ...
Beto
... matemática experimental. Sí.
Alicia
Y finalmente, esta área más nueva y extraña: la meta-matemática con cosas como los grandes modelos de lenguaje, los LLM.
Beto
Ahí es donde las cosas se ponen realmente interesantes, quizá un poco raras.
Alicia
Empecemos por la base, entonces: abajo hacia arriba. Esta es la idea clásica, ¿no? Euclides, 300 a. C. Empiezas con verdades básicas, axiomas, definiciones, y construyes todo paso a paso.
Beto
Absolutamente. Y la versión más extrema de esto tiene que ser "Principia Mathematica", el proyecto de Russell y Whitehead a principios del siglo XX. Su proyecto masivo quería mostrar que toda la matemática puede construirse puramente desde la lógica; enorme ambición.
Alicia
“Ambicioso” es una palabra para eso. “Tedioso” sería otra. Oyes historias: les llevó, ¿qué?, trescientos sesenta y dos páginas.
Beto
Sí, 362 páginas de símbolos increíblemente densos solo para probar que uno más uno es dos.
Alicia
Es casi increíble. 362 páginas para 1 + 1 = 2.
Beto
De verdad. Y el proceso era tan complejo, tan engorroso, que la gente básicamente dijo: esto no es para humanos. Era demasiado fácil cometer un pequeño error en cientos de páginas de lógica.
Alicia
Casi un callejón sin salida intelectual, incluso antes de que Gödel apareciera.
Beto
Prácticamente se sintió como un fracaso en la práctica. Y luego, sí, Gödel dio el golpe teórico quizá 20 años después con sus teoremas de incompletitud.
Alicia
¿Nos recuerdas qué decían?
Beto
Básicamente, Gödel demostró que en cualquier sistema formal lo suficientemente complejo, como el que Russell y Whitehead intentaban construir, siempre habrá afirmaciones verdaderas que simplemente no puedes probar dentro de ese sistema. No puedes tener una base perfectamente completa y consistente para todo.
Alicia
Así que el sueño de una certeza absoluta construida desde abajo quedó algo muerto.
Beto
Le dio un golpe enorme. Parecía como que todo el proyecto axiomático estuviera limitado.
Alicia
Ok, pero aquí viene el giro. Si ese tipo de lógica tediosa, paso a paso, propensa a errores para los humanos no es para nosotros, ...
Beto
... es absolutamente perfecta para las computadoras. Si no se aburren, no cometen deslices lógicos si están programadas correctamente.
Alicia
Exacto. Así que los científicos de la computación y los lógicos recogieron esas piezas.
Beto
Lo hicieron. Y ahora, avanzando hasta hoy, tenemos cosas como el proyecto Mathlib. Funciona sobre un lenguaje asistente de pruebas llamado Lean. Es un enorme esfuerzo colaborativo.
Alicia
¿Y qué hace? ¿Es como "Principia Mathematica" otra vez?
Beto
Algo así, pero práctico esta vez: están formalizando sistemáticamente —en esencia traduciendo a código verificable por computadora— el currículo estándar de matemáticas de grado universitario. Esa parte se llama Project Zena. Hablamos de más de un millón de líneas de código ahora.
Alicia
Wow. Pero, ¿por qué? Pero si ya sabemos que esos teoremas son verdaderos, ¿no? Los enseñamos todos los días.
Beto
Pensamos que sabemos que son verdaderos. Pero el sistema humano de revisar pruebas, "peer review", no es perfecto. Uno de los investigadores involucrados mencionó encontrar resúmenes en The Annals of Mathematics.
Alicia
Que es como la mejor revista de matemáticas del mundo, ¿no?
Beto
Pues sí, el pináculo de la revisión por pares. Y encontraron resúmenes que eran, cito, "mutuamente contradictorios". Ambos no podían ser ciertos. Alguien en algún lugar pasó algo por alto: error humano.
Alicia
Así que Mathlib no es solo archivar matemáticas. Se trata de asegurarse de que realmente son correctas de una forma que los humanos no pueden garantizar.
Beto
Exacto. Cada paso, cada lema, cada teorema es comprobado por la máquina por consistencia lógica. Se trata de lograr un nivel de certeza que nos hemos dado cuenta de que la revisión humana por sí sola no puede proporcionar, especialmente a medida que las matemáticas se vuelven más complejas.
Alicia
Eso es bastante profundo. No es solo tecnología guay. Es la integridad del campo.
Beto
Lo es. Y la parte realmente emocionante: ahora tenemos esta enorme biblioteca verificada y estructurada de conocimiento matemático. Es la entrada perfecta para la IA.
Alicia
Sí.
Beto
El siguiente paso es que la IA aprenda los patrones de las demostraciones a partir de esta biblioteca. Tal vez incluso genere nuevas pruebas complejas totalmente verificadas por sí misma.
Alicia
Bien, eso es abajo hacia arriba: máquinas forzando certeza. Vamos a girar completamente hacia arriba: el lado de la intuición, la matemática experimental.
Beto
Sí. Aquí es donde los matemáticos “juegan”, como dicen. Juegas con números, haces cálculos, buscas patrones. Alguien una vez llamó a las matemáticas “una rama de la física donde los experimentos son baratos”. Esa es la vibra.
Alicia
Y el ejemplo clásico aquí es Gauss, ¿no? Como adolescente, ...
Beto
Carl Friedrich Gauss. Sí. La historia cuenta que tenía quizá 16 años, empezó a contar números primos, a trazarlos, a mirar la densidad. Y solo mirando los datos, conjeturó el teorema de los números primos: que la cuenta es aproximadamente x/log x.
Alicia
Y lo más loco de esa historia, creo, es que tuvo que inventar la estadística y la regresión en el acto solo para determinar qué curva se ajustaba mejor a los números que estaba generando.
Beto
Exacto. Vio el patrón y tuvieron que construir las herramientas para describirlo correctamente. Intuición matemática pura impulsada por el experimento.
Alicia
Y este enfoque experimental no es solo anécdotas históricas. Ha impulsado algunos de los mayores problemas abiertos que tenemos hoy.
Beto
Absolutamente. Piensa en los problemas del milenio, las preguntas del millón de dólares: la Hipótesis de Riemann de 1859, Riemann la formuló basándose en comprobar solo las primeras 20 o así de las ceros de la función Zeta. Unos pocos puntos de datos llevaron a una de las conjeturas más profundas en matemáticas.
Alicia
Wow. Y la Conjetura de Birch y Swinnerton-Dyer (BSD).
Beto
Esa de los años 60 fue una de las primeras grandes conjeturas nacidas directamente de la asistencia computacional. Usaron una computadora gigante temprana, EDSAC en Cambridge, para trazar datos sobre curvas elípticas y vieron un patrón que nadie esperaba.
Alicia
OK, así que los humanos usando ordenadores como herramientas para la intuición no es nuevo. Lo que diferencia a la IA moderna es que la IA está haciendo la intuición ahora.
Beto
Ese es el salto. La IA está empezando a hacer el descubrimiento real. DeepMind, por ejemplo, alimentó una IA con datos sobre nudos matemáticos, lazos complejos enredados, y la IA encontró una fórmula completamente nueva, una relación nueva entre diferentes invariantes de nudos que los humanos no habían detectado.
Alicia
OK, eso es una gran afirmación. Encontrar un patrón es una cosa, pero formular una conjetura real y demostrable… ¿cómo sabemos que la IA no está simplemente encontrando algún fluke estadístico extraño en los datos y que realmente ha hallado algo significativo?
Beto
Esa es una pregunta crucial. Y llevó a los matemáticos en 2023 a establecer una barra muy alta llamada "la prueba Birch", nombrada por Bryan Birch de fama BSD. Tiene tres criterios para un descubrimiento genuino asistido por IA.
Alicia
¿Cuales son?
Beto
Ok.
- Primero, tiene que ser automático. La IA debe encontrar el patrón y sugerir la conjetura sin que un humano la guíe o filtre la salida.
- Segundo, debe ser interpretable. La IA no puede ser solo una caja negra diciendo “esto está correlacionado”; tiene que producir algo como una fórmula, una afirmación concreta que los humanos puedan entender y luego intentar demostrar.
Alicia
Tiene sentido. ¿Y el tercero?
Beto
- Y tercero, debe ser no trivial. La conjetura tiene que ser lo bastante interesante y profunda como para que los matemáticos la quieran dedicar tiempo a probarla. Tiene que ser matemáticamente significativa.
Alicia
Bien: Automática, interpretable, y no trivial.
¿Ha pasado algo que haya pasado la prueba Birch?
Beto
Nos acercamos increíblemente, de verdad. Fue en el área de curvas elípticas, otra vez relacionado con BSD. Investigadores alimentaron una red neuronal con unos 3.5 millones de puntos de datos de una enorme base de datos, la LMFDB.
Alicia
¿Y qué ocurrió?
Beto
La colaboración produjo una conjetura abierta nueva, increíblemente precisa, sobre esas curvas.
Alicia
¿Era interesante, no trivial?
Beto
Oh, sí. Aparentemente escribieron a algunos de los mayores especialistas mundiales en teoría de números en esa área específica y compleja. Y los expertos básicamente dijeron: "nunca hemos visto nada igual". No tenemos idea de por qué esto debería ser cierto. Desafiaba toda la teoría existente; un avance genuino.
Alicia
Wow. Así que pasó lo de interpretable y no trivial con sobresaliente. ¿Y automático?
Beto
Ahí fue donde falló. La red neuronal señaló con fuerza la relación; encontró el patrón en ese conjunto masivo de datos. Pero aún requirió un esfuerzo humano significativo para convertir la salida bruta de la IA en la fórmula matemática final, limpia y precisa. Tuvieron que arrancarla a tirones, por decirlo así.
Alicia
La IA encontró la mina de oro, pero los humanos aún tuvieron que refinar el metal.
Beto
Buena analogía. Sí. La IA llegó quizá al 95 % del camino: generó la intuición central a partir de los datos, pero ese último 5 % de formulación todavía necesitó el toque del pintor y poeta humano.
Alicia
Aun así, el 95 % hacia una nueva conjetura importante que dejó perplejos a los expertos es impresionante.
Beto
Es un progreso asombroso. Muestra el potencial, aunque la automatización total aún no esté del todo ahí; la asociación humano–IA es claramente increíblemente poderosa.
Alicia
Bien. Esto nos lleva al tercer área, quizá la que parece más ciencia ficción ahora mismo: la metamatemática. Aquí es donde entran modelos de lenguaje grande (LLMs), como ChatGPT, por ejemplo.
Beto
Exacto. Y estos son bichos completamente distintos. AlphaGo está entrenado específicamente para jugar Go. Estos LLM, se entrenan con, bueno, aparentemente todo: enormes porciones de internet, libros, artículos. Aprenden patrones estadísticos y el lenguaje para predecir la siguiente palabra.
Alicia
Se trata menos de resolver un problema específico y más de imitar la generación de texto humana.
Beto
Correcto. Pero lo sorprendente es lo buenos que se están volviendo en tareas que requieren razonamiento estructurado, como matemáticas. ChatGPT pasó el test de Turing ya en 2022: a menudo no puedes decir que estás hablando con una máquina.
Alicia
Y cuando apuntaron estos modelos a competiciones matemáticas reales, ...
Beto
... los resultados han acelerado muy deprisa.
Mira el reto IMO: la Olimpiada Internacional de Matemáticas. Son problemas de bachillerato notoriamente difíciles que necesitan verdadera creatividad.
Alicia
Sí. No es solo aplicar fórmulas.
Beto
Definitivamente no. En 2024, un sistema llamado AlphaGeometry combinado con AlphaProof logró una medalla de plata, que ya era asombroso.
Alicia
OK.
Beto
Luego en 2025, el sistema Gemini de Google DeepMind ganó oro. Resolvían problemas considerados increíblemente difíciles, superando a los mejores competidores humanos.
Alicia
Una medalla de oro en la IMO usando un LLM generalista —eso sí que es un gran salto desde vencer en Go.
Beto
Lo es. Indica que estos modelos estadísticos de alguna manera están captando estructuras lógicas profundas, no solo patrones superficiales del texto. Es alucinante, francamente.
Alicia
Y no se quedaron en problemas de bachillerato, ¿no? Hubo este proyecto Frontier Math con problemas de nivel cuatro. ¿Qué es exactamente un problema de nivel cuatro?
Beto
Bien, “nivel cuatro” significa matemáticas de investigación serias. No son ejercicios de libro de texto. Son preguntas hiper-especializadas. Piensa en resultados profundos en teoría analítica de números o propiedades oscuras de ciertas curvas elípticas. A menudo ni siquiera un matemático de un campo ligeramente distinto entendería la pregunta, y mucho menos sabría cómo responderla.
Alicia
Wow.
Beto
Y, crucialmente, estos problemas requieren una respuesta precisa, a menudo numérica con varios dígitos. Nada de adivinar, nada de opción múltiple: tienes que calcular el número exacto correcto. Reunieron a 30 matemáticos de primer nivel que básicamente se aislaron y crearon problemas que ellos mismos no podían resolver fácilmente. Problemas en la frontera del conocimiento actual.
Alicia
¿Qué pasó cuando se los dieron a los LLM?
Beto
Esta es la parte asombrosa: los LLM, simplemente por emparejar patrones a través de, esencialmente, todos sus datos de entrenamiento —internet, artículos científicos, todo— consiguieron una tasa de éxito del 10 % en esos problemas de nivel cuatro.
Alicia
Espera, ¿10 %? De cada diez problemas que eran básicamente de vanguardia, especializados, ...
Beto
... los LLM acertaron uno: dieron la respuesta numérica precisa y correcta.
Alicia
Parece increíble. Eso significa que estos modelos ya pueden resolver problemas que en algunos casos equivaldrían a una parte significativa de una tesis doctoral.
Beto
Esa es exactamente la implicación. Estamos ya en un punto donde estos LLM generalistas, entrenados sobre el amplio conocimiento humano, pueden resolver problemas específicos y técnicos que la mayoría de los matemáticos humanos ni siquiera sabrían por dónde empezar.
Alicia
Bien. Pausemos y asimilemos esto. Sacando todo en conjunto, ¿dónde estamos? La IA aún no ha resuelto uno de los grandes problemas famosos abiertos, como la hipótesis de Riemann o BSD.
Beto
Todavía no. Eso parece la próxima frontera, quizá nivel cinco.
Alicia
Pero debajo de ese titular, ya está cambiando todo el trabajo diario, ¿no? Desde escribir código verificable para las pruebas abajo hacia arriba ...
Beto
... usando Lean y mathlib, ...
Alicia
... hasta provocar nuevas ideas en el trabajo experimental de arriba hacia abajo ...
Beto
... como ese casi acierto con la prueba Birch ...
Alicia
... y ahora incluso resolviendo problemas nuevos y metamatemáticos.
Beto
Absolutamente. La conclusión parece bastante clara: el futuro no es humanos contra IA. Es humanos trabajando con IA. Estamos usando estas herramientas para hacer las demostraciones más ciertas, para potenciar nuestra intuición e incluso para resolver problemas aprovechando la totalidad del conocimiento documentado de maneras que nuestras mentes individuales no pueden.
Alicia
Realmente se siente quizá como el momento más emocionante en las matemáticas desde, no sé, los griegos antiguos.
Beto
Seguro que está entre los más destacables. El ritmo de cambio en todas estas formas de hacer matemáticas, todo a la vez, es sin precedentes.
Alicia
Así que deja esta idea para el final: hemos visto a la IA volverse increíblemente buena, y muy rápido, en matemáticas —olimpiadas, investigación especializada— básicamente aprendiendo patrones de toda la matemática que los humanos ya han creado y escrito, ...
Beto
... aprovechando el corpus existente.
Alicia
Si las máquinas se están convirtiendo en maestras en sintetizar y extender lo que ya sabemos, ¿significa eso que los descubrimientos verdaderamente revolucionarios, los grandes saltos, tienen que venir de algún otro lugar, fuera de ese conocimiento formalizado? ¿Y qué nos dice eso sobre el papel futuro, la necesidad de la intuición humana pura e inalterada, esa chispa que ve algo completamente nuevo?
Algo para pensar.