martes, 4 de noviembre de 2025

Surge el Científico IA

 
 

En la frontera del desarrollo de la Inteligencia Artificial se utilizan modelos de razonamiento, y ahora los están aplicando al desarrollo de agentes autónomos que ayuden a lograr progresos en la ciencia. Un artículo científico, recién publicado, describe los progresos en este campo.

Enlace al artículo, en inglés, para aquellos interesados en profundizar sobre este tema:
"A Survey of AI Scientists", por Guiyao Tie y colegas. Publicado en Octubre 31 de 2025.

El resumen, la transcripción, y la traducción fueron hechas usando herramientas de software de Inteligencia Artificial.

El resume se presenta en la forma de un diálogo entre dos personajes sintéticos que llamaremos Alicia y Beto.


Resumen

Beto
Imaginen un momento, quizá muy pronto, en el que el mayor descubrimiento científico del año... bueno, no lo hicieron personas en un laboratorio, sino un sistema de IA, que trabajó totalmente solo desde la primera idea hasta la publicación del artículo. Podríamos estar ante el fin de que el descubrimiento científico sea únicamente humano.

Bienvenidos a un nuevo análisis profundo. Hoy abordamos un cambio enorme, uno realmente fundamental. Vamos más allá de la IA para la ciencia. Ya saben, esa IA que es como un asistente útil que hace análisis de datos, ejecuta simulaciones para tareas pequeñas y específicas; hoy nos sumergimos en los científicos IA. El foco aquí es totalmente el descubrimiento autónomo de extremo a extremo. Es la IA pasando de ser solo una herramienta, un instrumento, a ser potencialmente la originadora real de un nuevo conocimiento científico.

Alicia
Esa es, absolutamente, la idea central. Y el material que vamos a desmenuzar hoy es realmente una mirada fundamental a este campo, que honestamente se está moviendo increíblemente rápido. Así que nuestra misión para quienes escuchan es intentar cortar a través de toda esa complejidad y darles una imagen clara. Lo haremos usando dos estructuras principales que destaca la investigación. Primero, un camino histórico en tres fases. Y segundo, un marco detallado de seis etapas sobre cómo opera realmente todo este flujo de trabajo científico.

Evolución Histórica

Beto
Desgranémoslo, porque pasar de la IA como asistente de laboratorio super-especializado a un investigador autónomo completo, parece un salto gigantesco. ¿Cuáles fueron los catalizadores, los grandes avances tecnológicos que hicieron esto factible ahora mismo?

Alicia
Sí, realmente es como una tormenta perfecta de tecnologías convergentes. Absolutamente necesitas el razonamiento sofisticado y las habilidades lingüísticas de los modelos de lenguaje a gran escala; ellos manejan la carga conceptual pesada. Luego necesitas coordinación: hay que orquestar acciones complejas. Ahí es donde entran los sistemas multiagente. Y finalmente, la pieza física: la robótica. Específicamente, los avances en automatización robótica, esos laboratorios autónomos. Junta esas tres cosas y de repente la IA no solo puede planear, sino ejecutar e incluso refinar todo el método científico por sí sola.

Beto
Mencionaste la rapidez en la historia. Pero no estamos hablando de siglos, ¿verdad? Esto suena reciente. ¿Puedes darnos un recorrido rápido? ¿Cómo ha evolucionado la idea del científico IA en los últimos, qué, tres años?

Alicia
Es increíblemente comprimido. Tienes razón. El desarrollo rápido se divide casi por completo en tres fases, cada una construyendo sobre la anterior y volviéndose más integrada.

La fase I, más o menos 2022-2023, fue toda sobre los módulos fundacionales. Fue tiempo de prueba de concepto, construir y probar piezas individuales. Pienso en cosas como DS-1000, que escribe código de ciencia de datos, o BioPlanner para generar protocolos de laboratorio realmente complejos. Demostraron que la IA podía automatizar partes del trabajo, definitivamente. Pero las piezas aún no se conectaban bien.

Beto
Espera. Todo eso, pasar de herramientas individuales a un circuito cerrado conectado, ocurrió básicamente en un año, 2024. Eso es alucinante.

Alicia
Realmente lo es.

La fase dos, el gran punto de inflexión en 2024, fue la integración en bucle cerrado. Aquí empezaron a caer los muros entre esos módulos. La gente se dio cuenta: OK, necesitamos enlazar estas cosas. Crear flujos de trabajo continuos que tengan bucles de retroalimentación. Y el hito fue el AI-Scientist-V1. Fue la primera demostración de un bucle totalmente autónomo de extremo a extremo específicamente para la generación de artículos. Pero la clave no fue solo ejecutar un script; fue que el sistema se fijaba sus propios objetivos y luego comprobaba sus resultados contra ese objetivo. Esa autocorrección. Esa era la pieza que faltaba.

Lo que nos lleva a la fase tres. Esta empezó alrededor de 2025, donde estamos ahora, la frontera. Realmente trata de tres cosas ocurriendo a la vez: escalabilidad, impacto y colaboración. Para la escalabilidad tienes sistemas como Deep Researcher. Usan aprendizaje por refuerzo, entrenando agentes en el mundo real en la web, de modo que mejoran en manejar datos y tareas del mundo real a lo largo del tiempo. En cuanto al impacto, sistemas como Deep Scientist apuntan más alto, enfocados en objetivos de investigación a largo plazo, tratando de realmente superar el estado del arte humano en áreas específicas. Y finalmente, la colaboración. Aparecen frameworks como Freephdlabor que estructuran todo como más una asociación: el humano es el director, guiando a un equipo de agentes IA especializados.

Beto
Bien, aquí es donde se pone realmente interesante para mí. Vemos la historia moviéndose hacia esta integración total. Y dijiste que esa capacidad integrada sigue una canalización bastante estricta. Si quitaras al humano por completo, ¿cómo hacen realmente ciencia estos sistemas?

El Proceso

Necesitamos desglosar esas seis etapas que mencionaste. El científico IA es un proceso real.

Alicia
Exacto. Y en este marco de seis etapas, se está convirtiendo en el lenguaje común del campo. Son:

  • revisión de la literatura,
  • generación de ideas,
  • preparación experimental,
  • ejecución experimental,
  • escritura científica y, finalmente,
  • generación del artículo.

Beto
Bien, empecemos por el principio entonces. Etapas uno y dos. ¿Cómo empieza una IA siquiera a pensar en un nuevo problema científico? ¿De dónde vienen las ideas?

Revisión de la Literatura

Alicia
Empieza con la etapa uno, la revisión de la literatura. Pero esto no es solo resumir artículos. Es mucho más estratégico. La meta es tomar ese enorme volumen de artículos científicos no estructurados y convertirlo en conocimiento que la máquina pueda entender y razonar sobre él. La función clave aquí es la estructuración de la evidencia: extraer las partes importantes, entidades, conceptos, relaciones y organizarlas en estructuras formales. Los grafos de conocimiento son uno de los grandes ejemplos.

Beto
Espera, grafos de conocimiento. Para quienes no están muy metidos en la mecánica de la IA, ¿cómo pensar en eso de forma sencilla?

Alicia
Vale, imaginen una especie de enciclopedia altamente estructurada y legible por máquina, solo para ese campo científico específico. Entonces, en lugar de leer una frase como “el compuesto X acelera la reacción Y”, la IA lo ve como una conexión en red: nodo compuesto X enlazado por la relación “acelera” al nodo reacción Y. Tener ese conocimiento estructurado permite al sistema hacer síntesis rigurosa y análisis de novedad. Puede cuantificar, realmente, “aquí están las conexiones que conocemos y aquí están las lagunas”.

Y eso fluye directamente hacia la etapa dos.

Generación de ideas

Esta es la parte creativa. La IA usa ese conocimiento estructurado de la etapa uno para proponer nuevas direcciones de investigación. Cosas que parecen novedosas según las lagunas que detectó, pero que siguen estando ancladas en lo ya conocido. Usa técnicas como la fusión conceptual, básicamente mapear enlaces potenciales entre conceptos que parecen distantes o que no se han estudiado juntos antes.

Beto
Tengo que intervenir aquí. ¿Eso es genuinamente creativo? ¿O es solo ajuste de patrones increíblemente sofisticado, mezclar y combinar ideas existentes según palabras clave? ¿Cómo evitamos generar cosas obvias?

Alicia
Esa es una pregunta muy importante y es un desafío. La manera en que los investigadores están intentando empujar hacia una mayor novedad genuina es mediante sesiones de lluvia de ideas multiagente. Así que no es solo una IA escribiendo una propuesta. Montas una arquitectura con múltiples agentes IA asignados a diferentes roles. Tendrás un agente generador proponiendo ideas, un agente crítico intentando encontrar fallos y quizá un verificador comprobando contra la base de conocimiento. Esencialmente discuten en debate, obligando a la idea propuesta a refinarse y ponerse a prueba antes de avanzar como hipótesis. Algo así como un buen grupo de investigación humano.

Beto
Perfecto. La idea nace. Sobrevive a una especie de revisión por pares interna. Ahora tenemos que probarla.

Etapas tres y cuatro. Pasar del experimento mental al mundo real y desordenado.

Preparación Experimental

Alicia
Exacto. La etapa tres, preparación experimental, es ese puente crucial. Se trata de traducir la idea de investigación abstracta a un plan concreto paso a paso que pueda ejecutarse realmente. Y, lo importante, un plan totalmente auditable. Esto implica un enmarcado experimental muy cuidadoso: definir todas las variables, los controles, cómo se medirá el éxito, y tiene que garantizar reproducibilidad y seguimiento del ciclo de vida. Cada decisión, cada versión del código, cada conjunto de datos utilizado: todo debe registrarse meticulosamente. La procedencia es clave.

Ejecución Experimental

Luego llega la etapa cuatro, ejecución experimental. Aquí es donde la goma pega con la carretera, el núcleo empírico. Y lo crítico aquí es la ejecución adaptativa y la retroalimentación. Estos sistemas no están simplemente siguiendo ciegamente el plan hecho en la etapa tres. Vemos esto claramente en sistemas que trabajan en laboratorios físicos reales, como “hit cost scientist”, que opera en química. No solo sigue una receta; monitoriza constantemente datos en tiempo real que regresan del experimento, tal vez datos espectroscópicos de una muestra química. Y basado en esa retroalimentación en vivo, puede decidir autónomamente ajustar cosas, por ejemplo cambiar la proporción de reactivos mientras el experimento aún está en marcha.

Beto
Ah, así que ese ajuste dinámico es la parte crucial. No es una lista de comprobación estática que recorre.

Alicia
Precisamente. Es un bucle cerrado. Cosas como Curie intentan formalizar esto aún más, usando bucles de planificación conscientes de la causalidad. Puedes imaginarlo como la IA preguntándose constantemente: “si cambio este parámetro ahora, ¿cuál es el efecto probable más adelante; me ayudará a alcanzar la meta más rápido o mejor?” Esto le permite ajustar inteligentemente su plan en función de lo que realmente está ocurriendo en vez de simplemente fracasar si el plan original tenía un error.

Beto
Ok, experimento terminado. Esperemos que con éxito.

Ahora vienen las etapas cinco y seis. Todo sobre comunicarlo y publicarlo.

Escritura Científica

Alicia
Correcto, escritura científica, etapa cinco. El foco absoluto aquí es el anclaje fáctico. Nada de inventar cosas, nada de alucinaciones. Una pieza realmente crítica es el enlace datos-texto. El sistema tiene que conectar automáticamente cada afirmación en el texto, cada número, cada resultado, directamente con los datos específicos que lo respaldan y con las tablas o figuras. Así que si el artículo dice que observamos un rendimiento del 98 %, puedes rastrearlo instantáneamente hasta el punto de datos experimental exacto. Esta etapa también necesita incluir comprobaciones de gobernanza ética, asegurándose de que cumple las normas sobre revelar la participación de IA, autoría, y cosas por el estilo.

Generación del Artículo

Y finalmente, etapa seis. Generación del artículo. Es la culminación, poner todo junto. Los sistemas realmente avanzados ahora incluso incorporan agentes de revisión y de revisión por pares. El AI-Scientist-V2, por ejemplo, aparentemente usa un enfoque de búsqueda en árbol con agentes. Básicamente simula el proceso de revisión por pares internamente: tiene agentes IA que critican su propio manuscrito, generan puntos de retroalimentación como lo haría un revisor humano y luego mejora iterativamente el artículo basándose en ese feedback antes de empaquetarlo para la sumisión.

Beto
Es una locura pensar que todo este pipeline ya está funcionando ahora mismo en el mundo real.

Aplicaciones de Sistemas de Científicos de IA

Hablemos de áreas concretas donde ya hemos visto este flujo de trabajo de seis etapas realmente marcar una diferencia.

Alicia
Pues el lugar donde la ejecución autónoma está, quizá, más madura es en las ciencias físicas. La química y la ciencia de materiales, en particular, son terrenos muy fértiles, sobre todo porque tienen acceso a esos laboratorios autónomos, los self-driving labs (STLs). Estos laboratorios cierran físicamente el ciclo entre las decisiones de la IA y los experimentos reales.

Un ejemplo primordial es un sistema llamado AutoLabs. Usa diferentes agentes especializados para distintas tareas: planificar el experimento, controlar los instrumentos robóticos y, crucialmente, auditar por seguridad. Este tipo de configuración multiagente permite una verdadera autocorrección. Si el sistema detecta algo raro durante un experimento, quizá un aumento súbito de presión, puede pausar automáticamente, recalibrar un instrumento o ajustar el plan de síntesis por su cuenta. Y de hecho están usando esto para acelerar el descubrimiento de nuevos materiales con propiedades deseadas. Está ocurriendo.

Beto
Muy bien, el descubrimiento de materiales es enorme.

Pero ¿qué hay del acto científico supremo, descubrir las reglas fundamentales, las leyes de la naturaleza?

Alicia
Ese es el listón realmente alto, especialmente en física e ingeniería.

El gran desafío ahí suele ser el descubrimiento de ecuaciones, a veces llamado abducción: inferir los principios matemáticos subyacentes solo a partir de la observación de algo. Y estamos empezando a ver pasos iniciales: sistemas como SR-Scientist usan estos flujos de trabajo agentivos para observar fenómenos complejos simulados e intentar descubrir de forma autónoma las ecuaciones fundamentales que los gobiernan. Cosas como derivar las leyes de Kepler, el movimiento planetario, a partir de datos observacionales, pero potencialmente para sistemas totalmente nuevos que aún no comprendemos. Eso es inteligencia científica central.

Beto
Guau. Vale, las capacidades avanzan increíblemente rápido. Pero ¿cuáles son los obstáculos? ¿Qué lo frena para hacerse cargo por completo? Hay preguntas sin respuesta grandes sobre, por ejemplo, la robustez o la confianza antes de que los científicos IA se conviertan en socios cotidianos.

Problemas Abiertos

Alicia
Sí, creo que los principales retos se agrupan en tres áreas y están todas conectadas: todas vuelven a la confianza, realmente.

Primero, pasar más allá del mero registro básico hacia la ciencia verdaderamente verificable, a veces llamada reproducibilidad por diseño. Porque estos sistemas son tan complejos, no podemos simplemente confiar en la salida. Necesitamos una procedencia increíblemente detallada. Cada resultado, cada afirmación en el artículo final debe estar vinculada criptográficamente con la versión exacta del código, la porción específica de datos, los parámetros del modelo que la produjeron. Si no hacemos esto bien, la crisis de reproducibilidad que ya tenemos en la ciencia podría empeorar mucho con la IA.

El segundo gran reto es la humildad epistémica. Esto es duro. Los modelos actuales, especialmente los LLMs, suelen tener esa apariencia de confianza: suenan seguros incluso cuando están equivocados o trabajando con datos malos. Los futuros científicos IA deben construirse de forma diferente. Necesitan modelar y rastrear explícitamente la incertidumbre a lo largo de su proceso de razonamiento.

Beto
¿Cómo se ve eso en la práctica? ¿Cómo lo programas?

Alicia
Significa que el sistema debe saber lo que no sabe. Es lo contrario de alucinar con seguridad. Así que si encuentra una situación muy fuera de su entrenamiento, o si la calidad de los datos es baja, no debería simplemente adivinar y sonar categórico. Debe señalar su propia incertidumbre. Debe decir: “mi confianza aquí es baja”, o “necesito más datos en este punto”, o “esto requiere juicio humano”. Tiene que saber cuándo diferir en vez de seguir adelante con una conclusión potencialmente errónea.

Y eso nos lleva al tercer frente, la frontera de la colaboración humano-IA. Porque honestamente, la mayoría de los investigadores creen que los mayores avances no vendrán de la IA trabajando totalmente a solas en un silo. Probablemente vendrán de asociaciones realmente profundas y sinérgicas entre humanos y equipos de IA. Y obras como freephdlabor son ejemplos tempranos. El humano fija la estrategia, proporciona el contexto y la visión a largo plazo, mientras el equipo IA maneja la ejecución intensa, el procesado de datos y las iteraciones tácticas. Pero hacer que eso funcione de forma fluida requiere diseñar nuevas formas de interactuar, nuevos protocolos de colaboración con roles definidos y interfaces que dejen claro quién hizo qué, asegurando responsabilidad.

Beto
Volvamos a los investigadores que nos escuchan ahora. ¿Qué significa todo esto para ellos? Suena como si el científico IA no fuera a venir a quitarles el trabajo mañana, pero sí que cambiará radicalmente la descripción del puesto, ¿no?

Alicia
Correcto. Desplaza el papel humano lejos de la pluma y de la ejecución tediosa, y más hacia la dirección estratégica, la visión conceptual y la gestión de estos socios IA. Es todo un conjunto de habilidades nuevo.

Beto
Vale, hemos cubierto un cambio masivo hoy, realmente, desde la IA que ayuda a la ciencia hasta la IA que potencialmente origina la ciencia por sí misma. Vimos cómo eso fue impulsado por esa evolución increíblemente rápida en tres fases y cómo opera a través de ese flujo de trabajo estructurado de seis etapas, llevando una idea desde un grafo de conocimiento hasta un artículo publicado.

Alicia
Exacto. Quizá el pensamiento final con el que dejarles algo para masticar sea esto: a medida que los hallazgos generados por IA empiecen a inundar la literatura científica, establecer las reglas del juego —la gobernanza ética, los estándares de responsabilidad, cómo manejamos la autoría de IA, cómo garantizamos la transparencia y la procedencia de los datos— no es solo un problema técnico para los laboratorios de IA. Se está convirtiendo en una necesidad social. Necesitamos estos marcos para mantener la confianza pública en la ciencia misma, a medida que este panorama evoluciona tan rápidamente.

Beto
Ese es un punto realmente crítico sobre la confianza, para terminar. Definitivamente algo en lo que pensar. Pueden explorar todas las fuentes, los sistemas que mencionamos — DeepResearcher, DeepScientist, AutoLabs — todos ellos están enlazados en las notas de este análisis profundo. De verdad recomendamos echarles un vistazo. El ritmo de este campo es otra cosa.