El texto presentado presenta el "Universo de Pensamientos" ("Universe of Thoughts", UoT), un marco computacional diseñado para dotar a los Modelos de Lenguaje Grandes (LLMs) de capacidades de razonamiento creativo autónomo. Si bien los métodos tradicionales, como la "Cadena de Pensamiento" ("Chain of Thought", CoT), destacan en la resolución de problemas lógicos, a menudo fallan en problemas indefinidos y de final abierto, como el descubrimiento de fármacos o la estrategia empresarial. Basándose en la ciencia cognitiva, el UoT implementa tres paradigmas distintos: razonamiento combinacional, exploratorio y transformativo, que amplían sistemáticamente el espacio de soluciones mediante la manipulación de los "pensamientos" y las reglas subyacentes. Para validar este enfoque, los autores desarrollaron un nuevo parámetro de evaluación que evalúa las soluciones en función de su viabilidad, utilidad y novedad. Los resultados experimentales demuestran que el UoT permite que los modelos más antiguos superen el rendimiento creativo de sistemas propietarios más avanzados, como GPT-5. En definitiva, esta investigación desplaza el enfoque de la ingeniería de indicaciones dirigida por humanos a la creatividad metodológica dentro de la propia IA.
Enlace al artículo científico, en inglés, para los que quieran profundizar en el tema: "Universe of Thoughts: Enabling Creative Reasoning with Large Language Models", por Yuto Suzuki y Farnoush Banaei-Kashani. Publicado en Noviembre 26 del 2025.
El resumen, la transcripción, y la traducción fueron hechas usando herramientas de software de Inteligencia Artificial.
El resumen se presenta en la forma de un diálogo entre dos personajes sintéticos que llamaremos Alicia y Beto.
Resumen
Alicia
Bienvenido a este análisis profundo donde desgranamos investigaciones complejas y vamos directo al núcleo de lo que necesitas saber. Hoy voy a abordar una pregunta que es realmente fundamental para el futuro de la IA. ¿Puede una máquina ser verdaderamente inventiva? Quiero decir, en los últimos años hemos visto cómo los grandes modelos de lenguaje, los LLM, han dominado por completo el razonamiento estructurado, las matemáticas, la lógica y el código. Son increíbles, pero el mundo real, los problemas que realmente impulsan la innovación — descubrimiento de fármacos, un plan de negocio a diez años, o simplemente arreglar el tráfico de una ciudad — requieren un tipo de pensamiento distinto. Requieren creatividad, algo genuinamente nuevo.
Beto
Exacto, y esa es la limitación de los métodos de los que hablamos todo el tiempo, como la cadena de pensamiento ("Chain of Thought", CoT) o el árbol de pensamientos ("Tree of Thoughts", ToT). Son excepcionalmente buenos en problemas bien definidos.
Alicia
Es decir, problemas con un conjunto claro de reglas y una meta verificable.
Beto
Precisamente. Son brillantes buscando dentro de una caja predefinida, pero en cuanto les das un problema abierto, esa creatividad se detiene. Para obtener una idea realmente sorprendente, un humano tiene que intervenir y hacer todo ese meticuloso "prompt engineering". Básicamente, la creatividad viene del humano, no de la máquina, no es autónoma.
Alicia
Bien, esa es la brecha que exploramos hoy. ¿Cómo construimos un marco que permita a un LLM generar ideas verdaderamente creativas por sí mismo? Nuestro material fuente presenta un nuevo marco llamado "Universo de Pensamientos", o "Universe of Thoughts", UoT. Diseñado precisamente para eso. Vamos a indagar en las inspiraciones cognitivas detrás y luego ver los, francamente, asombrosos resultados cuando se enfrentó con algunos de los modelos más grandes de hoy.
Beto
El verdadero poder del UoT, creo, es que está fundamentado en la ciencia cognitiva. No es solo un truco algorítmico ingenioso. Toda la estructura se basa en el trabajo seminal de Margaret Bowden, que define la creatividad no como una sola cosa, sino como tres tipos muy distintos. Y eso te da una hoja de ruta computacional.
Alicia
Me encanta eso. Empiezan por cómo la gente es creativa y luego construyen la máquina para reflejarlo.
Esos tres tipos de creatividad se convierten en los pilares del marco UoT. Desgranémoslos porque definen realmente cómo el LLM conduce su búsqueda de ideas.
El primero es la "Creatividad Combinatoria", C-UoT. Probablemente sea la que más conocemos. Se trata de generar combinaciones inesperadas de ideas ya familiares. Estás conectando puntos que no estaban conectados antes.
Beto
Piénsalo como un collage: tomas imágenes existentes y las dispones de una manera nueva y sorprendente. Las piezas no son nuevas, pero el producto final sí lo es.
Alicia
Así que nuevas combinaciones, sí, pero no nuevas ideas o reglas fundamentales. Estás trabajando con lo que ya existe.
Beto
Exacto. Estás maximizando la transferencia de conocimiento entre distintas áreas.
Alicia
Bien. Un nivel más profundo es la "Creatividad Exploratoria", E-UoT. Aquí todavía estás jugando con las reglas originales, pero buscas cosas que no se habían encontrado antes.
Beto
Correcto. Estás explorando el espacio conceptual existente, la caja, pero estás encontrando nuevas estructuras, nuevas ideas dentro de esa caja que nadie había visitado antes.
Alicia
¿Cuál es una buena analogía para eso?
Beto
El artículo usa el Impresionismo, que me parece perfecto. No inventaron nuevas pinturas o lienzos.
Alicia
No, las reglas eran las mismas.
Beto
Las mismas reglas, pero exploraron la idea de la luz y el color de una manera funcionalmente nueva, usando pinceladas que antes no se habían considerado. Así que E-UoT te da nuevas combinaciones y nuevos pensamientos, pero las reglas subyacentes no cambian.
Alicia
Y eso nos lleva al tercero, el grande, la "Creatividad Transformacional", T-UoT. Aquí es donde se pone realmente salvaje.
Beto
Esta es la guía. En este caso, el modelo no solo busca en el espacio: altera las reglas definitorias del espacio mismo. Expande lo que incluso es posible.
Alicia
No solo estás encontrando un nuevo camino en el mapa.
Beto
Estás redibujando el mapa. Esto es Picasso y el Cubismo. No se limitó a pintar un retrato de otra forma; rompió la regla de la representación desde una sola perspectiva.
Alicia
Cambió la gramática del arte.
Beto
Cambió la gramática. Entonces con T-UoT obtienes nuevas combinaciones, nuevos pensamientos y nuevas reglas. Así un LLM puede pasar de solucionador de problemas a verdadero inventor.
Alicia
De acuerdo, esa es la teoría. ¿Cómo funciona realmente en la práctica? El artículo usa una tarea de referencia para mostrarlo: la tarea del puente de un solo carril. El objetivo es simple: minimizar la demora de los vehículos. Pero las restricciones son duras: no hay nueva infraestructura y el tráfico solo puede ir en una dirección a la vez.
Beto
Empecemos con C-UoT, el enfoque combinatorio. El mecanismo aquí es esencialmente el "préstamo creativo".
Alicia
Busca otros problemas que sean estructuralmente similares.
Beto
Exacto. No otros problemas de tráfico; busca sistemas análogos, cosas como la gestión de vías únicas en ferrocarril, la programación de pistas en aeropuertos o incluso un sistema de citas médicas.
Alicia
Ah, claro. Porque todos tratan de gestionar un recurso escaso a lo largo del tiempo.
Beto
Precisamente. Y de esos dominios extrae los conceptos centrales, los "pensamientos", cosas como reservas con franjas de tiempo, agrupamiento de vehículos o incentivos para desplazarlos en el tiempo.
Alicia
Y luego los sustituye en el problema del puente.
Beto
Toma una solución básica como cambiar la dirección cada 10 minutos y la intercambia por un concepto de, por ejemplo, la programación de clínicas. El resultado podría ser un sistema tokenizado de pre-reserva combinado con el agrupamiento de autos tipo ascensor. Es novedoso para el dominio del tráfico, pero las piezas son familiares.
Alicia
Tiene mucho sentido para obtener victorias prácticas rápidas.
Pero para E-UoT, la creatividad exploratoria, necesitas más que pedir prestado, ¿verdad? Necesitas que el modelo invente algo genuinamente nuevo.
Beto
Ahí está el salto clave. E-UoT comienza igual con esos pensamientos conocidos, pero luego tiene un segundo paso: la expansión conceptual. Se le solicita que genere ideas totalmente nuevas que cumplan la misma función — por ejemplo reducir la demanda de tráfico — pero que no estén presentes en ninguno de los ejemplos que ha visto.
Alicia
¿Puedes dar un ejemplo? ¿Cuál fue un pensamiento verdaderamente novedoso para el puente que propuso E-UoT?
Beto
Pues, en lugar de una simple tarifa en horas pico, podría generar el concepto de un crédito comunitario de tiempo por compromisos de viajar fuera de hora punta, o un sistema de lotería por compromisos grupales.
Alicia
Wow. Bien. Son mecanismos sociales o económicos realmente novedosos.
Beto
Lo son. Son nuevos bloques conceptuales que aún encajan dentro de las reglas originales del problema. Son verdaderas invenciones.
Alicia
Fascinante.
Y eso nos lleva a la final, T-UoT, la transformacional. Esto empieza identificando las reglas, pero también las suposiciones ocultas.
Beto
Sí. Y eso es crítico. Luego cubre las cosas que damos por sentadas.
Alicia
¿Cuál es una suposición oculta en la tarea del puente?
Beto
Cosas como que "la gente debe cruzar físicamente el puente en su vehículo", o que "el sistema debe ser por orden de llegada". Están escritas, pero pueden limitar nuestro pensamiento. La primera tarea de T-UoT es encontrarlas.
Alicia
Y supongo que la segunda tarea es romperlas.
Beto
Mutarlas. Aplica operaciones de mutación: eliminar una regla, variar una regla, o introducir una nueva.
Alicia
Espera. Mutar la regla suena arriesgado. ¿No podría generar tonterías o romper la restricción explícita, por ejemplo, "construir un nuevo puente"?
Beto
Ese es todo el desafío y por qué el marco es tan importante. Es transformación guiada, no caos. Pero muta una suposición oculta — por ejemplo, "que la gente deba cruzar en persona" — y la cambia a permitir "que los bienes se muevan sin personas". Sigue respetando la restricción de no nueva infraestructura.
Alicia
Ah, ya veo. Entonces el espacio de soluciones se expande.
Beto
Radicalmente. Y de repente aparecen soluciones que antes eran literalmente imposibles. Cosas como "mercados móviles a ambos lados del puente", "taquillas para drones para entrega de paquetes" o incluso "lanchas supervisadas como un canal paralelo". Resuelves el problema cambiando una suposición fundamental sobre por qué la gente necesita cruzar en primer lugar.
Alicia
Y así se logra un avance real.
De acuerdo, ya conocemos el mecanismo. Ahora, la gran pregunta: ¿cómo se mide esto? La creatividad no es un problema de personal que simplemente puntúas.
Beto
Correcto. El equipo tuvo que construir todo un nuevo benchmark con tres tareas abiertas distintas: el puente, un problema de electricidad/tarifas y una tarea de cohesión social. Y volvemos a esa definición clásica: una solución creativa debe tener alta novedad y alta utilidad.
Alicia
Dos ejes distintos. ¿Cómo las cuantificaron?
Beto
Usaron tres métricas: Primero, factibilidad. Un simple sí o no: ¿la solución cumple todas las reglas explícitas? Si no, queda fuera. Segundo, utilidad. Qué tan bien resuelve realmente el problema, en una escala donde uno es la solución óptima. Para el puente, eso sería la máxima reducción de la demora.
Alicia
Bien, eso tiene sentido.
Pero lo difícil debe ser la novedad. ¿Cómo puntúas objetivamente la originalidad de una idea?
Beto
Lo hicieron con distancia semántica, específicamente "cosine distance". Básicamente representan la idea central de una solución como un punto en un espacio de alta dimensión y miden qué tan lejos está de todas las soluciones conocidas. Cuanto más lejos, más novedosa.
Alicia
Un momento: una idea del modelo puede ser un párrafo de 200 palabras o una frase de 10 palabras. ¿Cómo comparas eso justamente para distancia semántica?
Beto
Buena pregunta. Y por eso añadieron un paso muy ingenioso llamado canonicalización de la solución ("solution canonicalization"). Usaron otro LLM actuando como juez neutral para tomar cada salida y destilarla hasta su única idea central. Elimina todo el relleno. Así la entrega por drones se compara con el crédito temporal en igualdad de condiciones. Se trata del concepto, no de los pros y contras.
Alicia
Brillante. Eso estandariza.
Bien. El momento de la verdad. ¿Qué pasó cuando compararon UoT contra todo lo demás?
Beto
El resultado principal fue que la variante UoT obtuvo consistentemente las puntuaciones de creatividad más altas de cualquiera de los métodos de razonamiento, dejando atrás CoT, ToT y otros. El enfoque cognitivo estructurado simplemente funcionó mejor.
Alicia
Pero el resultado realmente sorprendente — el que más me llamó la atención — fue la comparación directa en la tarea del puente.
Beto
Absolutamente. T-UoT ejecutado en un modelo como GPT-4o consiguió una puntuación de creatividad de 0.698.
Alicia
Lo cual es muy bueno. Pero la clave es que se comparó con ...
Beto
... un modelo propietario de siguiente generación más potente, GPT-5, ejecutando una búsqueda no estructurada, y ese modelo sacó 0.649.
Alicia
Eso es enorme. Una mejor estructura de razonamiento en un modelo menos potente produjo un resultado más creativo que un modelo más potente pensando por su cuenta.
Beto
Es una victoria del marco, no de la escala. Demuestra que la arquitectura del pensamiento puede importar más que la pura potencia computacional.
Alicia
Al profundizar en las variantes de UoT, ¿se comportaron como se esperaba? ¿T-UoT siempre produjo las ideas más novedosas?
Beto
Lo hizo. Los resultados confirmaron el diseño: la novedad generalmente aumentaba al pasar de C-UoT a E-UoT y luego a T-UoT. Tenía el mayor potencial para pensamiento verdaderamente fuera de la caja.
Alicia
Pero hay un compromiso: esa búsqueda de novedad puede ser arriesgada. Puedes encontrar algo nuevo pero totalmente inútil.
Beto
Y los resultados lo mostraron también. Por ejemplo, en la tarea de cohesión social, E-UoT propuso ideas realmente novedosas, pero obtuvo puntuaciones bajas en utilidad. Las ideas eran demasiado difíciles de aterrizar en políticas prácticas.
Alicia
¿Y T-UoT? El último rompe-reglas.
Beto
Incluso T-UoT a veces luchó para convertir sus transformaciones más abstractas y rupturistas en una solución de alta utilidad. Curiosamente, en algunos casos, incluso después de todo el proceso de transformación, la solución con la puntuación más alta que encontró fue en realidad una idea combinatoria muy compleja y novedosa, como aplicar algoritmos de "recocido cuántico" ("quantum annealing") a la programación de tráfico. Esa proporcionó la mejor utilidad práctica.
Alicia
Entonces, ¿dónde nos deja esto?
Parece que tenemos una prueba sólida de que los LLM pueden ser guiados hacia un razonamiento creativo verdaderamente autónomo. Y la clave no es solo un modelo más grande, sino una estructura más inteligente e inspirada en la cognición.
Beto
Y para cerrar, un pensamiento final para que te lleves: hemos visto que las ideas transformacionales que rompen reglas suelen ser las más difíciles de traducir de inmediato en soluciones prácticas y de alta utilidad. Así que se plantea una pregunta: cuando perseguimos la verdadera innovación, ¿siempre tenemos que sacrificar utilidad inmediata por novedad que cambia el juego? ¿O existe una estrategia computacional para que ambos converjan? Piensa en los grandes problemas imprecisos en tu propio trabajo: ¿cuáles son las reglas ocultas, las suposiciones no dichas bajo las que operas? ¿Y qué pasaría si empezaras a mutarlas al estilo T-UoT para desbloquear una invención, aunque esa primera versión no sea perfectamente práctica?