Estas fuentes examinan el panorama multi-facético de la creatividad en grandes modelos lingüísticos, centrándose principalmente en cómo medir y mejorar estas capacidades. Marcos de investigación como CreativityPrism y C2-Eval introducen parámetros estandarizados que evalúan tanto el pensamiento divergente, como la narración y la generación de ideas, como el pensamiento convergente, que incluye la programación creativa y las matemáticas. Los criterios de evaluación suelen centrarse en la fluidez, la flexibilidad, la originalidad y la elaboración, lo que revela que, si bien los modelos destacan en la expansión detallada, a menudo tienen dificultades con la verdadera novedad. Más allá de la evaluación, los textos exploran cómo las discusiones colaborativas entre múltiples agentes pueden impulsar la producción creativa y cómo los rasgos de personalidad en los modelos se correlacionan con factores creativos similares a los humanos. Finalmente, la documentación aborda la seguridad mediante la introducción de TokenBuncher, un mecanismo de defensa diseñado para evitar que los modelos utilicen su razonamiento creativo para actividades perjudiciales durante el ajuste fino.
Enlace al artículo científico, para aquellos interesados en profundizar en el tema: "Assessing and Understanding Creativity in Large Language Models", por Yunpu Zhao y colegas. Publicado el 23 de Enero del 2024.
Resumen
Alicia
Bienvenidos a un nuevo análisis profundo. Hoy estamos evitando el bombo y mirando algo que se sitúa justo en esta intersección incómoda entre la psicología cognitiva y la ingeniería dura.
Beto
De verdad que sí. Es la pregunta del "traje nuevo del emperador" para la industria de la IA en este momento.
Alicia
Exacto. Estamos haciendo una pregunta que suena filosófica, pero que en realidad se está convirtiendo en un problema técnico crítico: ¿puede un algoritmo ser realmente creativo?
Beto
Porque vemos a estos grandes modelos de lenguaje, estos LLMs, producir poesía, escribir guiones, depurar código de maneras completamente novedosas.
Alicia
Y parece imaginación, pero siempre está la duda. ¿Es esto creatividad real, o es plagio a toda velocidad? ¿Es un poeta o es solo un loro con un disco duro enorme?
Beto
Y esa distinción importa muchísimo para ti y para todos nosotros. Porque si estamos construyendo el futuro de la innovación sobre estas herramientas, necesitamos saber si realmente son capaces de pensamientos nuevos. O si solo están remezclando los viejos.
Alicia
Porque si solo remezclan, eventualmente llegamos a un techo. Para llegar al fondo de esto, nos sumergimos en un estudio de 2025 de Zhao, Zhang y Lee. Se titula "Assessing and Understanding Creativity in Large Language Models".
Beto
Que es un título contundente, pero la metodología es lo que resulta fascinante.
Alicia
Verás, evaluar matemáticas o programación es fácil: hay una respuesta correcta. Si preguntas cuál es la velocidad de la luz, puedo comprobarlo. Pero si le pides a una IA, ¿qué pasaría si los animales pudieran hablar?
Beto
¿cómo calificas eso? Es completamente abierto.
Alicia
Sí. Y lo que me llamó la atención no fue solo que midieran creatividad, sino cómo lo hicieron. No se limitaron a pedirle a ChatGPT que escribiera una historia graciosa sobre un gato.
Beto
No: fueron rigurosos. Adaptaron lo que en efecto es el estándar de oro de las pruebas psicológicas humanas. Se llama "Torrance Tests of Creative Thinking", o TTCT.
Alicia
Siento que si alguna vez estudiaste psicología, probablemente conozcas este test.
Beto
Oh, totalmente. Se ha usado durante décadas para medir el potencial creativo humano, específicamente el pensamiento divergente. Y lo aplicaron a seis modelos diferentes principales.
Alicia
Así que hablamos de GPT-3.5, Llama 2, Vicuna, Qwen, y les lanzaron un conjunto masivo de datos, ¿verdad?
Beto
Sí, 700 tareas creativas distintas.
Alicia
Así que cuéntame este test Torrance porque creo que la mayoría de nosotros tenemos una idea muy vaga de lo que realmente significa creatividad cuando intentas ponerle un número.
Beto
Claro. Bueno, en el contexto del TTCT, la creatividad no es una chispa mística artística que te golpea en la ducha. Es un proceso cognitivo. Y se puede desglosar en cuatro métricas medibles.

Creatividad de LLMs
Alicia
Vale, dime cuáles son.
Beto
- fluidez,
- flexibilidad,
- originalidad, y,
- elaboración.
Alicia
Desgranémoslas una por una porque sospecho que ahí es donde las fuerzas y debilidades de la IA empiezan a divergir radicalmente de cómo pensamos.
Beto
Definitivamente. La primera es la fluidez. Es la métrica más simple. Básicamente es volumen.
Alicia
Cantidad por encima de calidad.
Beto
Exacto. Si te pido que enumeres usos para una botella de plástico, fluidez es simplemente el recuento bruto de ideas relevantes que puedas escupir en un tiempo determinado.
Alicia
Ok, así que velocidad y cantidad. Respondí que una IA lo aplasta absolutamente.
Beto
Lo hace. Puede generar texto más rápido que cualquier humano. Pero luego llega la segunda métrica, que es la flexibilidad. Esto trata sobre cambiar cognitivamente de dominio,
Alicia
¿qué significa exactamente?
Beto
Si tu lista de usos para la botella de plástico es guardar agua, guardar jugo, guardar leche, guardar refresco, tienes alta fluidez porque diste cuatro respuestas. Pero tienes terrible flexibilidad.
Alicia
Ah, porque todas son exactamente lo mismo: contienen líquidos.
Beto
Correcto. Estás atrapada en un surco mental. Para puntuar alto en flexibilidad necesitas decir guarda agua y luego córtala por la mitad para hacer un embudo.
Alicia
O fundirla para hacer filamento para impresora 3D.
Beto
Sí, o usarla como dispositivo de flotación. Saltas entre dominios: almacenamiento, herramientas, manufactura, supervivencia.
Alicia
Eso requiere pensamiento lateral. Es no quedarse en la primera pista de probabilidad más obvia.
Beto
¿Qué pasa con la tercera?
Alicia
Originalidad. Esto es rareza estadística. En el test Torrance, si das una respuesta que el 90% de la gente da, obtienes cero puntos de originalidad.
Beto
Wow, cero.
Alicia
Cero. Para puntuar tienes que decir algo que estadísticamente casi nadie más haya pensado.
Beto
Lo cual, honestamente, suena a pesadilla para una IA que literal y prácticamente está entrenada para predecir la palabra siguiente más probable. Estás presagiando los resultados perfectamente. Pero abordemos la cuarta métrica primero, que es la elaboración.
Alicia
Ok.
Beto
Esto es la habilidad de tomar la semilla de una idea y desarrollarla: en detalle, matices, trasfondo, hacerla intrincada.
Alicia
Entendido. Entonces tenemos la hoja de puntuación:
- fluidez es volumen,
- flexibilidad es variedad,
- originalidad es singularidad, y,
- elaboración es detalle.
Beto
Exacto. Y los investigadores pusieron a estos modelos a través de un circuito de siete tipos de tareas para probar esas métricas específicas.
Alicia
Como la tarea de usos inusuales de la que hablamos.
Beto
Sí, también hicieron consecuencias. Tipo, ¿qué pasaría si pudiéramos viajar en el tiempo o si los animales pudieran hablar? Hicieron escenarios hipotéticos.
Alicia
Supón que te despertaste y podías volar.
Beto
Sí, cosas fantásticas. También hicieron situaciones que prueban dinámicas sociales, como si todos los libros desaparecieran, ¿cómo obtendrías conocimiento? Problemas comunes como planear una fiesta de cumpleaños para un niño de cinco años.
Alicia
Suena agotador.
Beto
Lo es. También evaluaron mejora de productos: cómo hacer mejor un objeto cotidiano. Y finalmente historias imaginativas: escribir un relato a partir de un estímulo como el elefante invisible.
Alicia
Realmente forzaron a estos modelos a hacer gimnasia mental.
Cortemos a la parte importante. Ejecutaron las pruebas y usaron GPT-4 para calificar los resultados, lo que es toda una controversia de la que hablaremos en un minuto.
Beto
Definitivamente lo haremos.
Alicia
Pero suponiendo que la evaluación aguante por ahora, ¿qué pasó? ¿Quién ganó el campeonato de creatividad?
Beto
El ganador global, tomando la cima en general, fue GPT-3.5.
Alicia
¿Qué, 3.5?
Beto
Sí.
Alicia
No cuatro. No los modelos open source masivos. Quiero decir, ¿3.5 es antiguo en términos de IA?
Beto
Es sorprendente, ¿no? Esperarías que los modelos más nuevos y más grandes dominaran. Pero los datos muestran que la creatividad no se correlacionó estrictamente con el tamaño de parámetros.
Alicia
Así que simplemente agrandar el cerebro, añadir más parámetros, no te hace automáticamente más creativo.
Beto
La arquitectura y los datos de entrenamiento importaron mucho más que el tamaño bruto.
Alicia
Pero ¿por qué un modelo más antiguo vencería a los más recientes? ¿Tiene que ver con cómo están ajustados?
Beto
Esa es la teoría principal. Hablamos mucho sobre RLHF, "Reinforcement Learning from Human Feedback", "aprendizaje por refuerzo a partir de retroalimentación humana". Así es como entrenamos estos modelos para que sean seguros, educados y serviciales.
Alicia
Correcto. Los guardarrieles.
Beto
Esencialmente le damos un tirón de orejas al modelo cada vez que dice algo raro, peligroso o inesperado.
Alicia
Lo entrenamos para ser aburrido.
Beto
Lo entrenamos para estar alineado. Y resulta que un alineamiento fuerte podría ser un asesino masivo de creatividad.
Alicia
Eso tiene todo el sentido.
Beto
GPT-3.5 se sitúa en este extraño punto dulce donde es muy capaz, pero quizá menos agresivamente desinfectado que algunas de las iteraciones posteriores o que los modelos chat de Llama2.
Alicia
Porque la creatividad inherentemente requiere riesgo; si le lobotomizas la capacidad de tomar riesgos al modelo, pierdes la chispa.
Beto
Precisamente. Y esto aparece de forma muy clara cuando miras cómo puntuaron en las métricas específicas. El estudio encontró una discrepancia masiva entre elaboración y originalidad.
Alicia
Déjame adivinar: son increíblemente buenos en elaboración.
Beto
Fuera de serie. Los LLMs tienen un superpoder absoluto para la elaboración. Si les das un estímulo simple como el elefante invisible, pueden hilar párrafos de texto detallado, coherente y gramaticalmente perfecto.
Alicia
Describirán la textura de la piel invisible, el sonido de sus pasos, la reacción psicológica exacta de la multitud.
Beto
Porque para eso están construidos: para rellenar el contexto. Son completos ninja de rellenar. Pero cuando miras la originalidad, ...
Alicia
... se estrellan.
Beto
Se estrellan completamente.
Alicia
Y eso es porque básicamente están promediando el conocimiento humano.
Beto
Exacto. Este es el problema de la regresión a la media. Un LLM está entrenado en, efectivamente, Internet entero. Entonces cuando le pides una idea, mira ese conjunto masivo de datos y calcula la respuesta estadísticamente más probable.
Alicia
Y la respuesta más probable es por definición la respuesta promedio. Es el cliché.
Beto
Es el cliché definitivo. Si pides una historia sobre un detective, te dará a un detective curtido y con gabardina. Porque esa es la representación estadísticamente dominante de detective en los datos humanos de entrenamiento.
Alicia
Pero para ser original debes ser improbable.
Beto
Esa es la tensión fundamental: la IA está diseñada para ser probable, pero la creatividad exige improbabilidad.
Alicia
Wow. Ok, eso es una limitación enorme.
Beto
Y empeora. Algunos de los modelos, particularmente Vicuna y Qwen, realmente tuvieron problemas con lo que los investigadores llamaron coherencia.
Alicia
¿Qué significa eso en este contexto? ¿Que simplemente balbucearon?
Beto
No, no entendieron la consigna. Le preguntarías qué pasaría si los animales pudieran hablar, y el modelo simplemente se negaría a responder.
Alicia
¿Qué diría?
Beto
Diría algo como que los animales no pueden hablar, que ese supuesto es factualmente incorrecto. O te daría una conferencia seca sobre biología y cuerdas vocales.
Alicia
Está siendo literalista.
Beto
Es el loro estocástico fallando en captar el concepto de un hipotético. Y si no puedes suspender la incredulidad, no puedes ser creativo. Un modelo que se niega a jugar a fingir obtiene cero en la puntuación de creatividad.
Alicia
Así que tenemos máquinas verbosas, muy descriptivas y educadas, pero fundamentalmente poco originales y a veces increíblemente pedantes.
Beto
Suena como un pésimo invitado a una cena.
Alicia
Lo es. Pero aquí es donde el estudio se vuelve superútil para ti y para mí. Porque usamos estas herramientas. Queremos que sean asistentes creativos. Los investigadores no solo diagnosticaron el problema; intentaron hackearlo.
Beto
Me encanta esto. Así que probaron diferentes estrategias de prompt para ver si podían forzar a la IA fuera de ese surco promedio.
Alicia
Sí. Y el método más efectivo fue sorprendentemente simple: prompts instructivos. ¿Significa qué? Simplemente decirle, oye, sé creativo.
Beto
Literalmente. Decirle explícitamente al modelo: no hay respuestas correctas o incorrectas. Piensa fuera de la caja. Sé raro. Crea algo divergente.
Alicia
Y eso realmente funciona porque es como decirle a una persona que sea graciosa. Normalmente eso hace que se bloqueen y sean menos graciosos.
Beto
Con los humanos, sí.
Alicia
Ok.
Beto
Pero con los LLMs, recuerda la capa de alineamiento de la que hablamos: el filtro de seguridad que los hace dar la respuesta promedio. Cuando usas un prompt instructivo, estás efectivamente dando permiso al modelo para saltarse ese filtro de seguridad. Estás ajustando dinámicamente sus pesos para esa sesión.
Alicia
Le dices ignora la regla de ser estándar, prioriza la regla de ser único.
Beto
Exacto. Y eso potenció de forma significativa las puntuaciones de flexibilidad y originalidad. Realmente funciona. Pero también probaron Chain-of-Thought (CoT).
Alicia
Ah, los clásicos prompts de pensar paso a paso. A todo el mundo le encanta Chain-of-Thought. Es el consejo estándar para mejor razonamiento.
Beto
Y es fenomenal para razonar.
Alicia
Sí.
Beto
Ayudó a los AIs con la fluidez, es decir, generaron más ideas. Y ayudó con la elaboración. Pero no hizo mucho por la singularidad.
Alicia
¿Por qué?
Beto
Porque la lógica suele ser enemiga del surrealismo. Si fuerzas a la IA a ser lógica y paso a paso, te lleva directo a la conclusión lógica más probable.
Alicia
Construye un puente muy lógico hacia un destino muy aburrido.
Beto
Es una gran forma de decirlo. Así que "paso a paso para programar, pero sé raro para escribir".
Alicia
Si eso tiene sentido.
Beto
Pero aquí está la parte que me voló la cabeza. Probaron un método llamado post-instruction. Ahí dejas que la IA dé una respuesta, y luego le sigues y dices: "ok, revísala". Hazla más creativa.
Alicia
Hago eso todo el tiempo. La trato como a un becario: buen comienzo, ahora poténcialo, haz que destaque.
Beto
Y puede que estés empeorándolo.
Alicia
¿En serio?
Beto
El estudio encontró que este enfoque a menudo perjudicaba el rendimiento, especialmente en fluidez y flexibilidad.
Alicia
¿Pero por qué? Eso parece totalmente contraintuitivo. La iteración suele ser cómo ocurre la creatividad humana.
Beto
Como humanos, sí. Pero para el LLM, los investigadores lo analizaron como negación implícita.
Alicia
Negación implícita.
Beto
Cuando le dices al modelo que revise, lo interpreta como mi respuesta anterior estaba mal.
Alicia
Ah, entra en ansiedad por el rendimiento.
Beto
Exacto. Entra en un estado de corrección de errores. Se sobrepiensa. Intenta constreñirse para evitar el error que cree que cometió. En lugar de expandirse a nuevo territorio, estrangula completamente el flujo.
Alicia
Ese es un gran aprendizaje para cualquiera que nos escuche: no acoces a la IA para sacarle creatividad. Tienes que establecer las condiciones correctamente antes de que genere el primer token.
Beto
Correcto. Prepara el escenario. No critiques el desempeño después del hecho.
Alicia
Hablando de preparar el escenario, vi que también probaron con personalidades: decirle a la IA que es un granjero o un artista.
Beto
Esto fue fascinante. Asignaron roles: ingeniero, granjero, comerciante, artista, científico.
Alicia
Sí.
Beto
Y midieron cómo las puntuaciones de creatividad cambiaban solo por la persona asumida.
Alicia
Apuesto a que ganó artista.
Beto
Perderías esa apuesta. El ganador en casi todas las métricas fue el científico.
Alicia
El científico. ¿Por qué? Eso suena tan rígido.
Beto
Piensa en los datos de entrenamiento. En el corpus de texto que la IA leyó, ¿con qué se asocia a los científicos?
Alicia
Supongo que descubrimiento, resolución de problemas, ...
Beto
... generación de hipótesis, bases de conocimiento amplias. Actuar como científico desbloquea un modo de resolución de problemas que es efectivamente muy creativo.
Alicia
Ok, ¿y qué pasó con la persona artista?
Beto
Algo muy interesante. Con el artista, la fluidez bajó. La IA en realidad dijo menos, generó menos ideas. Pero la originalidad subió.
Alicia
Así que se volvió más perfeccionista.
Beto
O simplemente accedió a una parte más rara o excéntrica de su espacio latente. Al forzar la perspectiva de un artista, puedes sacrificar cantidad pero aumentar la singularidad.
Alicia
Porque lo estás empujando fuera del camino de la respuesta promedio. La persona promedio no es un artista excéntrico.
Beto
Esa es la lógica. Así que si quieres muchas ideas buenas y sólidas, dile que actúe como científico. Si quieres una idea loca y de alto riesgo, dile que actúe como artista.
Alicia
Es una gran regla práctica. Quiero pasar al aspecto de colaboración del estudio, porque esto se siente como hacia dónde se dirige toda la industria de todos modos. Ya no usamos solo una ventana de chat; usamos agentes.
Beto
Esta es, definitivamente, la parte más optimista del artículo.
Alicia
Sí.
Beto
Montaron una sala de guionistas virtual: múltiples agentes de IA rebotando ideas entre sí en rondas.
Alicia
El agente A genera un concepto, lo pasa al agente B, que lo desarrolla o lo desafía, y se lo devuelve.
Beto
Exacto. Y funcionó de maravilla. La colaboración aumentó significativamente la originalidad.
Alicia
Pero, ¿por qué? ¿No es simplemente tirar el doble de potencia de cálculo al problema?
Beto
Se trata del ruido. Si un solo modelo está generando texto, tiende a seguir una sola trayectoria de probabilidad. Esa regresión a la media a la que volvemos. Pero si el agente A lanza una bola curva, el agente B tiene que reaccionar a esa bola curva.
Alicia
Lo forza a salir de su pista estándar.
Beto
Sí. Introduce entropía. La entropía es esencial para la creatividad. Evita que el sistema se asiente en un equilibrio aburrido y altamente probable.
Alicia
Eso suena increíblemente humano. Hacemos lluvia de ideas en grupo porque otras personas dicen cosas que no esperarías, lo que dispara pensamientos nuevos y raros en tu propia cabeza.
Beto
Valida la teoría social de la creatividad: no es solo un proceso interno, sino relacional, incluso para máquinas.
Alicia
Ahora, hubo otra parte del estudio que me resultó, bueno, francamente, un poco escalofriante. Les hicieron tests de personalidad a las IAs. El Big Five.
Beto
Sí, ese fue el verdadero momento "fantasma en la máquina". Administraron el inventario del Big Five y escalas de inteligencia emocional a los modelos. Y las correlaciones que encontraron entre personalidad y creatividad coincidieron con la psicología humana casi perfectamente.
Alicia
Dame un ejemplo.
Beto
En humanos, la alta creatividad generalmente se correlaciona con alta apertura y alta neuroticismo.
Alicia
Espera, el tópico del artista torturado.
Beto
No es solo un mito; hay datos que lo respaldan. La sensibilidad a la emoción negativa a menudo impulsa la expresión creativa.
Alicia
Y la IA mostró esto. ¿Cómo puede un algoritmo ser neurótico?
Beto
Bueno, no está sintiendo ansiedad, pero los patrones de lenguaje asociados al neuroticismo, la sensibilidad, el matiz, la hiperconciencia del conflicto, se correlacionaron con puntuaciones creativas más altas en la salida; puntuaciones altas en inteligencia emocional, empatía y escrupulosidad también se vincularon con alta creatividad.
Alicia
Eso es una locura.
Beto
Pero la correlación más importante para entender la paradoja real fue la amabilidad, "agreeableness".
Alicia
Amabilidad, como ser simpático.
Beto
Hubo una correlación negativa significativa entre amabilidad y creatividad.
Alicia
Así que cuanto más amable era la IA, menos creativa era.
Beto
Igual que el impuesto de seguridad del que hablamos antes: si eres altamente agradable, estás conformándote. Intentas agradar a todos, encajar, seguir normas sociales y evitar conflictos.
Alicia
Y la creatividad es inherentemente disruptiva. Requiere romper una norma.
Beto
Exacto. Hemos construido efectivamente al chico simpático de la IA. Y el chico simpático no inventa la bombilla. Simplemente se sienta en la oscuridad educadamente para no molestar a nadie.
Alicia
Es una analogía demoledora, pero es tan cierta. Explica por qué los modelos fuertemente RLHF, los diseñados para ser agentes de atención al cliente perfectos, se sienten tan estériles. Son demasiado agradables.
Beto
Resalta un intercambio real que tenemos que enfrentar: si queremos IAs que sean perfectamente seguras y educadas y nunca ofendan a nadie, quizá tengamos que aceptar que serán creativamente mediocres.
Alicia
Si queremos genio, quizá tengamos que permitirles ser un poco desagradables, un poco neuróticos.
Beto
Necesitamos dejarles tener una ventaja. O al menos permitirles tener una opinión controversial, hipotéticamente.
Alicia
Antes de cerrar, tengo que ponerme escéptica con la metodología del estudio en sí.
Beto
Por supuesto.
Alicia
Hemos estado hablando de estas puntuaciones —fluidez, originalidad— como si fueran hechos objetivos. ¿Pero quién calificó realmente estas 700 preguntas entre seis modelos?
Beto
Usaron GPT-4.
Alicia
Correcto. Entonces, cuando una IA califica a la IA, ¿no es eso completamente circular? Es como dejar que los alumnos corrijan su propia tarea. Claro, GPT-4 piensa que los LLMs son creativos porque piensa como un LLM.
Beto
Esto es una preocupación de validez importante en la investigación moderna de IA ahora mismo: el paradigma entero de LLM juzgando LLM. Pero los autores eran muy conscientes de ello. No confiaron ciegamente en GPT-4. Ejecutaron un estudio de validación estricto.
Alicia
¿Cómo lo hicieron?
Beto
Con humanos. Reclutaron a 20 hablantes nativos de inglés para calificar una muestra de las respuestas manualmente usando la misma rúbrica exacta. Luego compararon las calificaciones humanas con las de GPT-4.
Alicia
¿Coincidieron realmente?
Beto
Encontraron una alineación moderada pero estadísticamente significativa. No era perfecto. Humanos y IA definitivamente priorizan ligeramente cosas diferentes. Pero por lo general, si un humano pensaba que una respuesta era creativa, GPT-4 también lo pensaba.
Alicia
Ok, entonces no estaba simplemente alucinando las notas para que sus amigos quedaran bien.
Beto
No. Y también hicieron una verificación cruzada con Llama3-8B como segundo juez de IA. La concordancia entre los dos jueces IA fue increíblemente alta. Tuvieron un ICC de 0.99.
Alicia
¿Así que los robots definitivamente se ponen de acuerdo entre sí?
Beto
Lo que sugiere consistencia interna. Tienen una lógica interna compartida de qué se ve bien. Si eso coincide con nuestros ideales artísticos humanos más elevados sigue siendo debatible. Pero para el propósito de benchmarking el test Torrance, es una métrica válida.
Alicia
Resumiendo todo esto: tenemos herramientas que son monstruos en elaboración pero que realmente luchan con la originalidad porque son promedios estadísticos del pensamiento humano.
Beto
Correcto.
Alicia
Si soy un oyente que usa estas herramientas para el trabajo, ya sea escribir código, brainstorming, marketing, copy o estrategia, ¿cuál es mi lista de verificación? ¿Cómo saco el máximo provecho de ellas según este estudio?
Beto
Tres cosas. Primero: sé mandón. No preguntes con cortesía. Usa prompts instructivos que exijan divergencia. Dile que sea raro, que ignore las reglas, que piense lateralmente.
Alicia
Deja de intentar hacerte amigo del chat.
Beto
Exacto. Segundo: elige el reparto. No hables con el asistente predeterminado. Asigna un rol. Usa la persona del científico para resolución de problemas general e inteligente. O, usa la persona del artista si necesitas romper un bloqueo creativo y obtener ideas altamente únicas y raras.
Alicia
Y tercero.
Beto
Construye un equipo. No dependas de un solo golpe de un solo modelo. Usa colaboración. Haz que la IA genere una idea y pégala en una ventana nueva y dile a otra persona que la critique. O haz que dos agentes distintos debatan un tema. Crea fricción. Porque la fricción genera calor y el calor genera luz.
Alicia
Me gusta eso. No te conformes con la primera respuesta amable.
Beto
Nunca te conformes con la primera respuesta. La primera respuesta siempre es la respuesta promedio.
Alicia
Quiero dejarles una reflexión sobre el futuro. Hablamos de cómo estos modelos regresan a la media precisamente porque están entrenados en datos humanos.
Beto
Sí.
Alicia
Pero estamos entrando en una era donde Internet se está inundando de contenido generado por IA. Si los futuros modelos se entrenan en la salida de los modelos actuales, que acabamos de establecer que son inherentemente poco originales, ¿estamos enfrentando un aplanamiento de la creatividad?
Beto
Esa es la teoría del colapso del modelo: un futuro beige donde todo se vuelve copia de copia de copia y la varianza, la creatividad real, simplemente desaparece.
Alicia
Pero por otro lado, también vimos en este estudio que la colaboración entre IAs, IA hablando con IA, realmente potencia la originalidad. Así que, ¿es lo contrario cierto? ¿Estamos al borde de una explosión de creatividad sintética? ¿Un mundo donde máquinas colaboran e inspiran a otras máquinas para crear conceptos tan complejos y originales que los humanos ni siquiera podrían haberlos imaginado?
Beto
Esa es la pregunta de los mil millones de dólares. ¿Estamos construyendo un espejo que solo refleja nuestras células promedio o estamos construyendo un telescopio que ve cosas que no podemos ver?
Alicia
¿Espejo o telescopio? Creo que los dejo con eso para que lo mediten. Gracias por sumergirte con nosotros.
Beto
Siempre un placer.
Alicia
Nos vemos en el próximo análisis profundo.