Este artículo presenta InfoAlign, un sistema de cocreación humano-IA diseñado para simplificar la producción de infografías narrativas a partir de textos largos o no estructurados. Los investigadores establecieron un flujo de trabajo centrado en la narrativa, que incluye la construcción de la historia, la codificación visual y la composición espacial para mantener la coherencia entre la intención del usuario y el diseño final. Mediante el uso de grandes modelos lingüísticos para la extracción de información y algoritmos especializados para la generación de diseños, el sistema recomienda elementos visuales semánticamente alineados y flujos de lectura lógicos. La intervención humana permite a los usuarios refinar cada etapa del proceso, asegurando que el resultado refleje sus objetivos específicos en lugar de plantillas rígidas. Las evaluaciones indican que la herramienta ayuda eficazmente a los creadores a producir narrativas coherentes y estéticas con mucho menos esfuerzo que los métodos manuales. En definitiva, la investigación demuestra cómo el diseño asistido por IA puede preservar la integridad narrativa al tiempo que empodera a los usuarios mediante la autoría colaborativa.
Enlace al artículo científico, para aquellos interesados en profundizar en el tema: "InfoAlign: A Human–AI Co-Creation System for Storytelling with Infographics", por Jielin Feng y colegas. Publicado el 26 de Febrero de 2026.
El resumen, la transcripción, y la traducción fueron hechas usando herramientas de software de Inteligencia Artificial.
El resumen se presenta en la forma de un diálogo entre dos personajes sintéticos que llamaremos Alicia y Beto.
Resumen
Alicia
Si le entregas a tu jefe un informe de datos de 30 páginas, quizá lea el 10% como mucho. Pero si conviertes esos mismos datos en una maqueta visual, una infografía realmente bien hecha, la comprensión y la retención se disparan.
Beto
En serio: cambia las reglas del juego.
ABeto
El problema es que hacer ese visual suele llevar, bueno, 50 horas, un montón de frustración y, honestamente, casi un título en diseño gráfico. A menos que tengas las tres cosas, normalmente terminas lidiando con plantillas rígidas de software y produciendo algo que parece un scrapbook caótico.
Beto
Es un cuello de botella enorme. Sabemos que la narración visual funciona a nivel cognitivo, pero la barrera para hacerlo de forma efectiva es extraordinariamente alta para la persona promedio.
Alicia
Y precisamente por eso hoy desglosamos un artículo muy esperado de la conferencia CHI 2026. Para quienes no están metidos en lo académico, CHI significa "Computer Human Interaction".
Beto
Básicamente es la sede de referencia para la investigación sobre cómo realmente usamos la tecnología.
Alicia
Exacto. El artículo presenta un sistema llamado InfoAlign. Es un sistema de co-creación humano-IA que toma texto largo, no estructurado y caótico, y lo transforma en infografías profesionales orientadas a narrativas.
Beto
Nuestro material de hoy es el artículo completo de investigación que describe toda la arquitectura de InfoAlign. Documenta entrevistas formativas con diseñadores profesionales y el análisis de 70 infografías reales para encontrar las reglas matemáticas del diseño, además de un estudio de comportamiento de usuarios realmente fascinante.
Alicia
Que muestra cómo la gente interactúa con esta herramienta en el mundo real.

InfoAlign - Reduciendo la brecha entre texto complejo y narrativa visual
Alicia
Nuestra misión en este análisis profundo es deconstruir cómo funciona la narración visual. Vamos a revelar las reglas ocultas del diseño de infografías para que entiendas la ciencia detrás de hacer información compleja inolvidable.
Beto
Esa es una gran forma de enmarcarlo.
Alicia
Y quedémonos claros desde el principio: esto no es otra historia sobre la IA reemplazando a los diseñadores humanos. Es una exploración de cómo la IA puede actuar como andamiaje de inteligencia para la creatividad humana.
Beto
Para entender por qué InfoAlign supone un salto tan grande, primero hay que mirar la línea base profesional. Los investigadores se sentaron con ocho diseñadores profesionales de infografías para mapear sus dificultades cotidianas. Y lo interesante es que casi nunca empiezan con una hoja de cálculo perfectamente organizada y limpia.
Alicia
No: empiezan con el desorden. PDFs de muchas páginas, notas dispersas, un gran revoltijo de texto bruto. El mismo tipo de muro de texto abrumador que nos hace desconectar antes de leer la primera palabra.
Beto
Exacto. Esa fricción psicológica inicial es muy real. Cuando estos profesionales evalúan las herramientas comerciales actuales —plataformas como Venngage o PiktoChart, por ejemplo— las encuentran muy deficientes para manejar ese desorden.
Alicia
Porque esas herramientas dependen tanto de plantillas automatizadas rígidas, ¿verdad?
Beto
Sí. Te piden encajar tus datos complejos en cajas estáticas preexistentes.
Alicia
Me recuerda a comprar un traje hecho y fuera de medida. Técnicamente te cubre, pero nunca te queda bien porque no considera tu forma específica. Las herramientas actuales obligan a tus datos únicos a entrar en una caja genérica.
Beto
Es una analogía perfecta. Los diseñadores señalaron que pequeñas desalineaciones en esas plantillas rígidas se convierten rápido en una bola de nieve. Intentas meter un punto extra en una caja que no fue diseñada para eso y de repente...
Alicia
Se arruina todo.
Beto
Toda la jerarquía visual se rompe. El mensaje se fragmenta. Lo fascinante es que la filosofía central que guía a estos profesionales es una regla estricta: "Primero la información, luego el gráfico".
Alicia
Primero la información, luego el gráfico. Me gusta eso.
Beto
Porque el diseño de infografías es en realidad una forma rigurosa de narración basada en datos. Si no estructuras primero la historia subyacente, no hay cantidad de colores bonitos o iconos chulos que salven el producto final.
Alicia
Tiene sentido. La tela de tus datos debería dictar el corte del diseño. Debe ser sastrería a medida. Pero, ¿cómo ejecutamos esa fase de "primero la información"? ¿Cómo enseñamos a una IA a leer un documento denso de 10.000 palabras y extraer una historia coherente?
Beto
El sistema InfoAlign aprovecha un gran modelo de lenguaje, específicamente GPT-4O Mini, para extraer una estructura narrativa. Pero no se limita a resumir el texto a ciegas. Deconstruye matemáticamente el documento basándose en una consulta de usuario muy específica.
Alicia
Pongámoslo con un ejemplo. Si subo, digamos, un enorme conjunto de datos históricos sin estructura sobre el Titanic, ¿cómo lo procesa la IA?
Beto
Supongamos que tu consulta específica sobre ese conjunto es: ¿qué factores influyen en la tasa de supervivencia?
La IA escanea todo el documento con esa lente y luego lo divide en dos categorías distintas: piezas de la historia y unidades de la historia.
Alicia
Ok. Piezas de la historia y unidades de la historia.
Beto
Una pieza de la historia es un argumento principal o un tema global. Por ejemplo, una pieza podría ser la influencia del género: es la categoría analítica amplia. Dentro de esa pieza están las unidades de la historia. Esas son las ideas localizadas y de datos duros. Por ejemplo, una unidad sería el dato específico: 339 mujeres sobrevivieron de 466 a bordo.
Alicia
Esto suena bien en teoría, pero ¿cómo sabe la IA qué es lo que yo, el humano, realmente me importa? ¿Y si veo los datos extraídos y mi objetivo narrativo cambia a mitad de camino? No quiero que un algoritmo me encierre en una narrativa.
Beto
Absolutamente. Para evitar eso, el sistema incorpora una interfaz con humano en el bucle llamada "vista de la historia". No te lanza una imagen final. Se detiene. Te muestra la estructura textual desnuda. Primero puedes revisar esas piezas y unidades de la historia.
Alicia
Puedes editar antes de que intente diseñar nada.
Beto
Exacto. Puedes borrar lo que no te interesa, reescribir una unidad concreta o ajustar todo el alcance narrativo antes de que se elija un solo color o gráfico.
Alicia
Pero eso exige que la IA sea increíblemente precisa, ¿no? Porque si inventa datos durante la extracción, toda la base se viene abajo.
Beto
Sí. La fiabilidad es una de las partes más impresionantes del artículo. En el estudio de usuarios, la IA extrajo hechos con una tasa de exactitud factual del 95,73%, con literalmente cero declaraciones incorrectas que contradijeran el material fuente.
Alicia
Espera. ¿Cero alucinaciones en la extracción de datos? ¿Cómo es eso posible con un LLM? Suelen inventarse cosas todo el tiempo.
Beto
Se debe a restricciones arquitectónicas estrictas. El sistema usa una ingeniería de prompts muy acotada que restringe al LLM a tareas únicamente extractivas. Está explícitamente prohibido que genere conocimiento fuera del documento.
Alicia
Oh. No puede adivinar.
Beto
Correcto. Se ancla totalmente al documento que subes. También usa lo que llaman lógica narrativa para conectar esos puntos extraídos.
Alicia
Lógica narrativa. El artículo menciona algo sobre arrecifes de coral, ¿no?
Beto
Sí. Por ejemplo, si subes datos sobre arrecifes de coral, la IA puede estructurar una pieza llamada "amenazas" y conectar las unidades internas usando lógica de causa y efecto.
Alicia
OK, ¿cómo trabaja eso?
Beto
Enlaza la unidad "70% a 90% de los arrecifes podrían perderse" directamente con la unidad "60% de los arrecifes están sobreexplotados". Construye un argumento lógico, paso a paso.
Alicia
Ah, ya veo. No se limita a volcar una lista de estadísticas sin relación: crea un flujo.
Beto
Precisamente.
Alicia
Entonces, tenemos una historia estructurada y lógicamente sólida alineada con mi intención. Pero el texto sigue siendo solo texto. ¿Cómo traduce la IA una estadística seca en algo visualmente intuitivo? Ahí es donde mis propios proyectos suelen venirse abajo.
Beto
Entramos en la fase de codificación visual. InfoAlign usa tres técnicas específicas para convertir texto en cognición visual: mapeo semántico, énfasis narrativo, y visualización de hallazgos.
Alicia
OK, hablemos sobre ellos. Me imagino que mapeo semántico se encarga del aspecto estético, el tono de la imaginería.
Beto
Sí, maneja el estado de ánimo, y las imágenes. El sistema analiza el peso semántico de tu texto para sugerir una paleta de colores temática y genera íconos vectoriales mediante una herramienta llamada Recraft AI. Volviendo al ejemplo del Titanic, el sistema entiende el contexto trágico de los datos, y evita colores alegres; sugiere una paleta sobría en azules y púrpuras.
Alicia
Eso tiene sentido.
Beto
Y para la unidad sobre pasajeras, genera automáticamente un ícono vectorial personalizado de una mujer para representar ese dato visualmente.
Alicia
Así que está haciendo el trabajo estético por ti. ¿Y el texto en sí? Porque cuando veo una buena infografía, mis ojos van primero a los números grandes y en negrita.
Beto
Esa sensación de lectura sin esfuerzo está muy diseñada. Esa es la segunda técnica: énfasis narrativo. Piensa en esto como lo hace un director de cine. Decide dónde se debe enfocar la cámara.
La IA escanea la unidad de historia y divide el texto en destacados primarios y secundarios.
Alicia
Ah, crea una jerarquía visual.
Beto
Exacto. Encuentra el número crítico —por ejemplo, 339— y lo convierte en el destacado primario, como un primer plano extremo del protagonista. Luego toma la información contextual —"de 466 a bordo"— y la coloca como destacado secundario, el fondo ligeramente desenfocado que sitúa la escena.
Alicia
Me gusta esa analogía del director de cine. Controla los ojos de la audiencia, diciéndoles exactamente dónde deben mirar.
Beto
Desde la psicología cognitiva, esto combate la sobrecarga de información: en vez de una frase de 50 palabras que obliga a tu cerebro a gastar energía para desentrañar el significado.
Alicia
Correcto. Te cansas antes de que puedas entender el punto.
Beto
Exacto. Pero al traducir la oración en un número grande, una etiqueta contextual y un ícono reconocible, la barrera cognitiva baja drásticamente y el dato se procesa casi al instante.
Alicia
Ok, pero espera. Muchos infográficos usan gráficos, y yo soy culpable de elegir un gráfico de pastel para todo en Excel porque es el valor por defecto. ¿El sistema adivina qué gráfico queda mejor?
Beto
No: eso es la tercera técnica, visualización de hallazgos. InfoAlign emplea un mapeo basado en reglas para evitar malas decisiones de visualización. Si una unidad de la historia contiene una proporción respecto a una sola entidad, digamos una tasa de supervivencia del 61,9%, el sistema la mapea inteligentemente a un gráfico de pastel o dona.
Alicia
Porque es parte de un todo.
Beto
Correcto. Pero si los datos requieren un ranking o comparación entre varias entidades, forza un gráfico de barras. Entiende qué vehículo visual lleva qué tipo de carga matemática.
Alicia
Ok. Ya tenemos todas las piezas a medida: el texto refinado, los números grandes, los iconos semánticos y los gráficos elegidos con rigor. Pero ahora hay que colocarlos en la página. Si simplemente tiro todos estos elementos sobre el lienzo, seguirá pareciendo un caos. ¿Cómo sabe un LLM cómo ordenar cajas en una página?
Beto
No lo sabe.
Alicia
¿De verdad?
Beto
Sí. Ése es el secreto de la arquitectura del sistema. Los LLM son fenomenales extrayendo texto y entendiendo semántica, pero son terribles en razonamiento espacial.
Alicia
Verdad. No tienen ojos.
Beto
Exacto. Predicen texto; no procesan geometría. Si pides a un LLM que dibuje un layout, probablemente generará texto superpuesto, márgenes raros y un espaciado caótico.
Para solucionarlo, los investigadores tuvieron que descifrar el código matemático del diseño humano.
Alicia
Wow. ¿Cómo entendieron las matemáticas de algo tan subjetivo como el diseño?
Beto
Analizaron 70 infografías reales y exitosas de Pinterest, dejando de lado colores y temas para estudiar los esqueletos estructurales subyacentes.
Alicia
¿Y qué encontraron?
Beto
Encontraron seis tipos principales de disposiciones: cuadrícula, estrella, retrato, paisaje, cuadrícula en retrato y espiral.
Alicia
OK. El sistema elige uno de esos seis, según la historia que estás contando.
Beto
Sí. La IA usa un algoritmo basado en reglas, para recomendar la mejor disposición, basado en la estructura narrativa que extrajo anteriormente.
Alicia
Dame un ejemplo.
Beto
Por ejemplo, si tus datos consisten en muchas piezas de la historia débilmente conectadas, recomienda una cuadrícula porque la cuadrícula da a cada elemento su propio espacio independiente. Si las piezas fluyen cronológicamente, el layout se adapta: para hitos secuenciales, sugiere una espiral; el movimiento físico del ojo a lo largo de la espiral imita el paso del tiempo.
Alicia
Es bastante ingenioso.
Beto
Sí. Y si todo gira en torno a un tema central, propone una disposición en estrella, colocando la idea principal en el centro con soportes orbitando alrededor. La disposición (el layout) es, literalmente, una extensión de la lógica narrativa.
Alicia
Aquí se pone realmente interesante: la IA no solo decide a ojo dónde van las cajas. Establece límites matemáticos duros para proteger la legibilidad;
Beto
Establece estrictas medidas de protección. Nunca permitirá más de 10 piezas de la historia por infografía, y no más de cuatro unidades de la historia por pieza.
Alicia
¿Por qué esos números?
Beto
Porque sabe que ir más allá de ese umbral abruma al ojo humano y desencadena fatiga cognitiva. También aplica rigurosamente el principio Gestalt de proximidad.
Alicia
OK. Para aquellos de nosotros que no nos especializamos en psicología, ¿qué significa ese principio, en la práctica?
Beto
Piensa que estás en una cena en una fiesta. Si dos personas se encuentran cerca, en una esquina, tu cerebro automáticamente asume que llegaron juntas, o que están conversando. Las agrupas visualmente.
Alicia
Eso tiene sentido.
Beto
El principio Gestalt de proximidad se aplica de la misma manera, sobre una página. El algoritmo se asegura de que ideas, íconos y gráficos relacionados permanecen físicamente cerca entre sí, mientras que conceptos no relacionados se separan. Tu cerebro agrupa visualmente lo que está próximo sin necesidad de flechas o líneas explícitas.
Alicia
Y la geometría se calcula: no es arrastrar y soltar al azar.
Beto
El algoritmo ejecuta un proceso de optimización para asegurarse de que el texto, el icono y el gráfico dentro de una unidad específica ocupen una proporción geométrica uno-a-uno-a-uno.
Alicia
Wow. Así que está perfectamente balanceado.
Beto
Sí. Calcula las coordenadas x e y precisas de cada elemento para garantizar que nunca se solapen, que los márgenes estén balanceados y que el flujo de lectura tenga sentido lógico. Es un plano algorítmico que toma el relevo donde terminan las capacidades de los LLM.
Alicia
OK. El sistema funciona en teoría: tenemos la estructura narrativa, la codificación visual y el mapa espacial. Pero, ¿cómo se comportan los humanos al usarlo? Porque colaborar con una IA diseñadora suena a tener a un copiloto que te dice qué hacer.
Beto
Sí. Pensarías eso, pero los resultados del estudio de comportamiento son fascinantes. Los investigadores reclutaron a 12 creadores y les dieron datos sin estructura sobre temas muy diversos: prevalencia del tabaquismo, tendencias globales del matrimonio, e incluso un análisis comparativo del zodíaco oriental y occidental.
Alicia
Es una variedad grande. Cuando yo intento hacer algo así desde cero me paso horas moviendo cuadros de texto. ¿Cuánto tardaron ellos?
Beto
En promedio, a los participantes les tomó solo 20,3 minutos desde subir el texto bruto hasta exportar una infografía profesional completa.
Alicia
¿Veinte minutos? Un salto brutal en productividad. ¿Y qué hicieron exactamente en ese tiempo? ¿Pulsaron generar y aceptaron lo que dio la IA?
Beto
Para nada. Los registros de interacción muestran un patrón psicológico claro: rastrearon cada clic, eliminación y modificación. Los participantes delegaron casi totalmente en la IA las decisiones estructurales y analíticas.
Solo el 4% de los gráficos generados por la IA fueron modificados, y solo el 17,9% del texto extraído fue cambiado. Los usuarios confiaron fundamentalmente en la lógica de la IA, su extracción de datos y su matemática espacial.
Alicia
Pero no se quedaron pasivos.
Beto
No. Intervinieron mucho en la capa expresiva. Modificaron el 39,3% de los íconos generados y cambiaron el 41% de los destacados de texto.
Alicia
Es como jugar a los bolos con barreras: la IA pone los toboganes estructurales, los gráficos correctos, los marcos narrativos lógicos y la matemática espacial, manteniendo tu proyecto fuera de la cuneta, pero el humano sigue siendo quien lanza la bola.
Beto
Exacto.
Alicia
Aplicas tu toque único y estilo subjetivo ajustando colores, cambiando un ícono para alterar el tono emocional o moviendo un destacado para enfatizar otra palabra.
Beto
Y si lo conectamos con el objetivo general, esa dinámica es el secreto del éxito en la colaboración humano-IA.
Por contraste: La automatización pura —escribir un prompt y recibir una imagen terminada— elimina la autoría humana.
Alicia
No sientes que lo hayas hecho tú.
Beto
Exacto. Te hace sentir alienada de tu propio trabajo. Es un producto, no una creación.
InfoAlign triunfa porque se ocupa del trabajo tedioso y estructural, pero deja intencionadamente un amplio terreno de juego en la capa expresiva. Al final de esos 20 minutos, los usuarios sintieron una genuina sensación de cocreación y propiedad sobre la narrativa final.
Alicia
Esto plantea una gran pregunta sobre el futuro del trabajo. Si es tan fácil, si literalmente toma 20 minutos construir una narrativa a medida, matemáticamente balanceada y visualmente impresionante, ¿por qué no lo usamos para todo? ¿Por qué mandaría un informe largo por texto cuando podría enviar una infografía de 20 minutos que mi equipo realmente leerá y entenderá?
Beto
Ese es precisamente el cambio de paradigma que esta tecnología está acelerando. Al reducir drásticamente la barrera para el diseño visual profesional, cambias inevitablemente el modo por defecto de la comunicación humana.
Alicia
¿Qué significa todo esto para ti? Resumamos rápido el plan de acción que hemos descubierto: si quieres comunicar información compleja de forma efectiva, no puedes simplemente poner una plantilla bonita sobre una hoja de cálculo desordenada. Empieza con un marco claro de la historia.
Beto
Primero la información.
Alicia
Exacto. Extrae tus piezas principales y tus unidades de datos. Luego alinea tus visuales semánticamente, usando destacados primarios y secundarios para dirigir la mirada del lector exactamente donde la quieres. Y finalmente, deja que esa lógica narrativa subyacente dicte tu disposición espacial usando la matemática del diseño y el principio de proximidad para guiar el flujo de lectura.
Beto
Precisamente.
Alicia
Puedes aplicar este mismo plan la próxima vez que tengas que preparar una presentación para una reunión importante, ya sea usando una herramienta avanzada de IA o simplemente esbozando wireframes en una pizarra.
Beto
Es una clase maestra en la psicología de la comunicación visual. Y nos deja con una implicación profunda a considerar: a medida que herramientas de co-creación humano-IA como InfoAlign se vuelvan cotidianas, democratizando el diseño de datos hermoso para cualquiera con un teclado, ¿terminará el documento en texto sin formato o el informe corporativo largo quedando obsoleto?
Alicia
Ojalá que sí.
Beto
Si todos pudiéramos comunicar fácil y rápidamente enviando narrativas visuales, leer texto plano podría pronto sentirse como ver el mundo en blanco y negro.
Alicia
Del muro de texto a un mundo de color: me encanta.
Muchas gracias por acompañarnos en este análisis profundo. Sigue explorando las historias escondidas en tus datos y nos vemos la próxima vez.