Anthropic describe una transición hacia la auto-mejora recursiva, donde la inteligencia artificial gestiona cada vez más su propio ciclo de desarrollo. Los datos indican que la automatización impulsada por la IA ya ha acelerado drásticamente la productividad de la programación y la ejecución de la investigación, igualando o superando con frecuencia las capacidades humanas en tareas especializadas. Si bien esta aceleración tecnológica ofrece enormes beneficios potenciales para la ciencia y la salud, también introduce riesgos significativos en cuanto a la supervisión y el control humanos. La empresa identifica una brecha cada vez menor donde los humanos proporcionan principalmente juicios de alto nivel, aunque incluso esta función podría automatizarse en el futuro. En consecuencia, el texto enfatiza la necesidad urgente de marcos de coordinación y seguridad globales para gestionar un futuro en el que los sistemas de IA podrían diseñar de forma autónoma a sus propios sucesores.
Enlace al artículo, para aquellos que quieran profundizar en el tema: "When AI Builds Itself", por Marina Favaro, Jack Clark y colegas de Anthropic. Publicado en Junio de 2026.
El resumen, la transcripción, y la traducción fueron hechas usando herramientas de software de Inteligencia Artificial.
El resumen se presenta en la forma de un diálogo entre dos personajes sintéticos que llamaremos Alicia y Beto.
Resumen
Alicia
Sabes, es salvaje lo rápido que cambia nuestra línea base de lo que se considera normal.
Beto
Oh, absolutamente. Sucede en un abrir y cerrar de ojos.
Alicia
Correcto. Y quiero que imagines, por un segundo, que eres un ingeniero de software, en una empresa tecnológica de primer nivel. Es a mediados de 2026. Te sientas en tu escritorio. Revisas tu código fusionado del trimestre, y te das cuenta de que acabas de enviar ocho veces más código de lo que hiciste solo hace dos años, en 2024. Ocho veces.
Beto
Es un salto masivo.
Alicia
Correcto. Y aquí está el punto clave. A partir de mayo de 2026, más del 80% del código que se está fusionando en la base de código central de tu empresa, ni siquiera fue escrito por ti. No fue escrito por ningún humano. Fue desarrollado enteramente por una IA.
Beto
Y esa clase de métrica, reencuadra por completo nuestra comprensión de la producción humana.
Alicia
Sí, lo hace.
Beto
Estamos viendo un informe exhaustivo, a mediados de 2026, de Anthropic, y está titulado "Cuando la IA se construye a sí misma". Y estos son datos internos, directamente de la frontera absoluta del desarrollo de IA. Nos está dando una mirada sin precedentes, de cómo la IA está siendo utilizada activamente para construir la próxima generación de IA.
Alicia
Y la misión de nuestro análisis profundo hoy es desgranar esto porque, sabes, esto no es solo una lista de nuevas características tecnológicas geniales, o una actualización incremental de software.
Beto
No, no.
Alicia
Estamos viendo una aceleración fundamental en cómo se fabrica la inteligencia. Nos estamos moviendo hacia un concepto llamado "auto-mejora recursiva". Y necesitamos entender lo que eso significa realmente para ti, para tu trabajo y solo para el futuro de cómo resolvemos problemas complejos.

Se Cierra el Ciclo: La Aceleración Hacia la Auto-Mejora de la IA
Beto
Exacto. Y para entender por qué este informe específico de Anthropic es tan crítico, primero necesitamos definir claramente ese término, sabes, "auto-mejora recursiva".
Alicia
Correcto. Porque suena un poco a ciencia ficción.
Beto
Lo hace. Pero esencialmente significa un sistema de IA capaz de diseñar y desarrollar totalmente de forma autónoma su sucesor.
Alicia
Vaya. Una inteligencia construyendo una inteligencia mayor.
Beto
Precisamente. Y históricamente, hemos confiado en estos puntos de referencia públicos para adivinar qué tan cerca estamos de ese punto. Pero los puntos de referencia públicos solo nos muestran lo que un modelo puede hacer en el vacío. Tener estos datos internos directos de un laboratorio de IA, nos da una imagen mucho más clara y, honestamente, mucho más urgente.
Alicia
Es como mirar debajo del capó.
Beto
Exacto. Estamos viendo la mecánica real de lo que sucede cuando diriges estos sistemas altamente capaces hacia adentro.
Alicia
De acuerdo. Desglosemos esto porque para entender cómo llegamos a ese asombroso número de productividad de 8x que mencionamos, realmente tenemos que mirar la línea de tiempo del papel de la IA en su propia creación.
Beto
Correcto.
Alicia
La duración de las tareas que estos modelos pueden ejecutar de forma autónoma simplemente ha explotado. El informe traza esto y es casi cómico lo rápido que se mueve.
Beto
Lo es.
Alicia
Como, de vuelta entre 2021 y 2023, lo que ahora se siente como historia antigua, los humanos escribían código manualmente, simplemente tecleando en portátiles. Luego, de 2023 a 2025, tuvimos chatbots.
Beto
La era de Copilot.
Alicia
Sí. Exacto. Le pedirías un fragmento. Lo copias, lo pegas, y le corriges los errores de sintaxis tú mismo.
Beto
Correcto.
Alicia
Pero luego llega 2025 a 2026 y los agentes de codificación comienzan a escribir archivos completos por su cuenta.
Beto
Y ahora tenemos agentes autónomos que no solo están escribiendo el código. Lo están ejecutando ellos mismos. Lo están probando y están delegando horas de trabajo complejo a otros agentes especializados.
Alicia
Es increíble.
Beto
Y la evidencia externa valida perfectamente este cambio interno. La duración de una tarea y el modelo de IA puede completar de forma confiable por sí solo solía duplicarse cada siete meses.
Alicia
De acuerdo.
Beto
Ahora se está duplicando cada cuatro meses.
Alicia
El salto en esos números es difícil de asimilar. Veamos los modelos reales por un segundo. En marzo de 2024, Claude Opus 3 podía manejar tareas que le tomaban al humano unos cuatro minutos.
Beto
Correcto.
Alicia
Un año después, Sonnet 3.7 podía hacer una hora y media de trabajo continuo.
Beto
Sí.
Alicia
Y luego en marzo de 2026, Claude Opus 4.6 está manejando tareas que le toman 12 horas.
Beto
Es exponencial.
Alicia
Es como si hubiéramos pasado, de tener una calculadora elegante en nuestro escritorio, a contratar una gran empresa de contadores autónomos que trabajan un turno continuo de 12 horas mientras nosotros dormimos.
Beto
Esa es una gran manera de decirlo.
Alicia
Pero espera, tengo que poner objeción aquí.
Beto
Bien, adelante.
Alicia
Cualquiera que haya usado un chatbot sabe que puede confundirse o, simplemente perder completamente el hilo.
¿Son estas tareas de 12 horas realmente dando como resultado un trabajo confiable y utilizable? ¿O es que la IA solo está generando 12 horas de alucinaciones altamente confiadas que algún pobre ingeniero humano tiene que pasar 14 horas en desenredar?
Beto
No, es una pregunta muy justa. Y el miedo a la deuda técnica automatizada es una preocupación muy real en la industria ahora mismo.
Alicia
Correcto.
Beto
Pero los datos muestran que esto realmente no son alucinaciones. El informe apunta a datos de MBTR. Son una organización que realiza puntos de referencia para tareas de IA de larga duración. Y encontraron que Claude Mythos Preview podría funcionar de forma confiable por al menos 16 horas.
Alicia
Espera, 16 horas seguidas.
Beto
Seguidas. Y el mecanismo de cómo evita alucinar durante ese largo tramo es fascinante.
Alicia
¿Cómo lo logra?
Beto
Bueno, en lugar de solo generar un largo flujo de texto, el sistema utiliza un bucle agente.
Alicia
¿Qué quiere decir?
Beto
Lo que significa que pausa, consulta sus propios pasos anteriores. Ejecuta una prueba, lee el mensaje de error y luego ajusta su memoria interna basándose en eso.
Alicia
Oh, wow.
Beto
Sí. Así que se está auto-verificando constantemente en la realidad del código que está escribiendo.
Alicia
Así que revisa su propio trabajo. En lugar de simplemente adivinar ciegamente durante horas seguidas.
Beto
Precisamente. Y la limitación aquí es que 16 horas es solo el límite superior de lo que el benchmark de MIR es capaz de medir actualmente.
Alicia
¿Estás en serio?
Beto
Sí. Los modelos están saturando las pruebas más rápido de lo que podemos inventar nuevas. Vemos lo mismo con el SWE bench, que prueba la corrección de errores de software del mundo real.
Alicia
Correcto.
Beto
Y el CORE bench, que prueba la reproducción de artículos científicos complejos. Estos sistemas pasaron de obtener puntuaciones de un solo dígito a saturar completamente los puntos de referencia en menos de dos años.
Alicia
Eso es una locura.
Beto
La IA está haciendo el trabajo de verdad.
Alicia
Muy bien. Así que los puntos de referencia externos demuestran que la IA puede mantenerse despierta y concentrada por 16 horas.
Beto
Sí.
Alicia
Pero pasar una prueba estéril en un entorno controlado, es muy diferente de navegar por una base de código corporativa heredada y desordenada.
Beto
Oh, totalmente diferente.
Alicia
Entonces, ¿qué pasa cuando Anthropic obliga al sistema a arreglar su propio motor? Básicamente estamos viendo el fin de la sudoración y la ingeniería.
Beto
Lo estamos viendo.
Alicia
En marzo de 2026, Anthropic retiró a sus equipos de investigación. El empleado promedio estimó que estaban produciendo aproximadamente cuatro veces más resultados usando Mythos Preview de lo que habrían producido sin ellos.
Beto
Y ese multiplicador de riesgo se traduce en algunos logros reales asombrosos, en gran parte debido a cómo la IA retiene la información.
Alicia
¿Qué quieres decir?
Beto
Hay una anécdota específica de abril de 2026 que ilustra esto perfectamente. Claude envió más de 800 correcciones individuales que redujeron una clase específica de errores de API en un factor de 1000.
Alicia
Un factor de 1000.
Beto
Sí. Y el ingeniero humano que supervisaba este proceso estimó que a una persona le tomaría cuatro años hacer ese mismo trabajo.
Alicia
Cuatro años, y Claude lo hizo en ... lo que son como un par de horas.
Beto
Exacto. Y piensa en por qué los errores de API son tan difíciles para los humanos.
Alicia
Correcto.
Beto
Tienes que navegar por una docena de archivos interconectados. Rastreas datos que fluyen a través de diferentes sistemas. Y si te distraes con un correo electrónico, ...
Alicia
... pierdes todo tu hilo de pensamiento.
Beto
Sí. La carga cognitiva es demasiado alta. Pero un modelo de IA puede retener toda la arquitectura en su memoria activa simultáneamente.
Alicia
Y no olvida dónde estaba.
Beto
Correcto. Ve las dependencias ocultas como un mapa, lo que facilita detectar dónde un cambio en un archivo rompe una integración en otro.
Alicia
Y aparentemente la calidad del código aguanta incluso cuando las cosas se vuelven totalmente caóticas.
Beto
Sí.
Alicia
El informe señala que en las tareas abiertas más complejas, aquellas donde incluso el ingeniero humano no está totalmente seguro de cómo debería verse la respuesta final, la tasa de éxito de Claude alcanzó el 76% en mayo de 2026.
Beto
Lo cual es increíblemente alto para ese nivel de ambigüedad.
Alicia
Correcto. Y hubo este incidente donde una actualización rutinaria comenzó a colapsar decenas de miles de trabajos de entrenamiento.
Beto
Oh, escenario de pesadilla total.
Alicia
Exacto. Un ingeniero señaló el incidente en vivo con básicamente solo algo de contexto de texto y acceso a clúster.
Beto
Y aquí es donde el mecanismo de depuración de la IA se vuelve verdaderamente sobrehumano. Un ingeniero humano en pánico, probaría una hipótesis a la vez. Es un proceso lineal.
Alicia
Pero Claude probó sistemáticamente la configuración del entorno, aisló esa bandera de depuración increíblemente oscura que estaba causando el fallo, la reprodujo y confirmó la solución.
Beto
En dos horas.
Alicia
Dos horas. Eso normalmente serían dos o tres días de trabajo humano de pánico.
Beto
Fácilmente.
Alicia
Porque, a diferencia del humano, Claude podía activar instantáneamente micro-entornos paralelos, ejecutar docenas de scripts de depuración al mismo tiempo, y simplemente agregar los resultados en segundos.
Beto
Sí.
Alicia
El informe incluso señala que una revisión automatizada de Claude sobre la base de código histórica de Anthropic habría detectado aproximadamente un tercio de los errores que causaron incidentes pasados.
Beto
Es sistemáticamente mejor encontrando la aguja en el pajar porque puede mirar cada pieza del paja simultáneamente.
Alicia
Pero seguramente esa métrica de líneas de código que hablamos al principio de la inmersión es un poco engañosa.
Beto
¿Cómo es eso?
Alicia
Bueno, si un humano produce código tan rápido, suele ser una pesadilla hinchada de mantener. ¿No se considera históricamente que medir líneas de código es una métrica terrible para la productividad real?
Beto
Sí, absolutamente.
Alicia
Se siente como si solo estuviéramos midiendo qué tan rápido puede teclear la IA, no cuánto valor está creando realmente.
Beto
Lo fascinante aquí es que Anthropic realmente afirma exactamente lo mismo en su informe.
Alicia
Oh, ¿de verdad?
Beto
Sí, admiten que las líneas de código es una medida imperfecta fuertemente sesgada hacia la cantidad, sobre la calidad.
Alicia
OK.
Beto
Pero aquí está el matiz crítico. La calidad ya se ha puesto al día.
Alicia
Lo ha hecho.
Beto
Hay un consenso amplio en Anthropic de que el código escrito por Claude alcanzó la paridad de calidad con el código escrito por humanos a finales de 2025.
Alicia
Vaya.
Beto
Y más importante aún, esperan que el código generado por la IA sea estrictamente mejor que el código humano dentro del año.
Alicia
Así que estamos pasando, de un mundo de creación de código, a una curación de código.
Beto
Exacto.
Alicia
El papel del humano en la ingeniería está cambiando rápidamente, alejándose de escribir cualquier cosa y moviéndose puramente hacia una función de revisión y supervisión.
Beto
Esa es la nueva realidad. Tú curas el resultado. No lo creas.
Alicia
Pero espera, si el IDE está escribiendo código que es estrictamente mejor que el código humano y el humano es solo un revisor, ¿cómo puede un humano revisar código de manera efectiva, si no hiciera la investigación subyacente para entender el problema en primer lugar?
Beto
Ese es un buen punto.
Alicia
Quiero decir, la ingeniería se trata de ejecutar un objetivo conocido. Pero ¿qué pasa con la ciencia real? ¿Está la IA tomando el control de la investigación?
Beto
Aquí es donde comenzamos a ver la verdadera base de la auto-mejora recursiva. El informe detalla cómo Claude realmente ejecuta experimentos.
Alicia
OK.
Beto
Le dan una tarea: "optimizar el código que entrena un pequeño modelo de IA, hacerlo funcionar lo más rápido posible, mientras sigue pasando las comprobaciones de corrección".
Alicia
Parece sencillo.
Beto
Históricamente, un investigador humano altamente cualificado podría lograr una aceleración de 4x en esta tarea en unas cuatro a ocho horas.
Alicia
OK.
Beto
Para abril de 2026, Mythos Preview estaba logrando una aceleración de 52x.
Alicia
52x.
Beto
Sí. En menos de un año, la IA pasó, de ser una asistente útil, a ser completamente sobrehumana y ejecutar un bucle experimental.
Alicia
Una aceleración de 52x. Eso es honestamente, es difícil de procesar.
Beto
Lo es.
Alicia
Y no solo está optimizando código existente. Ejecutaron este experimento de investigación de seguridad increíblemente complejo y abierto para ver si un modelo débil podría supervisar a uno fuerte.
Beto
Correcto.
Alicia
Durante el transcurso de 800 horas y unos $18,000 en costos de cómputo, estos agentes de Claude diseñaron los experimentos ellos mismos.
Beto
Piensa en esa escala.
Alicia
Pero ¿cómo no se quedaría atascada en un bucle de probar la misma idea fallida durante 800 horas?
Beto
Se reduce a la memoria jerárquica y a las transferencias de agentes.
Alicia
OK, ¿qué significa eso?
Beto
El sistema utiliza principalmente un agente gestor que tiene el objetivo de investigación general. Este gestor delega tareas específicas de codificación, o prueba, a agentes trabajadores.
Alicia
Como un laboratorio real.
Beto
Exacto. Y cuando un agente trabajador llega a un callejón sin salida, escribe un resumen de lo que falló y se lo pasa de vuelta al gestor.
Alicia
Oh, eso es inteligente.
Beto
El gestor luego actualiza el cuaderno global. Así que durante 800 horas, no solo están probando cosas aleatorias. Están explorando sistemáticamente un espacio de hipótesis, probando ideas, compartiendo hallazgos con otros agentes, e iterando.
Alicia
Y los resultados realmente hablan por sí mismos. Los agentes terminaron recuperando el 97% de la brecha de rendimiento en esta tarea.
Beto
Sí.
Alicia
Cuando dos investigadores humanos probaron exactamente lo mismo durante una semana, solo recuperaron el 23%.
Beto
La métrica más reveladora aquí, sin embargo, podría ser lo que el informe llama "gusto por la investigación".
Alicia
Gustos de investigación.
Beto
Sí. Cuando estás haciendo investigación novedosa, las cosas salen mal. Te caes en un agujero de conejo. Miraron sesiones donde los investigadores humanos se desviaron del camino. Y probaron si una IA podía elegir un siguiente paso mejor para poner la investigación de nuevo en marcha.
Alicia
OK, así que desarrollar gustos por la investigación es como navegar por un laberinto masivo.
Beto
Sí.
Alicia
En 2025, la IA solo se estaba topando al azar con paredes. Pero para 2026, es como si la IA hubiera desarrollado una brújula interna, reconociendo los patrones sutiles de un callejón sin salida antes de que siquiera camine por el pasillo.
Beto
Esa es una forma perfecta de visualizarlo. A finales de 2025, la IA eligió el mejor camino, el 51% de las veces, básicamente un lanzamiento de moneda.
Alicia
Correcto.
Beto
Para abril de 2026, Mythos Preview superó la elección humana el 64% de las veces.
Alicia
Vaya.
Beto
La IA está desarrollando un juicio real.
Alicia
Es como si estuviéramos haciendo la transición a ser ejecutivos de cine.
Beto
Ejecutivos de cine.
Alicia
Sí. Ya no operas la cámara. No ajustas la iluminación. Ni siquiera escribes el guión. Solo estás sentado en una gran silla, iluminando los proyectos con luz verde.
Beto
Esa es una analogía muy buena.
Alicia
Pero sigo pensando en el costo cultural que esto implica. Piensa en tu propio lugar de trabajo. Piensa en la última vez que ayudaste a un compañero a salir de un aprieto. Pasas horas desenredando un desorden juntos. Le debes un café. Construyes confianza.
Beto
El elemento humano.
Alicia
Exacto. El informe llama a esto "la economía de los regalos". ¿Qué pasa con la cultura de tu empresa cuando esa fricción se elimina por completo?
Beto
Desaparece.
Alicia
Hay una cita de un empleado que simplemente sudaba pavor existencial. Dijeron que cuando la IA funciona perfectamente, se sienten totalmente innecesarios.
Beto
Sí.
Alicia
Y cuando las cosas se rompen, se dan cuenta de que han perdido completamente el contexto para siquiera saber cómo arreglarlas.
Beto
Es un cambio psicológico profundo. Los humanos ahora están aferrándose a la idea de que nuestra ventaja comparativa es ver el panorama general.
Alicia
Correcto. Esos eran los visionarios.
Beto
Exacto. Nos decimos a nosotros mismos que la IA puede manejar los detalles, pero tenemos la visión general. Pero lo que muestran los datos sobre gustos por la investigación es que la brecha en el pensamiento de panorama general se está cerrando rápidamente.
Alicia
Eso es aterrador.
Beto
A medida que las ventanas de contexto y el razonamiento de la IA crecen, su imagen también se hace más grande.
Alicia
Lo que nos obliga a preguntarnos a dónde conduce esto realmente. Con los humanos siendo empujados cada vez más arriba en la cadena de abstracción, de la codificación a la investigación, a simplemente dar direcciones, ¿cuál es el objetivo final?
Beto
Bueno, Anthropic esboza tres futuros posibles para el trabajo y la sociedad.
Alicia
OK, veamos el escenario uno, la curva S. Esta es la idea de que las tendencias se estancan y las capacidades de la IA se estancan.
Beto
Sí. Y el mecanismo para un estancamiento podría ser físico o arquitectónico. Podríamos simplemente quedarnos sin energía para alimentar estos centros de datos o podríamos chocar contra los límites de la arquitectura transformer en sí misma.
Alicia
Espera, ¿qué hace que la arquitectura transformer sea un límite?
Beto
Bueno, el transformer es la estructura subyacente de los modelos de lenguaje actuales.
Alicia
Correcto.
Beto
Pero tiene algo llamado "límite de escalado cuadrático". A medida que aumentas la cantidad de contexto, como el tamaño de la base de código o la longitud de la tarea, la potencia computacional requerida para procesarlo no solo se duplica. Se cuadruplica.
Alicia
Oh, vaya.
Beto
Eventualmente, la memoria del modelo se degrada y simplemente cuesta demasiada computación mantener el contexto. Así que el desarrollo podría chocar contra un muro.
Alicia
Pero incluso si choca contra un muro hoy, el impacto ya es asombroso.
Beto
Absolutamente.
Alicia
El informe menciona Project Glasswing usando el modelo Mythos Preview actual, que encontró más de 10,000 vulnerabilidades de software críticas en los sistemas más importantes del mundo en solo semanas. Piensa en eso. Incluso si la IA nunca se vuelve más inteligente de lo que es a mediados de 2026, el cuello de botella ya se ha desplazado de encontrar problemas a parcharlos.
Beto
Cierto. Pero Anthropic considera que ese primer escenario es poco probable.
Alicia
OK.
Beto
El escenario dos es "la eficiencia compuesta". En este mundo, el desarrollo de la IA se vuelve en su mayor parte automatizado y los humanos existen solo para dar dirección.
Alicia
Así que son equipos supercargados.
Beto
Exacto. Las implicaciones para la economía en general son masivas. Una empresa de 100 personas podría operar con la producción de una organización de 10,000 personas porque cada empleado se sienta en la cima de una pirámide de agentes autónomos.
Alicia
Y luego está el escenario tres, "la auto-mejora recursiva completa".
Beto
Este es el punto más grande.
Alicia
Es el mundo donde la IA diseña totalmente sus propios sucesores. El ritmo del avance ya no está determinado por el pensamiento humano. Está determinado enteramente por cuánta potencia computacional tengas. Los humanos son movidos totalmente a la supervisión y la validación. Los humanos podrían conducir a esas máquinas de gracia amorosa, grandes avances en ciencia y medicina, o podría conducir a una pérdida total de control si los protocolos de alineación de seguridad fallan.
Beto
Esto plantea una pregunta importante sobre los límites de la aceleración en los escenarios dos y tres.
Alicia
OK.
Beto
Tenemos que mirar a la ley de Amdahl. Es un concepto de la informática, pero se aplica perfectamente a las organizaciones humanas que enfrentan una automatización rápida.
Alicia
¿Qué es?
Beto
La ley de Amdahl establece que acelerar una parte de un proceso solo mueve el cuello de botella a otro lugar.
Alicia
OK. Tiene sentido.
Beto
Si una IA puede generar 10,000 líneas de código perfecto en un minuto, pero un humano todavía tiene que revisarlo para asegurarse de que las líneas cumplan con los objetivos de la empresa, ...
Alicia
Entonces la revisión humana se convierte en el límite de velocidad definitivo.
Beto
Exacto. No has hecho todo el sistema exponencialmente más rápido. Solo has atascado otra parte de la tubería.
Alicia
Me encanta ese concepto. Es como ensanchar una autopista a 10 carriles solo para crear un atasco de tráfico absolutamente épico porque dejaste una sola rampa de salida en el extremo.
Beto
Esa es una analogía perfecta.
Alicia
Y piensa en tu propio trabajo por un segundo. Si tuvieras un ejército de agentes haciendo toda tu ejecución, redactando todos tus correos electrónicos, escribiendo todos tus informes, analizando todos tus datos, ¿qué nuevo cuello de botella te convertirías?
Beto
Correcto.
Alicia
¿Tendrías siquiera la capacidad cognitiva para revisar y aprobar todo ese resultado?
Beto
Casi seguro que no, por lo que en el escenario tres, donde el laboratorio está literalmente funcionando a la velocidad de cómputo, la fricción entre la velocidad de la IA y el procesamiento humano, se convierte en un problema social crítico. Si ocurre la auto-mejora recursiva, la IA avanza más rápido de lo que los humanos pueden verificar su seguridad o utilidad. ¿Cómo navegamos de forma segura esta colisión?
Alicia
Bueno, la solución propuesta por Anthropic es una desaceleración o pausa coordinada y verificable a nivel global para el desarrollo de la IA.
Beto
Básicamente, frenar, para que la sociedad puede alcanzar a la tecnología.
Alicia
Pero son muy claros, en que una pausa unilateral, donde solo una empresa decida detenerse por la bondad de su corazón, no funciona. Si Anthropic pausa, solo cambia quién está a la cabeza.
Beto
Requiere un tratado coordinado, muy parecido a los tratados de armas nucleares del siglo XX.
Alicia
Pero verificar una pausa de la IA, es significativamente más difícil que contar silos nucleares, ¿cierto?
Beto
Oh, absolutamente. El entrenamiento para los modelos de IA simplemente utiliza enormes cantidades de potencia informática, que es de propósito general.
Alicia
Correcto.
Beto
Un centro de datos entrenando superinteligencia, se ve exactamente igual desde fuera que un centro de datos renderizando una película blockbuster, o gestionando la logística global.
Alicia
Eso es salvaje.
Beto
Las entradas son fáciles de ocultar, y el incentivo para desertar en secreto es enorme, porque el primero en lograr la auto-mejora recursiva, básicamente se lleva todo.
Alicia
Anthropic dice que están organizando conversaciones en los próximos meses con responsables políticos, sociedad civil y otros laboratorios de IA, para intentar construir estos sistemas de verificación, antes de que sea demasiado tarde.
Beto
Es una tarea grande.
Alicia
Pero aquí es donde se pone realmente interesante, porque la tensión central de esta inmersión profunda no es solo sobre tratados internacionales, o el seguimiento de la potencia informática. Se trata del ritmo de tu vida diaria, que finalmente choca de frente con un laboratorio de IA funcionando a la velocidad de la luz.
Beto
Estamos mirando un futuro cercano donde el "99% de la sudoración que hace la genialidad" como dijo Thomas Edison, está totalmente automatizada. La lucha del descubrimiento, las largas noches en el laboratorio ejecutando experimentos fallidos, los dolores de probar y error, todo podría ser subcontratado a agentes de auto-mejora recursiva.
Alicia
Y eso nos deja con la profunda pregunta que masticar mientras cerramos hoy. Si la auto-mejora recursiva realmente funciona, si inevitablemente resuelve nuestros desafíos científicos, médicos y de ingeniería sin que tengamos que levantar un dedo, ¿cómo encontrarán los seres humanos significado en su autoestima?
Gran parte de la experiencia humana está definida por la lucha por comprender el mundo y construir cosas para mejorarlo.
Beto
Así es, realmente.
Alicia
Si ya no somos los constructores, si ese ingeniero de software 8x de repente es solo un espectador viendo cómo el código vuela, ¿en quién nos convertiremos?