Contexto técnico
Analicé detenidamente el material de Anthropic sobre la automejora recursiva y mi conclusión es clara: todavía no es AGI, pero ya no es un simple juguete de demostración. Lo que me llamó la atención fue otra cosa: las fases del ciclo de I+D de IA que antes dependían exclusivamente de los humanos ahora empiezan a ser resueltas por los propios modelos. Y esto ya está muy cerca de lo que veo en proyectos reales de automatización de IA.
El argumento principal de Anthropic no es que el modelo de repente 'comenzó a construirse a sí mismo'. Declaran honestamente: el problema actual no radica tanto en la ejecución, sino en el juicio (judgment), es decir, en la elección de la dirección, el objetivo y la prioridad de la investigación. Esta es una advertencia crucial, ya que sin ella es fácil caer en el clickbait del estilo 'la AGI ya está aquí'.
Las cifras muestran un panorama interesante. Según sus datos, Claude alcanzó un 76% de éxito en las tareas más abiertas (open-ended) para mayo de 2026, y en la optimización del flujo de trabajo experimental, la aceleración pasó de aproximadamente 3x a 52x en menos de un año. Otro indicador: en las tareas de 'hacia dónde seguir investigando', el modelo guio la investigación en una dirección productiva el 64% de las veces, en comparación con el 51% de las elecciones humanas.
Y aquí recordé un antiguo experimento de la comunidad con micromorph: un agente que se automejora en un par de cientos de líneas de Python, capaz de ampliar sus propias funciones. No es magia, sino un ciclo estándar: planificar, modificar código, ejecutar, verificar y repetir. Una vez que se le dieron accesos y un objetivo, el agente configuró su propia comunicación a través de Telegram en unos minutos. Esto no es autoconciencia recursiva, sino un patrón de ingeniería, pero es precisamente a partir de estos patrones que se construye la implementación práctica de la IA.
¿Dónde pondría el freno de inmediato? En los rollbacks, los health-checks y las limitaciones de herramientas. Sin esto, cualquier agente que se 'automejore' se convertirá rápidamente en un agente que se rompe cuidadosamente a sí mismo.
Qué cambia esto para las empresas y la automatización
En el ámbito empresarial, ganarán quienes tengan mucha rutina de ingeniería repetitiva: integraciones, bots internos, pipelines de prueba y pequeñas modificaciones de API. Allí, el desarrollo de soluciones de IA ya se puede estructurar como un ciclo con autoverificación, en lugar de una consulta única en el chat.
Perderán los equipos que confundan la autonomía con la falta de control. Si dejas que un agente escriba código, toque producción y no le pones límites, no se volverá más inteligente por su libertad; solo será más costoso de mantener.
Actualmente, vería esto no como 'la AGI está a punto de nacer', sino como una nueva capa de arquitectura de IA: el agente no solo sabe realizar una tarea, sino también construir sus propias herramientas para resolverla. En Nahornyi AI Lab resolvemos precisamente este tipo de desafíos para nuestros clientes: donde no se necesita un chat por el simple hecho de chatear, sino una automatización real con IA que incluya pruebas, derechos de acceso y un impacto económico claro. Si en sus procesos ya se acumulan tareas técnicas manuales, podemos analizarlas juntos y diseñar un agente de IA sin fantasías innecesarias, pero con beneficios reales.