Skip to main content
Claude CodeAnthropicAI automation

Por qué Ultracode en Claude Code descarrila las tareas

Los usuarios notaron que el modo Ultracode de Claude Code sigue peor las instrucciones y lanza subagentes de forma agresiva. Esto es importante para las empresas porque esa automatización con IA agota rápidamente los límites, rompe la previsibilidad y baja la calidad en tareas cotidianas. Esto puede sabotear pipelines de CI y aumentar los costos reales de ingeniería.

Contexto técnico

No lo atribuiría a que «el modelo de repente se volvió más tonto». El panorama es más prosaico: en Claude Code ya existían regresiones de calidad reconocidas oficialmente debido a configuraciones de producto, no a los pesos del modelo. Anthropic declaró explícitamente en la primavera de 2026 que el problema fue un cambio en el esfuerzo de razonamiento, un bug que perdía el pensamiento anterior tras el idle y un prompt de sistema defectuoso.

Ahora, Ultracode. Veo la misma trampa en la que muchos caen: se presentó como simplemente el «nivel de pensamiento más potente», cuando en realidad está más cerca de un modo de orquestación. Es decir, no solo hay razonamiento, sino un flujo de trabajo dinámico con subagentes, y para la integración de IA en procesos de trabajo eso es una clase de comportamiento completamente diferente.

De ahí surge el efecto extraño: en una tarea común, el modo empieza a complicarse la vida. En lugar de seguir las instrucciones de forma lineal, construye un árbol de verificaciones, ramificaciones y delegación. Como resultado, no obtengo «más inteligente», sino «más ruidoso»: el contexto se difumina, los pasos se pierden y la secuencia se desvía.

El síntoma más revelador no está en la respuesta, sino en la telemetría de la sesión. Si el modo levanta 20, 30, 50+ subagentes para una pequeña revisión de código, eso ya no es magia, sino exceso arquitectónico. Y sí, el límite diario en ese escenario se esfuma literalmente ante tus ojos.

Por eso el consejo de la comunidad suena sensato: no hay que comparar «Opus 4.8 es malo», sino Max contra Ultracode en la misma tarea. Es muy posible que para la mayoría de los escenarios cotidianos, Max ofrezca una integración de IA más estable porque no arrastra una orquestación innecesaria.

Qué significa esto para el negocio y la automatización

Si estoy construyendo automatización con IA para producción, no pongo este modo por defecto. Es bueno donde realmente se necesita una descomposición paralela: una gran auditoría de código, una migración de múltiples archivos o una verificación compleja.

¿Quién gana? Los equipos con tareas escasas y pesadas, donde el costo de un error supera el costo de los tokens. ¿Quién pierde? Todos los que pasan revisiones comunes, correcciones y cadenas rutinarias por este modo.

En dinero, es simple: los subagentes adicionales golpean tus límites, y las instrucciones omitidas golpean el tiempo de tus ingenieros. Yo suelo tratar estos problemas no con «fe en un nuevo modo», sino con una arquitectura de IA sólida: elegir el modo según la clase de tarea, limitar la orquestación y establecer reglas de parada explícitas para el agente.

Si tu Claude Code ya ha empezado a quemar límites y a la vez perder pasos, yo miraría el flujo de trabajo en sí, no solo el modelo. En Nahornyi AI Lab nos dedicamos precisamente a diseccionar estos cuellos de botella: dónde basta un solo agente fuerte, dónde se necesita automatización con IA y dónde es mejor no tocar Ultracode en absoluto, para que el negocio no pague por el caos.

Anteriormente analizamos un fallo de autoanálisis de Claude donde la inyección de prompt provocó una avalancha de solicitudes y efectivamente un DoS. El problema de Opus 4.8 hace eco de ese caso: el modelo vuelve a perder el control y empieza a bombardear el entorno con acciones innecesarias.

Compartir este articulo