Почему Ultracode в Claude Code срывает задачи

Пользователи заметили, что Ultracode в Claude Code хуже держит инструкции и слишком агрессивно запускает субагентов. Для бизнеса это важно, потому что такая AI automation быстро съедает лимиты, ломает предсказуемость и ухудшает качество в обычных задачах. Это может саботировать CI-пайплайны и увеличивать реальные инженерные затраты.

Технический контекст

Я бы не списывал это на «модель резко поглупела». Тут картина прозаичнее: в Claude Code уже были официально признанные регрессии качества из-за продуктовых настроек, а не из-за самих весов модели. Anthropic весной 2026 прямо писал, что проблема была в смене reasoning-effort, баге с потерей старого thinking после idle и неудачном системном промпте.

Теперь к Ultracode. Я вижу ту же ловушку, о которую спотыкаются многие: его подали как будто это просто «самый мощный уровень мышления», хотя по факту это ближе к orchestration-режиму. То есть там не только reasoning, но и динамический workflow с субагентами, и для AI integration в рабочие процессы это уже совсем другой класс поведения.

Из-за этого и возникает странный эффект: на обычной задаче режим начинает переусложнять себе жизнь. Вместо линейного прохождения инструкции он строит дерево проверок, ветвлений и делегирования. В результате я получаю не «умнее», а «шумнее»: контекст размазывается, шаги теряются, последовательность плывет.

Самый показательный симптом не в ответе, а в телеметрии сессии. Если режим поднимает 20, 30, 50+ субагентов ради небольшого code review, это уже не магия, а архитектурный перебор. И да, daily limit в таком сценарии улетает буквально на глазах.

Поэтому совет из комьюнити звучит здраво: сравнивать надо не «Opus 4.8 плохой», а Max против Ultracode на одной и той же задаче. Вполне возможно, что для большинства повседневных сценариев Max даст более стабильное искусственное интеллект внедрение, потому что не тащит за собой лишнюю оркестрацию.

Что это меняет для бизнеса и автоматизации

Если я собираю AI automation для продакшна, такой режим я не ставлю по умолчанию. Он хорош там, где реально нужна параллельная декомпозиция: большой аудит кода, многофайловая миграция, сложная верификация.

Кто выигрывает? Команды с редкими, тяжелыми задачами, где цена ошибки выше цены токенов. Кто проигрывает? Все, кто гоняет через этот режим обычные ревью, правки и рутинные цепочки.

В деньгах тут все просто: лишние субагенты бьют по лимитам, а пропуск инструкций бьет по времени инженеров. Я такие вещи обычно лечу не «верой в новый режим», а нормальной AI architecture: выбором режима под класс задачи, ограничением orchestration и явными стоп-правилами для агента.

Если у вас Claude Code уже начал жечь лимиты и при этом терять шаги, я бы посмотрел на сам workflow, а не только на модель. В Nahornyi AI Lab мы как раз такие узкие места и разбираем: где нужен один сильный агент, где нужна automation with AI, а где Ultracode лучше вообще не трогать, чтобы бизнес не платил за хаос.

Ранее мы разбирали глитч самоанализа Claude, при котором инжекция промпта вызывала лавину обращений и фактически DoS. Проблема с Opus 4.8 перекликается с тем случаем — модель опять выходит из-под контроля и начинает штурмовать среду лишними действиями.

Поделиться статьёй

Twitter/X LinkedIn Telegram

Почему Ultracode в Claude Code срывает задачи

Технический контекст

Что это меняет для бизнеса и автоматизации

Ещё новости

Kaggle показал новый SDLC для vibe coding

Reve разыгрывает $100k за 10 изображений