Технический контекст
Я бы не списывал это на «модель резко поглупела». Тут картина прозаичнее: в Claude Code уже были официально признанные регрессии качества из-за продуктовых настроек, а не из-за самих весов модели. Anthropic весной 2026 прямо писал, что проблема была в смене reasoning-effort, баге с потерей старого thinking после idle и неудачном системном промпте.
Теперь к Ultracode. Я вижу ту же ловушку, о которую спотыкаются многие: его подали как будто это просто «самый мощный уровень мышления», хотя по факту это ближе к orchestration-режиму. То есть там не только reasoning, но и динамический workflow с субагентами, и для AI integration в рабочие процессы это уже совсем другой класс поведения.
Из-за этого и возникает странный эффект: на обычной задаче режим начинает переусложнять себе жизнь. Вместо линейного прохождения инструкции он строит дерево проверок, ветвлений и делегирования. В результате я получаю не «умнее», а «шумнее»: контекст размазывается, шаги теряются, последовательность плывет.
Самый показательный симптом не в ответе, а в телеметрии сессии. Если режим поднимает 20, 30, 50+ субагентов ради небольшого code review, это уже не магия, а архитектурный перебор. И да, daily limit в таком сценарии улетает буквально на глазах.
Поэтому совет из комьюнити звучит здраво: сравнивать надо не «Opus 4.8 плохой», а Max против Ultracode на одной и той же задаче. Вполне возможно, что для большинства повседневных сценариев Max даст более стабильное искусственное интеллект внедрение, потому что не тащит за собой лишнюю оркестрацию.
Что это меняет для бизнеса и автоматизации
Если я собираю AI automation для продакшна, такой режим я не ставлю по умолчанию. Он хорош там, где реально нужна параллельная декомпозиция: большой аудит кода, многофайловая миграция, сложная верификация.
Кто выигрывает? Команды с редкими, тяжелыми задачами, где цена ошибки выше цены токенов. Кто проигрывает? Все, кто гоняет через этот режим обычные ревью, правки и рутинные цепочки.
В деньгах тут все просто: лишние субагенты бьют по лимитам, а пропуск инструкций бьет по времени инженеров. Я такие вещи обычно лечу не «верой в новый режим», а нормальной AI architecture: выбором режима под класс задачи, ограничением orchestration и явными стоп-правилами для агента.
Если у вас Claude Code уже начал жечь лимиты и при этом терять шаги, я бы посмотрел на сам workflow, а не только на модель. В Nahornyi AI Lab мы как раз такие узкие места и разбираем: где нужен один сильный агент, где нужна automation with AI, а где Ultracode лучше вообще не трогать, чтобы бизнес не платил за хаос.