Чому Ultracode у Claude Code зриває завдання

Користувачі помітили, що режим Ultracode у Claude Code гірше дотримується інструкцій і надто агресивно запускає сабагентів. Для бізнесу це важливо, бо така AI-автоматизація швидко вичерпує ліміти, ламає передбачуваність і погіршує якість у звичайних завданнях. Це може підірвати CI-пайплайни та збільшити реальні інженерні витрати.

Технічний контекст

Я б не списував це на «модель раптово поглупіла». Тут картина прозаїчніша: у Claude Code вже були офіційно визнані регресії якості через продуктові налаштування, а не через самі ваги моделі. Anthropic навесні 2026 прямо писав, що проблема була в зміні reasoning-effort, багу із втратою старого thinking після idle та невдалому системному промпті.

Тепер до Ultracode. Я бачу ту ж пастку, на яку натрапляють багато хто: його подали так, ніби це просто «найпотужніший рівень мислення», хоча насправді це ближче до orchestration-режиму. Тобто там не лише reasoning, а й динамічний workflow із сабагентами, і для AI integration у робочі процеси це вже зовсім інший клас поведінки.

Через це й виникає дивний ефект: на звичайному завданні режим починає переускладнювати собі життя. Замість лінійного проходження інструкції він будує дерево перевірок, розгалужень і делегування. У результаті я отримую не «розумніше», а «галасливіше»: контекст розмазується, кроки губляться, послідовність пливе.

Найпоказовіший симптом не у відповіді, а в телеметрії сесії. Якщо режим піднімає 20, 30, 50+ сабагентів заради невеликого code review, це вже не магія, а архітектурний перебір. І так, daily limit у такому сценарії летить буквально на очах.

Тому порада зі спільноти звучить тверезо: порівнювати треба не «Opus 4.8 поганий», а Max проти Ultracode на одному й тому ж завданні. Цілком можливо, що для більшості повсякденних сценаріїв Max дасть більш стабільне штучне інтелект впровадження, бо не тягне за собою зайву оркестрацію.

Що це змінює для бізнесу та автоматизації

Якщо я збираю AI automation для продакшену, такий режим я не ставлю за замовчуванням. Він добрий там, де реально потрібна паралельна декомпозиція: великий аудит коду, багатофайлова міграція, складна верифікація.

Хто виграє? Команди з рідкими, важкими завданнями, де ціна помилки вища за ціну токенів. Хто програє? Усі, хто ганяє через цей режим звичайні рев'ю, правки та рутинні ланцюжки.

У грошах тут усе просто: зайві сабагенти б'ють по лімітах, а пропуск інструкцій б'є по часу інженерів. Я такі речі зазвичай лікую не «вірою в новий режим», а нормальною AI architecture: вибором режиму під клас задачі, обмеженням orchestration і явними стоп-правилами для агента.

Якщо ваш Claude Code вже почав пекти ліміти й при цьому втрачати кроки, я б подивився на сам workflow, а не тільки на модель. У Nahornyi AI Lab ми якраз такі вузькі місця й розбираємо: де потрібен один сильний агент, де потрібна automation with AI, а де Ultracode краще взагалі не чіпати, щоб бізнес не платив за хаос.

Раніше ми розбирали глітч самоаналізу Claude, коли інжекція промпту викликала лавину звернень і фактично DoS. Проблема з Opus 4.8 перегукується з тим випадком — модель знову виходить з-під контролю і починає штурмувати середовище зайвими діями.

Поділитися статтею

Twitter/X LinkedIn Telegram

Чому Ultracode у Claude Code зриває завдання

Технічний контекст

Що це змінює для бізнесу та автоматизації

Ще новини

Kaggle показав новий SDLC для vibe coding

Reve розігрує $100k за 10 зображень