Superpowers для Temporal: хороший код, дорогий цикл

У реальному кейсі AI-агент Superpowers витратив понад п'ять годин на оптимізацію логіки Temporal, створивши величезні плани та 1500 рядків якісного коду. Для AI-автоматизації це важливий сигнал: результат може бути потужним, але вартість у часі та токенах вже безпосередньо впливає на архітектурні рішення.

Технічний контекст

Я зацікавився цим кейсом не через вау-демо, а через цифри. На завдання з оптимізації Temporal-логіки Superpowers працював приблизно з 10:00 до 15:11, тобто понад п'ять годин. Протягом цього часу він згенерував чотири файли з планами, один з яких виріс приблизно до 3000 рядків, а фінальний код зайняв близько 1500 рядків.

І ось тут починається найцікавіше для practical AI implementation. Агент не просто писав код, а довго розкладав завдання, утримував проміжні гіпотези і, схоже, страхував себе плануванням. Я бачу таку поведінку у систем, які намагаються «купити» якість за рахунок довгого контексту, додаткових проходів та обережної декомпозиції.

Мене не дивує обсяг артефактів. Завдання з Temporal рідко стосуються одного красивого файлу: там легко загрузнути у семантиці робочих процесів, політиках повторних спроб, межах activity та побічних ефектах. Якщо агент справді видав результат без питань до якості, це означає, що він, найімовірніше, добре втримав причинно-наслідковий ланцюжок, а це для довгих завдань важливіше, ніж ефектна швидкість на бенчмарку.

Але я б не романтизував. Коли план вдвічі товщий за результат, я одразу думаю про економіку токенів, затримки (latency) і про те, де ця схема зламається в продакшені. Один такий прогін є терпимим, але десятки таких прогонів у команді вже перетворюються на дорогу звичку.

Вплив на бізнес та автоматизацію

Для бізнесу висновок простий: Superpowers може бути корисним там, де помилка коштує дорожче за очікування. Складна backend-логіка, рефакторинг workflow, міграції шару оркестрації — місця, де людина потім все одно робить жорсткий review.

Програють сценарії, де важлива швидка ітерація. Якщо вам потрібно десять разів прогнати гіпотезу за день, такий цикл починає душити і команду, і бюджет на інтеграцію ШІ.

Я б розглядав такого агента не як універсальний молоток, а як важкий інженерний інструмент для точкових завдань. У Nahornyi AI Lab ми якраз такі речі й робимо: дивимося, де потрібна глибока AI-автоматизація з довгим циклом міркувань, а де краще різати контекст, спрощувати архітектуру ШІ та залишати агенту лише ту частину роботи, де він реально економить час, а не спалює його. Якщо у вас схожа історія з кодом, workflow чи внутрішніми інструментами, можна просто взяти ваш процес і спокійно зрозуміти, чи варто тут взагалі будувати AI-автоматизацію, чи потрібен більш приземлений маршрут.

Швидкість і масштаб, з якими ШІ може генерувати розлогі плани, як у випадку Superpowers, природно змушують замислитися про якість таких масштабних результатів. Раніше ми розглядали, як прості методи самодистиляції можуть значно підвищити якість генерації коду, пропонуючи цінні ідеї для подібних завдань, що виконуються за допомогою ШІ.

Поділитися статтею

Twitter/X LinkedIn Telegram

Superpowers для Temporal: хороший код, дорогий цикл

Технічний контекст

Вплив на бізнес та автоматизацію

Ще новини

Codex і Zed: де я бачу реальне прискорення

Superpowers чи короткі ітерації: що насправді зручніше