Технічний контекст
Я зацікавився цим кейсом не через вау-демо, а через цифри. На завдання з оптимізації Temporal-логіки Superpowers працював приблизно з 10:00 до 15:11, тобто понад п'ять годин. Протягом цього часу він згенерував чотири файли з планами, один з яких виріс приблизно до 3000 рядків, а фінальний код зайняв близько 1500 рядків.
І ось тут починається найцікавіше для practical AI implementation. Агент не просто писав код, а довго розкладав завдання, утримував проміжні гіпотези і, схоже, страхував себе плануванням. Я бачу таку поведінку у систем, які намагаються «купити» якість за рахунок довгого контексту, додаткових проходів та обережної декомпозиції.
Мене не дивує обсяг артефактів. Завдання з Temporal рідко стосуються одного красивого файлу: там легко загрузнути у семантиці робочих процесів, політиках повторних спроб, межах activity та побічних ефектах. Якщо агент справді видав результат без питань до якості, це означає, що він, найімовірніше, добре втримав причинно-наслідковий ланцюжок, а це для довгих завдань важливіше, ніж ефектна швидкість на бенчмарку.
Але я б не романтизував. Коли план вдвічі товщий за результат, я одразу думаю про економіку токенів, затримки (latency) і про те, де ця схема зламається в продакшені. Один такий прогін є терпимим, але десятки таких прогонів у команді вже перетворюються на дорогу звичку.
Вплив на бізнес та автоматизацію
Для бізнесу висновок простий: Superpowers може бути корисним там, де помилка коштує дорожче за очікування. Складна backend-логіка, рефакторинг workflow, міграції шару оркестрації — місця, де людина потім все одно робить жорсткий review.
Програють сценарії, де важлива швидка ітерація. Якщо вам потрібно десять разів прогнати гіпотезу за день, такий цикл починає душити і команду, і бюджет на інтеграцію ШІ.
Я б розглядав такого агента не як універсальний молоток, а як важкий інженерний інструмент для точкових завдань. У Nahornyi AI Lab ми якраз такі речі й робимо: дивимося, де потрібна глибока AI-автоматизація з довгим циклом міркувань, а де краще різати контекст, спрощувати архітектуру ШІ та залишати агенту лише ту частину роботи, де він реально економить час, а не спалює його. Якщо у вас схожа історія з кодом, workflow чи внутрішніми інструментами, можна просто взяти ваш процес і спокійно зрозуміти, чи варто тут взагалі будувати AI-автоматизацію, чи потрібен більш приземлений маршрут.