Технический контекст
Я зацепился за этот кейс не из-за вау-демо, а из-за цифр. На задачу по оптимизации Temporal-логики Superpowers ушёл в работу примерно с 10:00 до 15:11, то есть больше пяти часов. По дороге он сгенерировал четыре файла с планами, один из них дорос примерно до 3000 строк, а итоговый код занял около 1500 строк.
И вот тут начинается самое интересное для practical AI implementation. Агент не просто писал код, а долго раскладывал задачу, держал промежуточные гипотезы и, похоже, страховал себя планированием. Я такое поведение вижу у систем, которые пытаются купить качество за счёт длинного контекста, дополнительных проходов и осторожного декомпоза.
Меня не удивляет объём артефактов. Temporal-задачи редко про один красивый файл: там легко увязнуть в workflow semantics, retry-политиках, activity boundaries и побочных эффектах. Если агент реально выдал результат без вопросов по качеству, значит он, скорее всего, неплохо удержал причинно-следственную цепочку, а это для длинных задач важнее, чем эффектная скорость на бенчмарке.
Но я бы не романтизировал. Когда план толще результата в два раза, я сразу думаю о токен-экономике, latency и о том, где эта схема сломается в проде. Один такой прогон терпим, десятки таких прогонов в команде уже превращаются в дорогую привычку.
Влияние на бизнес и автоматизацию
Для бизнеса вывод простой: Superpowers может быть полезен там, где ошибка дороже ожидания. Сложная backend-логика, рефакторинг workflow, миграции orchestration-слоя, места, где человек потом всё равно делает жёсткий review.
Проигрывают сценарии, где важна быстрая итерация. Если вам нужно десять раз прогнать гипотезу за день, такой цикл начинает душить и команду, и бюджет на AI integration.
Я бы закладывал такого агента не как универсальный молоток, а как тяжёлый инженерный инструмент для точечных задач. Мы в Nahornyi AI Lab как раз такие вещи и собираем: смотрим, где нужна глубокая AI automation с длинным reasoning loop, а где лучше резать контекст, упрощать AI architecture и оставлять агенту только ту часть работы, где он реально экономит время, а не сжигает его. Если у вас похожая история с кодом, workflow или внутренними инструментами, можно просто взять ваш процесс и спокойно понять, стоит ли тут build AI automation вообще, или нужен более приземлённый маршрут.