Технический контекст
Я покопался в том, что сейчас обсуждают про OpenAI и Claude, потому что для AI implementation такие вещи быстро превращаются из мемов в счет за инфраструктуру. И вот где я сразу притормозил: разговоров про «x2 токенов» много, а подтвержденных фактов заметно меньше.
По OpenAI на сегодня у меня сходится другое: у ChatGPT Pro за $100 есть временная промо-логика для Codex до 31 мая 2026. Речь не про универсальное удвоение всего подряд, а скорее про заметно расширенный лимит именно для кодовых сценариев, который после акции должен откатиться. Отсюда и ощущение у части людей, что лимиты «почти исчезли».
С Claude картина вообще не про щедрость. То, что я вижу по открытым данным, больше похоже на ужатие в пиковые часы и более агрессивный расход, особенно у тех, кто сидит в Claude Code целый день. Плюс у них планы Max 5x за $100 и Max 20x за $200, но сама механика потребления стала менее приятной, чем в начале года.
Теперь про главное, где все путаются. Когда люди говорят «стало дешевле», они часто смешивают три разных слоя: подписочные лимиты, API-экономику и субъективное ощущение скорости. Если модель отвечает быстрее, недельный лимит можно сжечь тоже быстрее, и это не скидка, а просто другая пропускная способность.
Отдельно верю отчетам про прожорливость многосессионной работы. Если у вас оркестратор и еще 20-30 субагентов, как в реальных пайплайнах, лимиты улетают не линейно, а почти незаметно быстро. Я это вижу и в клиентских сценариях: один «умный» агент выглядит дешево, а нормальная AI integration с параллельными ветками уже требует холодного расчета.
Что это меняет для бизнеса и автоматизации
Выигрывают команды, которые много кодят, тестируют гипотезы и держат короткий цикл «идея -> прогон -> фикс». Для них текущий буст OpenAI действительно может временно удешевить разработку и ускорить AI automation.
Проигрывают те, кто смотрит только на цену плана. Если архитектура агентная, с длинными раннами, браузингом и кучей параллельных вызовов, месячная подписка вообще перестает быть понятной единицей бюджета.
Я бы сейчас не строил процессы на ощущении «токены стали почти бесплатными». Я бы строил их на замерах: где подписка, где API, где кэш, где быстрый режим, а где просто красивая иллюзия скорости.
Если у вас как раз начинается такая путаница с лимитами, агентами и счетами, можно разобрать ваш стек вместе. В Nahornyi AI Lab мы как раз собираем AI solutions for business так, чтобы automation with AI не выглядела дешевой только на скриншоте, а реально держалась в проде и по бюджету.