Skip to main content
OpenAIClaudeAI automation

OpenAI и Claude: лимиты, шум и реальная цена

В мае 2026 вокруг OpenAI и Claude много разговоров про «дешевые токены», но по фактам картина смешанная: у OpenAI есть временный буст Codex до конца месяца, а у Claude лимиты скорее ужались. Для AI automation это важно из-за бюджета, скорости и расчета нагрузки.

Технический контекст

Я покопался в том, что сейчас обсуждают про OpenAI и Claude, потому что для AI implementation такие вещи быстро превращаются из мемов в счет за инфраструктуру. И вот где я сразу притормозил: разговоров про «x2 токенов» много, а подтвержденных фактов заметно меньше.

По OpenAI на сегодня у меня сходится другое: у ChatGPT Pro за $100 есть временная промо-логика для Codex до 31 мая 2026. Речь не про универсальное удвоение всего подряд, а скорее про заметно расширенный лимит именно для кодовых сценариев, который после акции должен откатиться. Отсюда и ощущение у части людей, что лимиты «почти исчезли».

С Claude картина вообще не про щедрость. То, что я вижу по открытым данным, больше похоже на ужатие в пиковые часы и более агрессивный расход, особенно у тех, кто сидит в Claude Code целый день. Плюс у них планы Max 5x за $100 и Max 20x за $200, но сама механика потребления стала менее приятной, чем в начале года.

Теперь про главное, где все путаются. Когда люди говорят «стало дешевле», они часто смешивают три разных слоя: подписочные лимиты, API-экономику и субъективное ощущение скорости. Если модель отвечает быстрее, недельный лимит можно сжечь тоже быстрее, и это не скидка, а просто другая пропускная способность.

Отдельно верю отчетам про прожорливость многосессионной работы. Если у вас оркестратор и еще 20-30 субагентов, как в реальных пайплайнах, лимиты улетают не линейно, а почти незаметно быстро. Я это вижу и в клиентских сценариях: один «умный» агент выглядит дешево, а нормальная AI integration с параллельными ветками уже требует холодного расчета.

Что это меняет для бизнеса и автоматизации

Выигрывают команды, которые много кодят, тестируют гипотезы и держат короткий цикл «идея -> прогон -> фикс». Для них текущий буст OpenAI действительно может временно удешевить разработку и ускорить AI automation.

Проигрывают те, кто смотрит только на цену плана. Если архитектура агентная, с длинными раннами, браузингом и кучей параллельных вызовов, месячная подписка вообще перестает быть понятной единицей бюджета.

Я бы сейчас не строил процессы на ощущении «токены стали почти бесплатными». Я бы строил их на замерах: где подписка, где API, где кэш, где быстрый режим, а где просто красивая иллюзия скорости.

Если у вас как раз начинается такая путаница с лимитами, агентами и счетами, можно разобрать ваш стек вместе. В Nahornyi AI Lab мы как раз собираем AI solutions for business так, чтобы automation with AI не выглядела дешевой только на скриншоте, а реально держалась в проде и по бюджету.

Оптимизация потребления токенов становится критически важной, ведь новые модели требуют всё больше ресурсов. Мы уже разбирали, как Cloudflare Markdown для Agents помогает значительно сократить расход токенов, влияя на экономику работы с LLM.

Поделиться статьёй