Технічний контекст
Я розібрався в тому, що зараз обговорюють про OpenAI та Claude, тому що для AI implementation такі речі швидко перетворюються з мемів на рахунок за інфраструктуру. І ось де я одразу пригальмував: розмов про «x2 токенів» багато, а підтверджених фактів помітно менше.
Щодо OpenAI на сьогодні у мене сходиться інше: у ChatGPT Pro за $100 є тимчасова промо-логіка для Codex до 31 травня 2026 року. Йдеться не про універсальне подвоєння всього підряд, а скоріше про помітно розширений ліміт саме для кодових сценаріїв, який після акції має повернутися до норми. Звідси й відчуття у частини людей, що ліміти «майже зникли».
З Claude картина взагалі не про щедрість. Те, що я бачу за відкритими даними, більше схоже на скорочення в пікові години та більш агресивне споживання, особливо у тих, хто сидить у Claude Code цілий день. Плюс у них є плани Max 5x за $100 та Max 20x за $200, але сама механіка споживання стала менш приємною, ніж на початку року.
Тепер про головне, де всі плутаються. Коли люди кажуть «стало дешевше», вони часто змішують три різні рівні: ліміти підписки, економіку API та суб'єктивне відчуття швидкості. Якщо модель відповідає швидше, тижневий ліміт можна спалити теж швидше, і це не знижка, а просто інша пропускна здатність.
Окремо вірю звітам про ненажерливість багатосесійної роботи. Якщо у вас є оркестратор і ще 20-30 субагентів, як у реальних пайплайнах, ліміти зникають не лінійно, а майже непомітно швидко. Я це бачу і в клієнтських сценаріях: один «розумний» агент виглядає дешево, а нормальна AI integration з паралельними гілками вже вимагає холодного розрахунку.
Що це змінює для бізнесу та автоматизації
Виграють команди, які багато кодять, тестують гіпотези та дотримуються короткого циклу «ідея -> прогін -> фікс». Для них поточний буст OpenAI дійсно може тимчасово здешевити розробку та прискорити AI automation.
Програють ті, хто дивиться лише на ціну плану. Якщо архітектура агентна, з довгими запусками, браузингом і купою паралельних викликів, місячна підписка взагалі перестає бути зрозумілою одиницею бюджету.
Я б зараз не будував процеси на відчутті «токени стали майже безкоштовними». Я б будував їх на вимірах: де підписка, де API, де кеш, де швидкий режим, а де просто красива ілюзія швидкості.
Якщо у вас якраз починається така плутанина з лімітами, агентами та рахунками, можна розібрати ваш стек разом. У Nahornyi AI Lab ми якраз збираємо AI solutions for business так, щоб automation with AI не виглядала дешевою лише на скриншоті, а реально трималася в проді та в межах бюджету.