Claude Opus 4.8: апгрейд без доплат

Anthropic відкрила нову модель Claude Opus 4.8 через API і не стала піднімати базову ціну: $5 за вхід і $25 за вихід на мільйон токенів. Для бізнесу це рідкісний випадок, коли свою AI-інфраструктуру можна покращити без перерахунку бюджету чи складної міграції архітектури.

Технічний контекст

Я відразу поліз не в маркетинг, а в цифри. Claude Opus 4.8 доступний через Claude API, і для тих, хто вже будує AI automation на Anthropic, новина проста: модель оновили, а звичайний прайс залишили тим самим.

Базова ціна не змінилася відносно Opus 4.7: $5 за мільйон вхідних токенів і $25 за мільйон вихідних. Fast mode теж без сюрпризів: $10 за input і $50 за output. Ось це мені подобається більше за будь-які гучні анонси.

Щодо бенчмарків картина цікавіша, ніж у переказах по чатах. Anthropic вказує 74.6% на Terminal-Bench 2.1 і 64.4% на Finance Agent v1.1 для Opus 4.8. При цьому в примітках фігурує, що GPT-5.5 показував 83.4% у Terminal-Bench, але вже з Codex CLI harness, а не з тим самим публічним набором умов.

І ось тут я б не поспішав із переможними вигуками в жодну зі сторін. Якщо harness різний, порівняння вже не лоб у лоб. Я такі речі бачу постійно, коли проєктую AI architecture для продакшну: один і той самий агент на папері виглядає героєм, а в реальному пайплайні раптово починає втрачати кроки на інструментальному шарі.

З Finance Agent теж важливий контекст. У вихідних обговореннях спливає Gemini 3.5 Flash із 57.9% на Finance Agent v2, а в Opus 4.8 у доступних даних фігурує 64.4%, але на v1.1. Тобто висновок у мене акуратний: модель виглядає сильною для агентних сценаріїв, але порівнювати версії бенчів потрібно без самообману.

Що це змінює для бізнесу та автоматизації

Якщо у вас вже є AI integration на Anthropic, це майже ідеальний тип апгрейду: якість може зрости, а економіка запиту не ламається. Не потрібно терміново переписувати бюджетну модель або пояснювати команді, чому токени раптово подорожчали.

Виграють команди, які будують термінальні агенти, кодових помічників і фінансові workflow з tool use. Програють ті, хто дивиться тільки на headline-бенчмарки і не перевіряє, як модель поводиться саме в їхній обв'язці, ретраях та guardrails.

Я б тестував Opus 4.8 не на абстрактних промптах, а на своєму реальному контурі: CLI-завдання, backoffice-операції, розбір документів, multi-step агентні ланцюжки. Ми в Nahornyi AI Lab якраз у таких місцях і ловимо справжню різницю між демо та робочою системою.

Якщо у вас накопичилися процеси, де люди все ще руками ганяють термінал, звіряють цифри або переносять дані між системами, давайте розберемо це по-дорослому. У Nahornyi AI Lab я можу допомогти з AI solution development і зібрати таку автоматизацію зі штучним інтелектом, яка дасть не красивий скріншот, а нормальну економію часу та помилок.

Раніше ми вже аналізували вартість контексту та архітектурні конфігурації Claude Opus 4.6. Вивчення цих історичних даних про ціни допомагає зрозуміти, наскільки вигідно отримати масштабні покращення коду у версії 4.8 за тим самим тарифом.

Поділитися статтею

Twitter/X LinkedIn Telegram

Claude Opus 4.8: апгрейд без доплат

Технічний контекст

Що це змінює для бізнесу та автоматизації

Ще новини

Gemma 4 стала помітно практичнішою на edge

364M параметрів і новий шанс для ШІ на пристроях