Технічний контекст
Я відразу поліз не в маркетинг, а в цифри. Claude Opus 4.8 доступний через Claude API, і для тих, хто вже будує AI automation на Anthropic, новина проста: модель оновили, а звичайний прайс залишили тим самим.
Базова ціна не змінилася відносно Opus 4.7: $5 за мільйон вхідних токенів і $25 за мільйон вихідних. Fast mode теж без сюрпризів: $10 за input і $50 за output. Ось це мені подобається більше за будь-які гучні анонси.
Щодо бенчмарків картина цікавіша, ніж у переказах по чатах. Anthropic вказує 74.6% на Terminal-Bench 2.1 і 64.4% на Finance Agent v1.1 для Opus 4.8. При цьому в примітках фігурує, що GPT-5.5 показував 83.4% у Terminal-Bench, але вже з Codex CLI harness, а не з тим самим публічним набором умов.
І ось тут я б не поспішав із переможними вигуками в жодну зі сторін. Якщо harness різний, порівняння вже не лоб у лоб. Я такі речі бачу постійно, коли проєктую AI architecture для продакшну: один і той самий агент на папері виглядає героєм, а в реальному пайплайні раптово починає втрачати кроки на інструментальному шарі.
З Finance Agent теж важливий контекст. У вихідних обговореннях спливає Gemini 3.5 Flash із 57.9% на Finance Agent v2, а в Opus 4.8 у доступних даних фігурує 64.4%, але на v1.1. Тобто висновок у мене акуратний: модель виглядає сильною для агентних сценаріїв, але порівнювати версії бенчів потрібно без самообману.
Що це змінює для бізнесу та автоматизації
Якщо у вас вже є AI integration на Anthropic, це майже ідеальний тип апгрейду: якість може зрости, а економіка запиту не ламається. Не потрібно терміново переписувати бюджетну модель або пояснювати команді, чому токени раптово подорожчали.
Виграють команди, які будують термінальні агенти, кодових помічників і фінансові workflow з tool use. Програють ті, хто дивиться тільки на headline-бенчмарки і не перевіряє, як модель поводиться саме в їхній обв'язці, ретраях та guardrails.
Я б тестував Opus 4.8 не на абстрактних промптах, а на своєму реальному контурі: CLI-завдання, backoffice-операції, розбір документів, multi-step агентні ланцюжки. Ми в Nahornyi AI Lab якраз у таких місцях і ловимо справжню різницю між демо та робочою системою.
Якщо у вас накопичилися процеси, де люди все ще руками ганяють термінал, звіряють цифри або переносять дані між системами, давайте розберемо це по-дорослому. У Nahornyi AI Lab я можу допомогти з AI solution development і зібрати таку автоматизацію зі штучним інтелектом, яка дасть не красивий скріншот, а нормальну економію часу та помилок.