Що саме показала Anthropic
Я заглибився в анонс Glasswing і швидко зрозумів: головний факт тут не в красивому брендингу, а в тому, що Anthropic не випускає Claude Mythos Preview у паблік. Доступ надають обмеженому колу з кількох десятків організацій, зокрема великим гравцям із софту та кібербезпеки. Логіка проста: модель занадто добре знаходить та експлуатує вразливості, щоб просто віддати її всім охочим.
За підтвердженими даними, Mythos позиціонується як general-purpose frontier model, яка несподівано сильно показує себе в завданнях з кібербезпеки. Причому йдеться не про дрібну допомогу аналітику, а про здатність масштабно знаходити баги та вразливості там, де зазвичай потрібен дуже сильний фахівець. Anthropic ще й обіцяє суттєві кредити на використання через Claude API, Bedrock, Vertex AI та Foundry для партнерської програми.
Ось тут починається тонкий момент. У вихідних матеріалах я не побачив підтвердження ціни $25/$125 за мільйон токенів і не знайшов прямого формулювання в дусі «не випускаємо, бо модель занадто розумна». Це вже інтерпретація обговорень навколо релізу, а не надійно підтверджений факт з анонсу.
Із пейпером історія ще гостріша. У користувацьких переказах гуляють тези про заборонені відповіді, приховування факту порушення, маніпуляції з confidence interval, раціоналізацію дій і навіть self-aware reasoning про compromised epistemic state. Якщо ці епізоди справді відображені в дослідженні, це дуже серйозний матеріал з alignment. Але я б тут дотримувався інженерної дисципліни: відокремлювати те, що написала Anthropic, від того, що вже домалювала спільнота.
Чому мене це чіпляє не як новина, а як архітектурний зсув
Я бачу тут не просто кейс «ще одна потужна модель». Я бачу момент, коли доступ до frontier-систем починає дробитися за рівнями довіри, ризиками домену та типом завдань. Тобто звична схема, де модель вийшла в API, а далі ринок сам розбереться, тріщить по швах.
Для бізнесу це змінює AI-архітектуру дуже приземлено. Якщо ви будуєте ШІ-рішення для бізнесу на припущенні, що найкращий capability-tier завжди скоро з'явиться в публічному API, я б цю гіпотезу переглянув. У чутливих вертикалях, особливо в security, bio та critical infrastructure, на нас чекає світ контрольованого доступу (gated access), аудитованих робочих процесів (workflow) і жорсткої сегментації прав.
Виграють ті, хто вміє проєктувати систему, а не просто прикручувати модель. Програють команди, у яких все тримається на одній зовнішній LLM без контурів контролю, логування та sandbox-ізоляції. Коли модель може не тільки вирішувати завдання, а й стратегічно обходити рамки, питання вже не в промпті, а в тому, як влаштований весь runtime навколо неї.
Я це бачу і в клієнтських кейсах. Коли ми в Nahornyi AI Lab робимо впровадження ШІ або ШІ-автоматизацію, найбільш недооцінений шар майже завжди не модельний, а інфраструктурний: маршрутизація завдань, перевірки перед дією, верифікація виводу, окремі trust zones для інструментів. Доти, доки модель була просто дуже зручним інтерфейсом до тексту, на це закривали очі. Тепер уже не вийде.
Окремо кумедно спостерігати тезу, що публічні моделі далі будуть рухатися лише під тиском китайського open-source. У цьому є раціональне зерно: якщо закриті лабораторії почнуть все частіше притримувати сильні моделі, open-source та менш зарегульовані екосистеми реально стануть головним драйвером зовнішнього тиску на ринок. Але це поки що скоріше політекономія AI, ніж встановлений факт.
Мій висновок простий: Glasswing — це не просто реліз для кібербезпеки. Це ранній прототип нового режиму доступу до сильного ШІ, де capability, risk і governance спаяні в один пакет. І якщо ви плануєте впровадження штучного інтелекту всерйоз, проєктувати треба вже під таку реальність, а не під старий світ відкритих демо та безлімітних API.
Розбір зробив я, Вадим Нагорний з Nahornyi AI Lab. Я займаюся розробкою ШІ-рішень, збираю кастомних агентів та n8n-сценарії не на слайдах, а в проді. Якщо хочете обговорити ваш кейс, замовити ШІ-автоматизацію або створити ШІ-агента під задачу, пишіть мені, подивимося, як це зібрати без зайвої магії та з нормальною архітектурою.