Claude Mythos і АНБ: хайп, тест і реальний ризик

Історія про те, що Claude Mythos «зламав АНБ», виявилася сильно перебільшеною: йшлося про контрольований red-team тест, а не реальну атаку. Для бізнесу це серйозний сигнал: інтеграцію ШІ та захист внутрішньої інфраструктури тепер потрібно проєктувати разом, а не окремо. Це змінює підхід до автоматизації.

Технічний контекст

Я звернувся до першоджерел, тому що формулювання про «зламав АНБ за години» звучить надто гучно навіть за мірками 2026 року. І так, там швидко з'ясовується головне: підтверджено не автономний реальний злам, а контрольований red-team тест у специфічних умовах.

Сенатор Марк Ворнер переказав слова генерала Джошуа Радда так, ніби модель за години отримала доступ майже до всіх засекречених систем. Але пізніше історію уточнили: це був не бойовий інцидент на живій інфраструктурі, а внутрішня перевірка, і початкову вірусну тезу взагалі публічно відкликали як перебільшення.

Ось де мені стало цікаво вже не як читачеві, а як інженеру з архітектури AI solutions. Навіть якщо прибрати хайп, сам факт залишається важким: модель топ-рівня у зв'язці з інструментами безпеки може дуже швидко знаходити слабкі місця, особливо якщо середовище спрощене, моніторинг слабкий, а сценарій тесту дає зручний контекст.

Anthropic, за доступними коментарями, описує епізод значно вужче: модель аналізувала код, обходила обмеження і знаходила в основному відомі або не надто критичні дефекти. Плюс незалежні перевірки показували, що проти добре захищених систем такого рівня результат не доведений. Тобто «LLM зламала АНБ» я б не повторював. А от «LLM радикально прискорює offensive security у тестовому середовищі» – це вже чесне формулювання.

І це, до речі, безпосередньо б'є по AI automation. Якщо компанія сьогодні будує внутрішніх AI-агентів із доступом до репозиторіїв, тікетів, CI/CD, секретів і адмінських панелей, вона сама створює ідеальний полігон для дуже швидкого lateral movement, якщо архітектура зібрана нашвидкуруч.

Вплив на бізнес та автоматизацію

Я бачу тут три практичні висновки. Перший: не можна робити artificial intelligence integration без паралельного перегляду IAM, сегментації та логування. Інакше корисний агент завтра стане найкращим внутрішнім пентестером, тільки не за розкладом.

Другий: зросте ціна помилок у зв'язці «модель плюс інструменти». Доступ до shell, коду, браузера і внутрішніх API тепер треба видавати як високоризиковий привілей, а не як зручну галочку заради демо.

Третій: виграють ті, хто проєктує guardrails на рівні AI architecture, а не прикручує їх після пілота. Саме такі речі ми в Nahornyi AI Lab зазвичай і розгрібаємо у клієнтів: де потрібен агент, а де потрібен жорсткий sandbox і окремий контур.

Якщо у вас уже визріває AI automation для внутрішніх процесів, я б зараз не сперечався про хайп навколо Mythos, а дивився на свої права доступу, секрети та журналювання. Якщо хочете, можемо разом пройтися по контуру і зібрати таку схему, де автоматизація з AI прискорює роботу, а не відкриває бічні двері у ваш бізнес. У Nahornyi AI Lab я якраз допомагаю перетворювати такі ідеї на робочу і безпечну систему.

Раніше ми розглядали Augustus — сканер для автоматичного ред‑тимінгу мовних моделей, що виявляє вразливості до джейлбрейків та ін'єкцій підказок. Подібні інструменти стають критично важливими, коли з'являються повідомлення про те, як Claude за лічені години проник у системи АНБ.

Поділитися статтею

Twitter/X LinkedIn Telegram

Claude Mythos і АНБ: хайп, тест і реальний ризик

Технічний контекст

Вплив на бізнес та автоматизацію

Ще новини

LLMs-from-scratch: найкращий спосіб зрозуміти LLM

Codex проти Claude Code: що я бачу на практиці