Claude Mythos: холодный душ после громких заявлений

Anthropic громко подала Claude Mythos как почти сверхсильный AI для поиска уязвимостей, но ключевые заявления о тысячах критических багов опираются всего на 198 ручных проверок. Для бизнеса это важный сигнал: AI implementation в безопасности нельзя строить на маркетинговой экстраполяции.

Технический контекст

Я полез в детали по Claude Mythos не из любопытства, а потому что такие релизы напрямую влияют на то, как мы проектируем AI automation в security-процессах. И вот где я притормозил: headline про «тысячи серьёзных zero-day» звучит мощно, но под ним очень тонкая опора.

По разбору Tom’s Hardware и материалам самой Anthropic, большая часть громких выводов держится не на полном подтверждении всех находок, а на экстраполяции из 198 вручную проверенных отчётов. Да, в этих ревью эксперты часто соглашались с оценкой серьёзности. Но это всё ещё не равно «мы подтвердили тысячи критических уязвимостей».

Если смотреть на более приземлённые цифры, картина уже спокойнее. В тестах на тысячах open-source стеков модель нашла около 600 crashable exploit cases и 10 тяжёлых уязвимостей. Это сильно, полезно, инженерно интересно, но это не тот уровень магии, который пытаются продать заголовком.

Ещё один важный момент: Anthropic сама не выкатила Mythos в публичный доступ. Доступ ограниченный, под контролем, для крупных игроков, которым нужно заранее закрывать дыры. И это, честно говоря, самый разумный кусок всей истории.

Мне ещё понравился и одновременно не понравился блок про exploit generation. Заявление о 72.4% успешного превращения найденных багов в эксплойты для Firefox JS shell звучит серьёзно. Но это узкий сценарий, а не универсальная метрика «модель умеет ломать всё подряд».

То есть по факту я вижу хороший специализированный инструмент для security research, а не «разумного супер-хакера». И вот эта разница критична, если вы реально отвечаете за risk management, а не за презентации для совета директоров.

Что это меняет для бизнеса и автоматизации

Для меня главный вывод простой: рынок снова путает демонстрацию потенциала с готовым продуктом. В AI integration это классическая ловушка. Берут сильный экспериментальный результат, умножают на красивый narrative, а потом кто-то на стороне заказчика начинает ждать автономный аудит всего legacy-ландшафта.

С legacy, кстати, всё особенно скользко. В обсуждениях мелькали слухи, что публичный релиз придержали из-за критичных находок в финансовой сфере, но подтверждений этому я не увидел. А вот то, что в банках и страховании полно старого ПО, кривых интеграций и редких внутренних протоколов, это не слух, это рутина.

Именно поэтому я бы не строил архитектуру защиты вокруг одного frontier-моделя, каким бы впечатляющим ни был system card. Нормальная схема выглядит скучнее: статический анализ, sandboxing, приоритизация, человек в цикле, проверка воспроизводимости, а уже поверх этого модель как ускоритель. Не оракул. Не замена команды.

Кто выигрывает от Mythos-подхода? Большие вендоры, у которых есть ресурсы быстро валидировать находки и катить патчи. Кто рискует? Компании, которые увидят маркетинг, купят идею «AI сам найдёт и закроет всё», а потом упрётся в шум, ложные срабатывания и неподтверждённые severity scores.

Я это вижу и в других классах задач. Когда мы в Nahornyi AI Lab делаем AI solution development для клиентов, самая дорогая ошибка почти всегда одна и та же: ожидание волшебства вместо нормального пайплайна проверки. В безопасности цена такой ошибки особенно неприятная, потому что false confidence хуже, чем честное «мы пока не уверены».

Если отжать всю историю до одной мысли, то она такая: Mythos, похоже, реально полезен, но маркетинг вокруг него заметно громче фактов. И это не повод махнуть рукой на модели для security, а повод требовать внятной валидации, понятных метрик и ограничений по зоне применения.

Если у вас сейчас похожая развилка, между хайпом и рабочей системой, давайте посмотрим на ваш контур трезво. В Nahornyi AI Lab я обычно начинаю с процессов, где AI automation действительно снижает риск и экономит время команды, а потом уже собираю архитектуру без красивых иллюзий и с нормальной проверкой на боевых сценариях.

Поделиться статьёй

Twitter/X LinkedIn Telegram

Claude Mythos: холодный душ после громких заявлений

Технический контекст

Что это меняет для бизнеса и автоматизации

Ещё новости

Gemma 4 стала заметно практичнее на edge

364M параметров и новый шанс для on-device AI