Anthropic подводит AI к самоулучшению

Anthropic вынесла recursive self-improvement в публичную повестку: модели уже заметно помогают в AI R&D, но сами еще не умеют полноценно проектировать собственных преемников. Для бизнеса это сигнал, что AI automation и AI integration переходят от экспериментов к более автономным рабочим контурам с реальной пользой.

Технический контекст

Я внимательно прошелся по материалу Anthropic про recursive self-improvement, и мой вывод простой: это еще не AGI, но уже не игрушка для демо. Меня зацепило другое: куски цикла AI R&D, которые раньше держались только на людях, модели начинают закрывать сами. А это уже очень близко к тому, что я вижу в живых проектах по AI automation.

У Anthropic главный тезис не в том, что модель внезапно «начала строить себя». Они честно говорят: проблема сейчас не столько в исполнении, сколько в judgment, то есть в выборе направления, цели и исследовательского приоритета. Это важная оговорка, потому что без нее легко улететь в кликбейт уровня «AGI уже здесь».

По цифрам картина интересная. Claude, по их данным, поднялся до 76% успеха на самых open-ended задачах к маю 2026 года, а в оптимизации экспериментального workflow ускорение выросло примерно с 3x до 52x меньше чем за год. Еще один маркер: в задачах на «куда копать дальше» модель стала чаще толкать исследование в продуктивную сторону, с 51% до 64% против человеческого выбора.

И вот тут я вспомнил старый эксперимент из комьюнити с micromorph: self-improving agent на паре сотен строк Python, который мог сам расширять себе функциональность. Не магия, а нормальный цикл: план, правка кода, запуск, проверка, повтор. Человеку дали доступы и цель, агент за несколько минут дотянул себе коммуникацию через Telegram. Это не рекурсивное самосознание, а инженерный паттерн, но именно из таких паттернов и собирается practical AI implementation.

Где я бы сразу тормознул? На rollback, health-check и ограничениях по инструментам. Без этого любой «самоулучшающийся» агент очень быстро превращается в агента, который аккуратно ломает сам себя.

Что это меняет для бизнеса и автоматизации

Для бизнеса выиграют те, у кого много повторяемой инженерной рутины: интеграции, внутренние боты, тестовые пайплайны, мелкие доработки вокруг API. Там AI solution development уже можно строить как цикл с автопроверкой, а не как разовый запрос в чат.

Проиграют команды, которые путают автономность с отсутствием контроля. Если дать агенту писать код, трогать прод и не дать ему границ, он не станет умнее от свободы, он станет дороже в обслуживании.

Я бы сейчас смотрел на это не как на «вот-вот родится AGI», а как на новый слой AI architecture: агент умеет не только выполнять задачу, но и достраивать себе инструменты под задачу. Мы в Nahornyi AI Lab как раз решаем такие штуки для клиентов: где нужен не чатик ради чатика, а рабочая automation with AI с тестами, правами доступа и понятным экономическим эффектом. Если у вас в процессах уже копится ручная техничка, можно спокойно разобрать это вместе и собрать AI-агента без лишней фантастики, но с реальной пользой.

Ранее мы подробно разбирали практическую реализацию подобных механизмов на примере проекта MicroMorph, представляющего собой самомодифицирующегося Python-агента. Этот кейс наглядно иллюстрирует, с какими технологическими вызовами и рисками безопасности сталкиваются разработчики при попытке доверить ИИ автономное изменение собственного кода.

Поделиться статьёй

Twitter/X LinkedIn Telegram

Anthropic подводит AI к самоулучшению

Технический контекст

Что это меняет для бизнеса и автоматизации

Ещё новости

OpenAI случайно показала реальную цену sandbox

Codex v0.145.0 усилил multi-agent V2