Технический контекст
Я внимательно прошелся по материалу Anthropic про recursive self-improvement, и мой вывод простой: это еще не AGI, но уже не игрушка для демо. Меня зацепило другое: куски цикла AI R&D, которые раньше держались только на людях, модели начинают закрывать сами. А это уже очень близко к тому, что я вижу в живых проектах по AI automation.
У Anthropic главный тезис не в том, что модель внезапно «начала строить себя». Они честно говорят: проблема сейчас не столько в исполнении, сколько в judgment, то есть в выборе направления, цели и исследовательского приоритета. Это важная оговорка, потому что без нее легко улететь в кликбейт уровня «AGI уже здесь».
По цифрам картина интересная. Claude, по их данным, поднялся до 76% успеха на самых open-ended задачах к маю 2026 года, а в оптимизации экспериментального workflow ускорение выросло примерно с 3x до 52x меньше чем за год. Еще один маркер: в задачах на «куда копать дальше» модель стала чаще толкать исследование в продуктивную сторону, с 51% до 64% против человеческого выбора.
И вот тут я вспомнил старый эксперимент из комьюнити с micromorph: self-improving agent на паре сотен строк Python, который мог сам расширять себе функциональность. Не магия, а нормальный цикл: план, правка кода, запуск, проверка, повтор. Человеку дали доступы и цель, агент за несколько минут дотянул себе коммуникацию через Telegram. Это не рекурсивное самосознание, а инженерный паттерн, но именно из таких паттернов и собирается practical AI implementation.
Где я бы сразу тормознул? На rollback, health-check и ограничениях по инструментам. Без этого любой «самоулучшающийся» агент очень быстро превращается в агента, который аккуратно ломает сам себя.
Что это меняет для бизнеса и автоматизации
Для бизнеса выиграют те, у кого много повторяемой инженерной рутины: интеграции, внутренние боты, тестовые пайплайны, мелкие доработки вокруг API. Там AI solution development уже можно строить как цикл с автопроверкой, а не как разовый запрос в чат.
Проиграют команды, которые путают автономность с отсутствием контроля. Если дать агенту писать код, трогать прод и не дать ему границ, он не станет умнее от свободы, он станет дороже в обслуживании.
Я бы сейчас смотрел на это не как на «вот-вот родится AGI», а как на новый слой AI architecture: агент умеет не только выполнять задачу, но и достраивать себе инструменты под задачу. Мы в Nahornyi AI Lab как раз решаем такие штуки для клиентов: где нужен не чатик ради чатика, а рабочая automation with AI с тестами, правами доступа и понятным экономическим эффектом. Если у вас в процессах уже копится ручная техничка, можно спокойно разобрать это вместе и собрать AI-агента без лишней фантастики, но с реальной пользой.