Anthropic наближає штучний інтелект до самоудосконалення

Anthropic винесла рекурсивне самоудосконалення у публічний простір: моделі вже активно допомагають в AI R&D, але ще не здатні самостійно проектувати власних наступників. Для бізнесу це чіткий сигнал, що автоматизація та інтеграція штучного інтелекту переходять від експериментів до автономних робочих контурів із реальною економічною цінністю.

Технічний контекст

Я уважно проаналізував матеріал Anthropic про рекурсивне самоудосконалення (recursive self-improvement), і мій висновок простий: це ще не AGI, но вже далеко не іграшка для демонстрацій. Мене зачепило інше: етапи циклу AI R&D, які раніше трималися виключно на людях, моделі починають закривати самостійно. А це вже дуже близько до того, що я бачу в реальних проектах з AI automation.

Головна теза Anthropic полягає не в тому, що модель раптово «почала будувати себе». Вони чесно визнають: проблема зараз не стільки у виконанні, скільки в judgment (судженні) — тобто у виборі напрямку, мети та дослідницького пріоритету. Це важливе застереження, адже без нього легко скотитися у клікбейт рівня «AGI вже тут».

За цифрами картина цікава. Claude, за їхніми даними, піднявся до 76% успіху на найбільш відкритих (open-ended) завданнях до травня 2026 року, а в оптимізації експериментального workflow прискорення зросло приблизно з 3x до 52x менш ніж за рік. Ще один показник: у завданнях «куди копати далі» модель стала частіше спрямовувати дослідження у продуктивний бік — 64% випадків проти 51% за вибором людини.

І тут я згадав старий експеримент із ком'юніті з micromorph: self-improving agent на парі сотень рядків Python, який міг сам розширювати свій функціонал. Не магія, а звичайний інженерний цикл: план, редагування коду, запуск, перевірка, повтор. Коли агенту дали доступи та мету, він за кілька хвилин налаштував собі комунікацію через Telegram. Це не рекурсивна самосвідомість, а інженерний патерн, але саме з таких патернів і збирається practical AI implementation.

Де б я одразу пригальмував? На rollback, health-check та обмеженнях для інструментів. Без цього будь-який «самоудосконалюваний» агент дуже швидко перетворюється на агента, який акуратно ламає сам себе.

Що це змінює для бізнесу та автоматизації

Для бізнесу виграють ті, у кого багато повторюваної інженерної рутини: інтеграції, внутрішні боти, тестові пайплайни, дрібні доопрацювання навколо API. Там AI solution development вже можна будувати як цикл з автоперевіркою, а не як разовий запит у чат.

Програють команди, які плутають автономність із відсутністю контролю. Якщо дозволити агенту писати код, чіпати прод і не встановити для нього межі, він не стане розумнішим від свободи — він просто стане дорожчим в обслуговуванні.

Я б зараз дивився на це не як на «ось-ось народиться AGI», а як на новий шар AI architecture: агент вміє не просто виконувати завдання, а й добудовувати собі інструменти під нього. Ми в Nahornyi AI Lab саме вирішуємо такі завдання для клієнтів: де потрібен не чатик заради чатику, а працююча automation with AI з тестами, правами доступу та зрозумілим економічним ефектом. Якщо у ваших процесах накопичується ручна технічна рутина, ми можемо спокійно розібрати її разом і зібрати AI-агент без зайвої фантастики, но з реальною користю.

Раніше ми детально розбирали практичну реалізацію подібних механізмів на прикладі проекту MicroMorph, що є самомодифікованим Python-агентом. Цей кейс наочно ілюструє, з якими технологічними викликами та безпековими ризиками стикаються розробники, намагаючись довірити ШІ автономну зміну власного коду.

Поділитися статтею

Twitter/X LinkedIn Telegram

Anthropic наближає штучний інтелект до самоудосконалення

Технічний контекст

Що це змінює для бізнесу та автоматизації

Ще новини

OpenAI випадково показала справжню ціну sandbox

Codex v0.145.0 підсилює мультиагент V2