Технічний контекст
Я уважно проаналізував матеріал Anthropic про рекурсивне самоудосконалення (recursive self-improvement), і мій висновок простий: це ще не AGI, но вже далеко не іграшка для демонстрацій. Мене зачепило інше: етапи циклу AI R&D, які раніше трималися виключно на людях, моделі починають закривати самостійно. А це вже дуже близько до того, що я бачу в реальних проектах з AI automation.
Головна теза Anthropic полягає не в тому, що модель раптово «почала будувати себе». Вони чесно визнають: проблема зараз не стільки у виконанні, скільки в judgment (судженні) — тобто у виборі напрямку, мети та дослідницького пріоритету. Це важливе застереження, адже без нього легко скотитися у клікбейт рівня «AGI вже тут».
За цифрами картина цікава. Claude, за їхніми даними, піднявся до 76% успіху на найбільш відкритих (open-ended) завданнях до травня 2026 року, а в оптимізації експериментального workflow прискорення зросло приблизно з 3x до 52x менш ніж за рік. Ще один показник: у завданнях «куди копати далі» модель стала частіше спрямовувати дослідження у продуктивний бік — 64% випадків проти 51% за вибором людини.
І тут я згадав старий експеримент із ком'юніті з micromorph: self-improving agent на парі сотень рядків Python, який міг сам розширювати свій функціонал. Не магія, а звичайний інженерний цикл: план, редагування коду, запуск, перевірка, повтор. Коли агенту дали доступи та мету, він за кілька хвилин налаштував собі комунікацію через Telegram. Це не рекурсивна самосвідомість, а інженерний патерн, але саме з таких патернів і збирається practical AI implementation.
Де б я одразу пригальмував? На rollback, health-check та обмеженнях для інструментів. Без цього будь-який «самоудосконалюваний» агент дуже швидко перетворюється на агента, який акуратно ламає сам себе.
Що це змінює для бізнесу та автоматизації
Для бізнесу виграють ті, у кого багато повторюваної інженерної рутини: інтеграції, внутрішні боти, тестові пайплайни, дрібні доопрацювання навколо API. Там AI solution development вже можна будувати як цикл з автоперевіркою, а не як разовий запит у чат.
Програють команди, які плутають автономність із відсутністю контролю. Якщо дозволити агенту писати код, чіпати прод і не встановити для нього межі, він не стане розумнішим від свободи — він просто стане дорожчим в обслуговуванні.
Я б зараз дивився на це не як на «ось-ось народиться AGI», а як на новий шар AI architecture: агент вміє не просто виконувати завдання, а й добудовувати собі інструменти під нього. Ми в Nahornyi AI Lab саме вирішуємо такі завдання для клієнтів: де потрібен не чатик заради чатику, а працююча automation with AI з тестами, правами доступу та зрозумілим економічним ефектом. Якщо у ваших процесах накопичується ручна технічна рутина, ми можемо спокійно розібрати її разом і зібрати AI-агент без зайвої фантастики, но з реальною користю.