13 червня 2026 р.3 хв читання

autoresearch: коли модель наймає ML-інженера

autoresearchML engineeringAI automation

Андрій Карпаті показав autoresearch, open-source цикл, де модель сама править код, запускає коротке навчання, вимірює результат і відкочує погані ідеї. Для бізнесу це важливо як ранній, але дуже практичний шаблон AI automation в ML-інжинірингу, який перетворює експерименти в автоматизований конвеєр.

Технічний контекст

Я люблю такі штуки не через хайп, а через форму циклу. В autoresearch Karpathy зібрав дуже приземлений контур: агент читає репозиторій і program.md, змінює скрипт тренування, жене короткий прогін, дивиться на метрику й або фіксує зміну, або відкочує її через git.

По суті це вже не «помічник для коду», а заготовка під AI automation для ML-команди. Людина задає ціль і обмеження, а модель бере на себе механічну частину AI implementation: гіпотеза, правка, запуск, перевірка, rollback.

Мене тут особливо зачепило, що інтерфейс управління зроблено не через важку панель, а через markdown-спеку. Не лізеш руками в train.py щоразу, а описуєш, що вважати успіхом, що можна чіпати, який бюджет на експеримент і як вести журнал спроб.

Поточний публічний контур досить жорсткий: короткий бюджет приблизно 5 хвилин на прогін, основна метрика val_bpb, де менше краще, і порівняння йде в однакових умовах. Це важливо: агент не «магічно навчає модель», він перебирає зміни всередині формалізованої пісочниці.

За опублікованими результатами ідея працює не як один великий стрибок, а як серія дрібних влучень. Десятки й сотні прогонів дають кілька реальних покращень, і саме вони з часом рухають якість або швидкість навчання.

І так, мінорні метрики легко можуть просісти. Якщо оптимізуєш один KPI, агент тиснутиме саме туди. Тому без нормального набору guardrails така система так само швидко знайде поганий локальний максимум, як і хороший хід.

Що це змінює для бізнесу та автоматизації

Перший ефект простий: дешевшає цикл експериментів. Якщо ваша команда витрачає години на однотипні прогони, такий патерн можна вбудовувати як внутрішній контур AI integration у R&D, а люди нехай займаються дизайном експерименту, а не рутиною.

Другий момент уже про архітектуру. Виграють ті, у кого навчання розбито на короткі, вимірювані ітерації зі зрозумілою метрикою. Програють проєкти, де все зав’язано на довгий прогін, нечіткі KPI та ручні домовленості в чаті.

Третій нюанс мені здається найважливішим: це не заміна ML-інженера, а підсилювач хорошої інженерної дисципліни. Ми в Nahornyi AI Lab вирішуємо такі задачі для клієнтів регулярно: спочатку збираємо об’єктивну метрику й обмеження, потім уже будуємо automation with AI, інакше агент просто автоматизує хаос.

Якщо у вас навчання моделей, підбір промптів або внутрішні експерименти грузнуть у ручних повторах, це можна розібрати на рівні процесу. В Nahornyi AI Lab я допоможу зібрати AI solution development під ваш реальний workflow, щоб агент не грався в науку, а економив людям тижні роботи.

Ми вже розглядали метод Simple Self-Distillation, який підвищує якість генерації коду завдяки використанню власних прогнозів моделі без зовнішніх верифікаторів чи складного навчання з підкріпленням. Цей підхід на практиці показує, як ШІ може автономно оптимізувати свої результати — саме ту ідею, яку Карпаті масштабує в autoresearch.

Поділитися

Twitter/X LinkedIn Telegram

← До новин

autoresearch: коли модель наймає ML-інженера

Технічний контекст

Що це змінює для бізнесу та автоматизації

Ще почитати

PerceptionBench: Moonshot перевіряє, чи бачить ШІ

Kimi K3: відкриті ваги і вже не 50B активних