Skip to main content
LLMbug triageAI automation

LLM дісталися до багів із фізикою

З'явився сильний приклад згенерованого ШІ тікета: LLM не просто описав баг, а надав фізично обґрунтоване root cause пояснення в моделі дифузії. Для бізнесу це сигнал, що AI automation вже є дуже корисною для triage, RCA та інженерної документації, хоча фінальна перевірка людиною поки залишається обов'язковою.

Технічний контекст

Мене зачепив не сам баг, а формат тікета. LLM тут не обмежився фразою «щось не так у diffusion.py», а розклав причинно-наслідковий ланцюжок: десорбована маса повертається в поверхневу рідку фазу, хоча фізично після висихання вона повинна йти одразу в gas phase.

Для AI automation це якраз дуже цікавий момент. Модель не просто знайшла підозрілий рядок, а пов'язала код, фізичний зміст процесу та downstream-ефект на drydown симуляції через години й дні.

Я пробігся по суті помилки. У коді desorbed_mass віднімається від накопиченого в тканині, але одночасно додається до remaining[component_id], тобто назад у «калюжу» на поверхні. Далі рушій знову ганяє це через випаровування рідкої фази, коефіцієнти активності та змішування з компонентами, яких на поверхні вже немає.

І ось це вже схоже не на випадковий текстоген, а на нормальний draft root-cause analysis. Виправлення також сформульовано по суті: якщо поверхнева рідина практично зникла, десорбція повинна ставати прямим джерелом для headspace, а не оживляти liquid film.

Але я б не продавав це як «LLM замінив сеньйора». За відкритими даними, індустрія має купу прикладів, де моделі непогано сумаризують тікети та resolution notes, але таких публічних кейсів із глибоким фізичним reasoning поки мало. І зворотний бік також відомий: AI-репорти легко генерують шум, якщо немає рев'ю та хороших правил валідації.

Вплив на бізнес та автоматизацію

Практичний висновок простий: виграють команди, де дорого коштує увага сильних інженерів. Якщо LLM робить перший прохід по тікетах, збирає structured RCA та піднімає гіпотези з кодовими посиланнями, сеньйори витрачають час не на писанину, а на вирішення проблеми.

Програють ті, хто включить це без фільтрів. Один красивий AI-тікет не скасовує десяток галюцинацій, особливо в чисельних моделях та scientific software.

Я б впроваджував це як шар AI implementation поверх issue workflow: модель пише чернетку бага, пропонує root cause, відзначає фізичні інваріанти та окремо складає decisions у базу правил. Ми в Nahornyi AI Lab якраз такі речі й збираємо для клієнтів: не «магічний агент», а робочу AI integration в інженерний процес, де шум ріжеться, а корисні знахідки не губляться. Якщо у вас команда тоне в розборі багів та ручному RCA, я можу разом з вами побудувати AI automation так, щоб вона економила години розробки, а не плодила сміття.

Раніше ми вже розповідали про те, як паралельні ШІ-агенти виявляють стани гонитви та інші неочевидні помилки під час рев'ю пулл-реквестів. Ця практика тісно пов'язана з тим, як сучасні мовні моделі вчаться не просто аналізувати програмну логіку, а й формувати глибокі, структуровані звіти про знайдені дефекти.

Поділитися статтею