Skip to main content
LLMbug triageAI automation

LLM добрались до багов с физикой

Появился сильный пример AI-сгенерированного тикета: LLM не просто описал баг, а дал физически внятное root cause объяснение в модели диффузии. Для бизнеса это сигнал, что AI automation уже полезна в triage, RCA и инженерной документации, хотя финальная проверка человеком пока обязательна.

Технический контекст

Я зацепился не за сам баг, а за форму тикета. LLM тут не ограничился фразой «что-то не так в diffusion.py», а разложил причинно-следственную цепочку: десорбированная масса возвращается в поверхностную жидкую фазу, хотя физически после высыхания она должна уходить сразу в gas phase.

Для AI automation это как раз интересный момент. Модель не просто нашла подозрительную строчку, а связала код, физический смысл процесса и downstream-эффект на drydown симуляции через часы и дни.

Я пробежался по сути ошибки. В коде desorbed_mass вычитается из накопленного в ткани, но одновременно прибавляется в remaining[component_id], то есть обратно в «лужу» на поверхности. Дальше движок снова гоняет это через испарение жидкой фазы, коэффициенты активности и смешивание с компонентами, которых на поверхности уже нет.

И вот это уже похоже не на случайный текстоген, а на нормальный draft root-cause analysis. Исправление тоже сформулировано по делу: если поверхностная жидкость практически исчезла, десорбция должна становиться прямым источником для headspace, а не оживлять liquid film.

Но я бы не продавал это как «LLM заменил сеньора». По открытым данным у индустрии есть куча примеров, где модели неплохо суммаризируют тикеты и resolution notes, но таких публичных кейсов с глубоким физическим reasoning пока мало. И обратная сторона тоже известна: AI-репорты легко производят шум, если нет ревью и хороших правил валидации.

Влияние на бизнес и автоматизацию

Практический вывод простой: выигрывают команды, у которых дорого стоит внимание сильных инженеров. Если LLM делает первый проход по тикетам, собирает structured RCA и поднимает гипотезы с кодовыми ссылками, сеньоры тратят время не на писанину, а на решение.

Проигрывают те, кто включит это без фильтров. Один красивый AI-тикет не отменяет десяток галлюцинаций, особенно в численных моделях и scientific software.

Я бы внедрял это как слой AI implementation поверх issue workflow: модель пишет черновик бага, предлагает root cause, отмечает физические инварианты и отдельно складывает decisions в базу правил. Мы в Nahornyi AI Lab как раз такие вещи и собираем для клиентов: не «магический агент», а рабочую AI integration в инженерный процесс, где шум режется, а полезные находки не теряются. Если у вас команда тонет в разборе багов и ручном RCA, я могу вместе с вами построить AI automation так, чтобы она экономила часы разработки, а не плодила мусор.

Ранее мы уже рассказывали о том, как параллельные ИИ-агенты выявляют состояния гонки и другие неочевидные ошибки при ревью пулл-реквестов. Эта практика тесно связана с тем, как современные языковые модели учатся не просто анализировать программную логику, но и формировать глубокие, структурированные отчеты о найденных дефектах.

Поделиться статьёй