Технічний контекст
Я порився у Webwright і відразу зрозумів, чому ця річ цікава не лише дослідникам. Microsoft не робить ще один клон Playwright; вони дають каркас для AI automation, де модель працює через термінал, локальний робочий простір і пише код, який сам же запускає браузерні сесії.
Тобто результатом стає не слід із кліків, а нормальний Python-скрипт, який можна переглянути, використати повторно та доопрацювати власноруч. Ось це вже схоже на дорослу інтеграцію ШІ в процеси, а не на демо заради демо.
Архітектура в них навмисно мінімалістична: Runner, Model Endpoint і термінальне середовище. Без цирку з десятком прихованих оркестраторів. Внутрішній стек теж приземлений: playwright, httpx, pydantic, typer.
Мені особливо сподобалося, що агент не прив'язаний намертво до однієї браузерної сесії. Він може підіймати кілька сесій, дивитися скриншоти та стан сторінки лише коли це потрібно, а потім викидати браузер, зберігаючи код, логи та артефакти на диск.
Це дуже здорова інженерна ідея. Коли я збираю рішення на базі ШІ для клієнтів, найдорожча частина майже завжди не сам захід моделі в браузер, а відтворюваність, налагодження та повторний запуск без прихованої магії.
Щодо бенчмарків, Microsoft пише про 86.7% на Online-Mind2Web та 60.8% на Odysseys при бюджеті у 100 кроків. Цифри хороші, але я б не дивився лише на таблицю лідерів. Для мене набагато важливіше, що обв'язка маленька, поведінка прозора, а результат зберігається в коді, який можна перевірити.
Що це змінює для бізнесу та автоматизації
Перше: виграють команди, яким потрібні довгі веб-сценарії. Збір даних із кабінетів, перевірка заявок, складні бекофісні маршрути, де звичайний RPA ламається від найменшої зміни інтерфейсу.
Друге: дешевшає підтримка. Якщо агент залишає після себе виконуваний скрипт і артефакти, я швидше знаходжу, де він помилився, і не витрачаю години на археологію по логах. Це вже впливає на вартість впровадження ШІ, а не лише на красу архітектури.
Програють ті, хто чекає на кнопку «зроби все сам». Webwright досі вимагає інженерної збірки навколо моделі, безпеки, роботи з секретами, ретраїв та контролю кроків. Ми в Nahornyi AI Lab якраз вирішуємо такі стики на практиці, тому що саме там найчастіше вмирають красиві прототипи.
Якщо ваші веб-процеси з'їдають час і зусилля команди, я б не тягнув туди черговий крихкий макрос. Краще подивитися, чи можна на базі такого підходу зібрати AI automation під ваш реальний workflow. Тут Nahornyi AI Lab разом із Vadym Nahornyi може допомогти без зайвого шоу, тільки з робочою архітектурою та зрозумілим результатом.