Технический контекст
Я покопался в Webwright и сразу понял, почему штука интересная не только исследователям. Microsoft не делает еще один Playwright-клон, а дает каркас для AI automation, где модель работает через терминал, локальный workspace и пишет код, который сам же запускает браузерные сессии.
То есть результатом становится не след из кликов, а нормальный Python-скрипт, который можно пересмотреть, переиспользовать и докрутить руками. Вот это уже похоже на взрослую AI integration в процессы, а не на демо ради демо.
Архитектура у них нарочно маленькая: Runner, Model Endpoint и terminal Environment. Без цирка с десятком скрытых оркестраторов. Внутри стек тоже приземленный: playwright, httpx, pydantic, typer.
Мне отдельно зашло, что агент не привязан намертво к одной браузерной сессии. Он может поднимать несколько сессий, смотреть скриншоты и состояние страницы только когда нужно, а потом выкидывать браузер, сохраняя код, логи и артефакты на диск.
Это очень здравая инженерная идея. Когда я собираю AI solution development для клиентов, самая дорогая часть почти всегда не сам заход модели в браузер, а воспроизводимость, отладка и повторный запуск без магии.
По бенчмаркам Microsoft пишет про 86.7% на Online-Mind2Web и 60.8% на Odysseys при бюджете в 100 шагов. Цифры хорошие, но я бы смотрел не только на leaderboard. Для меня важнее, что harness маленький, поведение прозрачно, а выход сохраняется в коде, который можно ревьюить.
Что это меняет для бизнеса и автоматизации
Первое: выигрывают команды, которым нужны длинные веб-сценарии. Сбор данных из кабинетов, проверка заявок, сложные бэкофисные маршруты, где обычный RPA ломается от каждого чиха интерфейса.
Второе: дешевле становится поддержка. Если агент оставляет после себя исполняемый скрипт и артефакты, я быстрее нахожу, где он ошибся, и не трачу часы на археологию по логам. Это уже влияет на стоимость AI implementation, а не только на красоту архитектуры.
Проиграют те, кто ждет кнопку “сделай все сам”. Webwright все еще требует инженерной сборки вокруг модели, безопасности, секретов, ретраев и контроля шагов. Мы в Nahornyi AI Lab как раз решаем такие стыки на практике, потому что именно там чаще всего умирают красивые прототипы.
Если у вас веб-процессы съедают людей и время, я бы не тащил туда очередной хрупкий макрос. Лучше посмотреть, можно ли на базе такого подхода собрать AI automation под ваш реальный workflow, и здесь Nahornyi AI Lab с Vadym Nahornyi может помочь без лишнего шоу, только с рабочей архитектурой и понятным результатом.