Microsoft Webwright меняет веб-автоматизацию

Microsoft официально выложила в open source Webwright — совершенно новый фреймворк класса browser-agent, предназначенный для длинных и сложных веб-задач. Главное преимущество кроется не в создании очередного UI-бота, а в том, что AI automation теперь можно надежно строить вокруг повторно запускаемых Python-скриптов, детальных логов и артефактов, заменяя хрупкие одноразовые клики.

Технический контекст

Я покопался в Webwright и сразу понял, почему штука интересная не только исследователям. Microsoft не делает еще один Playwright-клон, а дает каркас для AI automation, где модель работает через терминал, локальный workspace и пишет код, который сам же запускает браузерные сессии.

То есть результатом становится не след из кликов, а нормальный Python-скрипт, который можно пересмотреть, переиспользовать и докрутить руками. Вот это уже похоже на взрослую AI integration в процессы, а не на демо ради демо.

Архитектура у них нарочно маленькая: Runner, Model Endpoint и terminal Environment. Без цирка с десятком скрытых оркестраторов. Внутри стек тоже приземленный: playwright, httpx, pydantic, typer.

Мне отдельно зашло, что агент не привязан намертво к одной браузерной сессии. Он может поднимать несколько сессий, смотреть скриншоты и состояние страницы только когда нужно, а потом выкидывать браузер, сохраняя код, логи и артефакты на диск.

Это очень здравая инженерная идея. Когда я собираю AI solution development для клиентов, самая дорогая часть почти всегда не сам заход модели в браузер, а воспроизводимость, отладка и повторный запуск без магии.

По бенчмаркам Microsoft пишет про 86.7% на Online-Mind2Web и 60.8% на Odysseys при бюджете в 100 шагов. Цифры хорошие, но я бы смотрел не только на leaderboard. Для меня важнее, что harness маленький, поведение прозрачно, а выход сохраняется в коде, который можно ревьюить.

Что это меняет для бизнеса и автоматизации

Первое: выигрывают команды, которым нужны длинные веб-сценарии. Сбор данных из кабинетов, проверка заявок, сложные бэкофисные маршруты, где обычный RPA ломается от каждого чиха интерфейса.

Второе: дешевле становится поддержка. Если агент оставляет после себя исполняемый скрипт и артефакты, я быстрее нахожу, где он ошибся, и не трачу часы на археологию по логам. Это уже влияет на стоимость AI implementation, а не только на красоту архитектуры.

Проиграют те, кто ждет кнопку “сделай все сам”. Webwright все еще требует инженерной сборки вокруг модели, безопасности, секретов, ретраев и контроля шагов. Мы в Nahornyi AI Lab как раз решаем такие стыки на практике, потому что именно там чаще всего умирают красивые прототипы.

Если у вас веб-процессы съедают людей и время, я бы не тащил туда очередной хрупкий макрос. Лучше посмотреть, можно ли на базе такого подхода собрать AI automation под ваш реальный workflow, и здесь Nahornyi AI Lab с Vadym Nahornyi может помочь без лишнего шоу, только с рабочей архитектурой и понятным результатом.

Мы уже подробно разбирали надвигающийся «кризис субстандартного кода», при котором стремительное внедрение ИИ-инструментов снижает качество архитектуры и увеличивает стоимость поддержки проектов. Появление новых решений для веб-разработки делает вопрос грамотной интеграции таких помощников в рабочие процессы еще более острым.

Поделиться статьёй

Twitter/X LinkedIn Telegram

Microsoft Webwright меняет веб-автоматизацию

Технический контекст

Что это меняет для бизнеса и автоматизации

Ещё новости

Gemma 4 стала заметно практичнее на edge

364M параметров и новый шанс для on-device AI