GLM-5.1 поднимает планку open-source агентов

Z.ai выпустила GLM-5.1, открытую агентную модель для долгих задач с браузером, терминалом и API. Для бизнеса это важный сдвиг: теперь open-source модели уже претендуют не на чат, а на полноценную ИИ автоматизацию рабочих процессов.

Технический контекст

Я люблю такие релизы не за громкие слова, а за то, что можно посмотреть, где кончается демо и начинается реальная инженерия. У GLM-5.1 как раз интересный замах: не просто ответить на запрос, а тянуть одну сложную задачу почти как отдельный исполнитель в течение «8-часового рабочего дня».

Релиз у Z.ai вышел в конце марта 2026 года, так что новость свежая, не ретро. По официальному описанию модель заточена под long-horizon execution: она сама планирует шаги, вызывает инструменты, держит состояние, проверяет результат и чинит собственные косяки без того, чтобы человек каждые пять минут подталкивал её палкой.

Меня зацепило не слово open-source само по себе, а набор возможностей. Браузер, терминал, API-вызовы, многошаговое выполнение, self-correction, работа в замкнутом цикле. Вот это уже похоже не на «ещё один LLM», а на заготовку под нормального агента, которого можно встраивать в продовую AI-архитектуру.

По цифрам картина тоже любопытная. В публичных материалах фигурирует SWE-Bench Pro 58.4 и заявления, что модель обходит Claude Opus 4.6 на части бенчмарков по коду, логике и агентным сценариям. При этом в некоторых eval-ах разрыв уже не такой драматичный, а где-то GLM-5.1 скорее очень близко подходит к Opus, чем уничтожает его в одну калитку.

И это, честно, даже хороший знак. Когда маркетинг кричит «убийца Claude», я обычно настораживаюсь. Здесь интереснее другое: открытая модель вообще дошла до класса задач, где раньше почти безальтернативно смотрели на закрытые топовые API.

По архитектуре Z.ai продолжает линию GLM-5, где был MoE-подход с большим общим числом параметров и меньшим активным слоем на токен. В открытых пересказах мелькают оценки порядка 744B total и около 40B active, плюс длинный контекст в районе 128K-200K. Пока без полноценного техрепорта это стоит воспринимать аккуратно, но направление понятное: ставка на длинные цепочки действий, а не на красивый single-shot ответ.

Есть, правда, ложка дёгтя. В ранних пользовательских тестах модель местами очень медленная. Если агент думает полтора часа там, где конкурент делает работу быстрее, то в проде это быстро превращается в вопрос экономики, SLA и терпения команды.

Что это меняет для бизнеса и автоматизации

Вот здесь начинается самое интересное. GLM-5.1 поднимает планку не в категории «чат-бот ответил умнее», а в категории «агент может сам закрыть кусок процесса». Для меня это куда важнее любого лидерства в таблице бенчмарков.

Если раньше многие сценарии внедрения искусственного интеллекта упирались в короткий диалог плюс куча ручной обвязки, то теперь open-source стек уже можно собирать под автономные workflow. Не игрушечные. Я говорю про ресерч, QA, разработку, обработку заявок, интеграционные задачи, внутренние сервисные операции.

Выигрывают команды, которым нужна ИИ интеграция без полной зависимости от одного вендора. Особенно там, где есть требования к приватности, кастомной оркестрации, локальному размещению или специфической tool-chain логике. Проигрывают те, кто всё ещё мыслит ИИ как «давайте прикрутим поле для промпта на сайт и назовём это трансформацией».

Но тут есть подвох, и я его вижу на проектах постоянно. Сам факт, что модель умеет пользоваться терминалом и API, ещё не означает, что у вас случилась ИИ автоматизация. Без нормального контроля состояния, ограничений по действиям, логирования, откатов, бюджетов на токены и human-in-the-loop такие агенты очень быстро начинают творить дичь уже в боевых процессах.

Мы в Nahornyi AI Lab как раз с этим и работаем: не просто подключаем модель, а собираем архитектуру ИИ-решений так, чтобы агент не был лотереей. Где-то нужен полностью автономный контур, где-то полуавтономный исполнитель, где-то вообще лучше узкий специализированный пайплайн вместо «универсального суперагента». Это скучнее, чем хайповые треды в X, но зато работает.

Мой вывод простой: GLM-5.1 показывает, что рынок двигается от ассистентов к исполнителям. И если скорость подтянут, open-source сегмент очень быстро полезет в те зоны, где раньше сидели только дорогие закрытые модели.

Разбор сделал я, Вадим Нагорный, в Nahornyi AI Lab. Я занимаюсь такими системами руками: проектирую ИИ решения для бизнеса, собираю агентные пайплайны, делаю n8n и кастомную автоматизацию с помощью ИИ под реальные процессы, а не под демо.

Если хотите прикинуть, можно ли у вас создать ИИ агента под задачу команды, или хотите заказать ИИ автоматизацию под конкретный workflow, напишите мне. Посмотрим ваш кейс без магии и без лишнего шума.

Поделиться статьёй

Twitter/X LinkedIn Telegram

GLM-5.1 поднимает планку open-source агентов

Технический контекст

Что это меняет для бизнеса и автоматизации

Ещё новости

LFM2.5-8B-A1B: что реально помогает от циклов

Твит Альтмана есть, а релиза пока не видно