Skip to main content
gemmagoogleopen-models

Gemma 4: ещё один сильный open-weight игрок

Google выпустила Gemma 4, новую линейку open-weight моделей от 2B до 31B, включая MoE-вариант. Для бизнеса это важно потому, что выбор между edge, локальным запуском и серверной AI-архитектурой стал заметно шире, а сообщество уже подтверждает, что даже компактные версии выглядят бодро.

Что я увидел в Gemma 4 на уровне железа и API

Я полез смотреть Gemma 4 не из любопытства ради, а с понятным вопросом: это очередной пресс-релиз или модель, которую реально можно тащить в прод? По спецификациям выглядит бодро. Google разложила семейство сразу по нескольким сценариям: E2B на 2B, E4B на 4B, 26B A4B как Mixture-of-Experts и 31B как плотная старшая модель.

Мне понравилось, что тут нет попытки запихнуть всё в один универсальный вес. Маленькие версии идут с контекстом 128K и явно целятся в edge, mobile и браузерные сценарии. Старшие модели уже дают 256K контекста, и это интереснее для длинных пайплайнов, агентных цепочек и корпоративных документов, где окно часто важнее красивого бенчмарка.

Я отдельно завис на мультимодальности. У Gemma 4 заявлена нативная работа с текстом, изображениями и аудио, плюс interleaved input, то есть можно смешивать текст и картинки прямо в одном промпте без костылей. Для тех, кто делает ИИ решения для бизнеса, это не украшение, а нормальная база под саппорт, разбор медиафайлов, контроль качества и внутренние knowledge-системы.

Ещё один практичный момент: function calling и system prompt support из коробки. Это мелочь ровно до того момента, пока не начинаешь делать ИИ интеграцию в реальные процессы. Как только модель должна не просто болтать, а вызывать инструменты, ходить в CRM, классифицировать обращения и возвращать структурированный ответ, такие вещи резко перестают быть опцией.

По памяти картина тоже понятная. E4B в 4-битной квантизации просит около 5 ГБ, 31B около 17.4 ГБ, а 26B A4B около 15.6 ГБ. То есть младшие версии уже попадают в довольно вменяемый локальный и edge-контур, а старшие можно крутить на более серьёзных машинах без ощущения, что ты арендуешь дата-центр ради одной фичи.

И да, сообщество уже щупает модель. Первые отзывы по gemma4:e4b выглядят скорее позитивно, и это хороший знак. Не истина в последней инстанции, но обычно по таким ранним тестам быстро видно, будет ли у модели жизнь вне красивой лендинговой страницы.

Где Gemma 4 реально меняет расклад для бизнеса

Я бы не смотрел на Gemma 4 как на ещё одну модель в таблице сравнения. Для меня это расширение пула вменяемых open-weight вариантов, из которых можно собирать архитектуру ИИ-решений под задачу, бюджет и ограничения по данным. И вот это уже влияет на решения намного сильнее, чем очередной спор в духе кто на полбалла выше в бенчмарке.

Выигрывают команды, которым нужна предсказуемость. Если у вас чувствительные данные, требования к локальному запуску, нестабильная экономика API или желание сделать ИИ автоматизацию без постоянной зависимости от внешнего облака, Gemma 4 добавляет ещё один нормальный маршрут. Особенно там, где раньше приходилось выбирать между слишком тяжёлой моделью и слишком глупой.

Проигрывают те, кто всё ещё мыслит в стиле взять одну модель и повесить на неё весь бизнес-процесс. С Gemma 4, как и с другими сильными open моделями, лучше работает композиция: маленькая модель на triage и маршрутизацию, средняя на извлечение и структурирование, старшая на сложное рассуждение. Я именно так обычно и собираю пайплайны, когда делаем внедрение искусственного интеллекта в Nahornyi AI Lab.

Есть и приземлённый плюс: меньше барьеров для экспериментов. Когда 4B-модель уже выглядит не как игрушка, а как кандидат на рабочий контур, проще запускать пилоты, проверять гипотезы и быстро считать unit-экономику. Это сильно ускоряет внедрение ИИ, потому что спор из серии «а вдруг не взлетит» превращается в короткий тест на реальных данных.

Но я бы не романтизировал релиз. Любая open-weight модель раскрывается только после нормальной обвязки: RAG, вызовы инструментов, фильтры, наблюдаемость, маршрутизация, кэш, оценка качества на вашем домене. Без этого даже сильная модель остаётся красивым демо. С этим уже можно делать автоматизацию с помощью ИИ, которая не разваливается после первой недели.

Этот разбор написал я, Вадим Нагорный из Nahornyi AI Lab. Я не коллекционирую анонсы, я собираю из таких моделей рабочие системы: от AI-архитектуры до продовой ИИ автоматизации в операционке бизнеса. Если хотите примерить Gemma 4 на ваш кейс, напишите мне, и я помогу быстро понять, где тут реальная выгода, а где просто шум вокруг релиза.

Поделиться статьёй