Що я побачив у Gemma 4 на рівні заліза та API
Я поліз дивитися Gemma 4 не заради цікавості, а з чітким питанням: це черговий пресреліз чи модель, яку реально можна тягнути в прод? За специфікаціями виглядає бадьоро. Google розклала сімейство одразу за кількома сценаріями: E2B на 2B, E4B на 4B, 26B A4B як Mixture-of-Experts та 31B як щільна старша модель.
Мені сподобалося, що тут немає спроби запхнути все в одну універсальну вагу. Маленькі версії йдуть з контекстом 128K і явно націлені на edge, mobile та браузерні сценарії. Старші моделі вже дають 256K контексту, і це цікавіше для довгих пайплайнів, агентних ланцюжків та корпоративних документів, де вікно часто важливіше за красивий бенчмарк.
Я окремо завис на мультимодальності. У Gemma 4 заявлена нативна робота з текстом, зображеннями та аудіо, плюс interleaved input, тобто можна змішувати текст і картинки прямо в одному промпті без милиць. Для тих, хто робить ШІ-рішення для бізнесу, це не прикраса, а нормальна база під сапорт, розбір медіафайлів, контроль якості та внутрішні knowledge-системи.
Ще один практичний момент: function calling та system prompt support з коробки. Це дрібниця рівно до того моменту, поки не починаєш робити ШІ-інтеграцію в реальні процеси. Щойно модель має не просто базікати, а викликати інструменти, ходити в CRM, класифікувати звернення та повертати структуровану відповідь, такі речі різко перестають бути опцією.
Щодо пам'яті картина теж зрозуміла. E4B у 4-бітній квантизації просить близько 5 ГБ, 31B — близько 17.4 ГБ, а 26B A4B — близько 15.6 ГБ. Тобто молодші версії вже потрапляють у цілком притомний локальний та edge-контур, а старші можна крутити на серйозніших машинах без відчуття, що ти орендуєш дата-центр заради однієї фічі.
І так, спільнота вже тестує модель. Перші відгуки по gemma4:e4b виглядають скоріше позитивно, і це хороший знак. Не істина в останній інстанції, але зазвичай за такими ранніми тестами швидко видно, чи буде в моделі життя поза красивою лендинговою сторінкою.
Де Gemma 4 реально змінює розклад для бізнесу
Я б не дивився на Gemma 4 як на ще одну модель у таблиці порівняння. Для мене це розширення пулу адекватних open-weight варіантів, з яких можна збирати архітектуру ШІ-рішень під завдання, бюджет та обмеження щодо даних. І ось це вже впливає на рішення набагато сильніше, ніж чергова суперечка в дусі «хто на пів бала вищий у бенчмарку».
Виграють команди, яким потрібна передбачуваність. Якщо у вас чутливі дані, вимоги до локального запуску, нестабільна економіка API або бажання зробити ШІ-автоматизацію без постійної залежності від зовнішньої хмари, Gemma 4 додає ще один нормальний маршрут. Особливо там, де раніше доводилося обирати між занадто важкою моделлю і занадто дурною.
Програють ті, хто все ще мислить у стилі «взяти одну модель і повісити на неї весь бізнес-процес». З Gemma 4, як і з іншими сильними open-моделями, краще працює композиція: маленька модель на тріаж та маршрутизацію, середня на вилучення та структурування, старша на складне міркування. Я саме так зазвичай і збираю пайплайни, коли робимо впровадження штучного інтелекту в Nahornyi AI Lab.
Є й приземлений плюс: менше бар'єрів для експериментів. Коли 4B-модель вже виглядає не як іграшка, а як кандидат на робочий контур, простіше запускати пілоти, перевіряти гіпотези та швидко рахувати юніт-економіку. Це сильно прискорює впровадження ШІ, тому що суперечка із серії «а раптом не злетить» перетворюється на короткий тест на реальних даних.
Але я б не романтизував реліз. Будь-яка open-weight модель розкривається тільки після нормальної обв'язки: RAG, виклики інструментів, фільтри, спостережуваність, маршрутизація, кеш, оцінка якості на вашому домені. Без цього навіть сильна модель залишається красивим демо. З цим уже можна робити автоматизацію за допомогою ШІ, яка не розвалюється після першого тижня.
Цей розбір написав я, Вадим Нагорний з Nahornyi AI Lab. Я не колекціоную анонси, я збираю з таких моделей робочі системи: від AI-архітектури до продової ШІ-автоматизації в операційці бізнесу. Якщо хочете приміряти Gemma 4 на ваш кейс, напишіть мені, і я допоможу швидко зрозуміти, де тут реальна вигода, а де просто шум навколо релізу.