Технічний контекст
Я звернув увагу не на саму цифру 80%, а на те, як часто її тепер повторюють люди, котрі реально створюють продукти. І так, в AI implementation я бачу ту саму картину: для сумаризації, класифікації, extraction, structured outputs і частини coding-завдань відкриті моделі вже не виглядають як компроміс через брак бюджету.
Я дослідив свіжі порівняння, і ситуація виявилася досить приземленою. DeepSeek-V3 зазвичай сильніший за Gemma 3 4B на загальних і кодових бенчмарках на кшталт GPQA, MMLU-Pro та LiveCodeBench, тоді як Gemma подекуди тримається краще в instruction-following. Але головний прорив тут не в лідерборді, а в ціні.
Якщо брати опубліковані порівняння, Gemma 3 4B може коштувати в рази дешевше: близько $0.02 за мільйон вхідних токенів і $0.04 за вихідні, проти приблизно $0.27 і $1.10 у DeepSeek-V3. Хоча DeepSeek потужніший у reasoning і коді, Gemma раптово стає дуже привабливою для масових, чітко обмежених пайплайнів.
Ось тут я зазвичай зупиняю команду і кажу: не плутайте “модель непогано відповідає” і “система надійно працює”. Відкриті моделі стають хорошими не самі по собі, а у зв'язці зі схемами виведення, валідацією, RAG, маршрутизацією та людським контролем. Без нормальної AI architecture це все швидко перетворюється на красиву демку.
Що це змінює для бізнесу та автоматизації
Перший наслідок простий: high-volume завдання можна переводити з дорогих frontier-моделей без болю. Там, де потрібен передбачуваний формат, а не філософія на 12 абзаців, Gemma і DeepSeek уже часто окупають себе значно краще.
Другий: виграють команди, яким важливий локальний запуск, контроль даних і кастомізація. Програють ті, хто намагається одним і тим самим стеком закрити і рутинний документообіг, і складних AI-агентів із довгим плануванням.
Третій: 20% завдань, що залишилися, — це саме ті, де помилка коштує найдорожче. Довгі agentic workflows, нетривіальний reasoning, складний tool use та пограничні кейси все ще краще тримаються на закритих frontier-моделях. Економити там наосліп я б не радив.
Ми в Nahornyi AI Lab якраз вирішуємо цю неприємну частину: не просто обираємо модель за хайпом, а збираємо AI automation під конкретний процес, де рахується ціна помилки, latency і вартість підтримки. Якщо у вас уже назріло питання, що можна безпечно перенести на Gemma або DeepSeek, а що краще залишити на сильних API, давайте розберемо ваш workflow і зберемо робочу схему без зайвих токенів і зайвої магії.