Gemma та DeepSeek вже закривають 80% завдань?

Зі свіжих бенчмарків видно чітку тенденцію: можливостей Gemma та DeepSeek вже достатньо для більшості рутинних завдань. Для AI-автоматизації це докорінно змінює вибір моделі, бюджет і підхід до впровадження, хоча складна агентна поведінка все ще залишається сильною стороною передових frontier-систем.

Технічний контекст

Я звернув увагу не на саму цифру 80%, а на те, як часто її тепер повторюють люди, котрі реально створюють продукти. І так, в AI implementation я бачу ту саму картину: для сумаризації, класифікації, extraction, structured outputs і частини coding-завдань відкриті моделі вже не виглядають як компроміс через брак бюджету.

Я дослідив свіжі порівняння, і ситуація виявилася досить приземленою. DeepSeek-V3 зазвичай сильніший за Gemma 3 4B на загальних і кодових бенчмарках на кшталт GPQA, MMLU-Pro та LiveCodeBench, тоді як Gemma подекуди тримається краще в instruction-following. Але головний прорив тут не в лідерборді, а в ціні.

Якщо брати опубліковані порівняння, Gemma 3 4B може коштувати в рази дешевше: близько $0.02 за мільйон вхідних токенів і $0.04 за вихідні, проти приблизно $0.27 і $1.10 у DeepSeek-V3. Хоча DeepSeek потужніший у reasoning і коді, Gemma раптово стає дуже привабливою для масових, чітко обмежених пайплайнів.

Ось тут я зазвичай зупиняю команду і кажу: не плутайте “модель непогано відповідає” і “система надійно працює”. Відкриті моделі стають хорошими не самі по собі, а у зв'язці зі схемами виведення, валідацією, RAG, маршрутизацією та людським контролем. Без нормальної AI architecture це все швидко перетворюється на красиву демку.

Що це змінює для бізнесу та автоматизації

Перший наслідок простий: high-volume завдання можна переводити з дорогих frontier-моделей без болю. Там, де потрібен передбачуваний формат, а не філософія на 12 абзаців, Gemma і DeepSeek уже часто окупають себе значно краще.

Другий: виграють команди, яким важливий локальний запуск, контроль даних і кастомізація. Програють ті, хто намагається одним і тим самим стеком закрити і рутинний документообіг, і складних AI-агентів із довгим плануванням.

Третій: 20% завдань, що залишилися, — це саме ті, де помилка коштує найдорожче. Довгі agentic workflows, нетривіальний reasoning, складний tool use та пограничні кейси все ще краще тримаються на закритих frontier-моделях. Економити там наосліп я б не радив.

Ми в Nahornyi AI Lab якраз вирішуємо цю неприємну частину: не просто обираємо модель за хайпом, а збираємо AI automation під конкретний процес, де рахується ціна помилки, latency і вартість підтримки. Якщо у вас уже назріло питання, що можна безпечно перенести на Gemma або DeepSeek, а що краще залишити на сильних API, давайте розберемо ваш workflow і зберемо робочу схему без зайвих токенів і зайвої магії.

Щоб ефективно поєднувати важкі пропрієтарні мережі для складних завдань і відкриті рішення на кшталт DeepSeek для базових, бізнесу потрібна гнучка маршрутизація. У попередній статті ми докладно розглянули, як використання LLM-проксі допомагає уникнути прив'язки до вендора і легко перемикатися.

Поділитися статтею

Twitter/X LinkedIn Telegram

Gemma та DeepSeek вже закривають 80% завдань?

Технічний контекст

Що це змінює для бізнесу та автоматизації

Ще новини

Gemma 4 стала помітно практичнішою на edge

364M параметрів і новий шанс для ШІ на пристроях