Gemma и DeepSeek уже закрывают 80% задач?

Из обсуждений в SF и свежих бенчмарков видно простое сдвижение: Gemma и DeepSeek уже хватает для большой части рутинных задач. Для AI automation это меняет выбор модели, бюджет и подход к внедрению, хотя сложное агентное поведение всё ещё лучше у frontier-систем.

Технический контекст

Я зацепился не за саму цифру 80%, а за то, как часто её теперь повторяют люди, которые реально строят продукты. И да, в AI implementation я вижу ту же картину: для суммаризации, классификации, extraction, structured outputs и части coding-задач открытые модели уже не выглядят компромиссом из бедности.

Я покопался в свежих сравнениях, и картина вышла довольно приземлённая. DeepSeek-V3 обычно сильнее Gemma 3 4B на общих и кодовых бенчмарках вроде GPQA, MMLU-Pro и LiveCodeBench, а Gemma местами держится лучше на instruction-following. Но главный удар тут не в лидерборде, а в цене.

Если брать опубликованные сравнения, Gemma 3 4B может стоить в разы дешевле: около $0.02 за миллион входных токенов и $0.04 за выходные, против примерно $0.27 и $1.10 у DeepSeek-V3. DeepSeek при этом мощнее на reasoning и коде, но Gemma внезапно становится очень вкусной для массовых, хорошо ограниченных пайплайнов.

Вот где я обычно торможу команду и говорю: не путайте “модель отвечает неплохо” и “система надёжно работает”. Открытые модели становятся хорошими не сами по себе, а в связке со схемами вывода, валидацией, RAG, маршрутизацией и человеческим контролем. Без нормальной AI architecture это всё быстро превращается в красивую демку.

Что это меняет для бизнеса и автоматизации

Первое последствие простое: high-volume задачи можно уводить с дорогих frontier-моделей без боли. Там, где нужен предсказуемый формат, а не философия на 12 абзацев, Gemma и DeepSeek уже часто отбивают себя лучше.

Второе: выигрывают команды, которым важны локальный запуск, контроль данных и кастомизация. Проигрывают те, кто пытается одним и тем же стеком закрыть и рутинный документооборот, и сложных AI-агентов с длинным планированием.

Третье: 20% оставшихся задач как раз самые дорогие по ошибке. Длинные agentic workflows, нетривиальный reasoning, сложный tool use и пограничные кейсы всё ещё лучше держатся на закрытых frontier-моделях. Экономить там вслепую я бы не советовал.

Мы в Nahornyi AI Lab как раз решаем эту неприятную часть: не просто выбираем модель по хайпу, а собираем AI automation под конкретный процесс, где считается цена ошибки, latency и стоимость поддержки. Если у вас уже назрел вопрос, что можно безопасно перенести на Gemma или DeepSeek, а что лучше оставить на сильных API, давайте разберём ваш workflow и соберём рабочую схему без лишних токенов и лишней магии.

Чтобы эффективно комбинировать тяжелые проприетарные сети для сложных задач и открытые решения вроде DeepSeek для базовых, бизнесу необходима гибкая маршрутизация. В одной из прошлых статей мы подробно разбирали, как использование LLM-прокси помогает избежать привязки к конкретному вендору и легко переключаться между моделями.

Поделиться статьёй

Twitter/X LinkedIn Telegram

Gemma и DeepSeek уже закрывают 80% задач?

Технический контекст

Что это меняет для бизнеса и автоматизации

Ещё новости

Gemma 4 стала заметно практичнее на edge

364M параметров и новый шанс для on-device AI