Технический контекст
Я зацепился не за саму цифру 80%, а за то, как часто её теперь повторяют люди, которые реально строят продукты. И да, в AI implementation я вижу ту же картину: для суммаризации, классификации, extraction, structured outputs и части coding-задач открытые модели уже не выглядят компромиссом из бедности.
Я покопался в свежих сравнениях, и картина вышла довольно приземлённая. DeepSeek-V3 обычно сильнее Gemma 3 4B на общих и кодовых бенчмарках вроде GPQA, MMLU-Pro и LiveCodeBench, а Gemma местами держится лучше на instruction-following. Но главный удар тут не в лидерборде, а в цене.
Если брать опубликованные сравнения, Gemma 3 4B может стоить в разы дешевле: около $0.02 за миллион входных токенов и $0.04 за выходные, против примерно $0.27 и $1.10 у DeepSeek-V3. DeepSeek при этом мощнее на reasoning и коде, но Gemma внезапно становится очень вкусной для массовых, хорошо ограниченных пайплайнов.
Вот где я обычно торможу команду и говорю: не путайте “модель отвечает неплохо” и “система надёжно работает”. Открытые модели становятся хорошими не сами по себе, а в связке со схемами вывода, валидацией, RAG, маршрутизацией и человеческим контролем. Без нормальной AI architecture это всё быстро превращается в красивую демку.
Что это меняет для бизнеса и автоматизации
Первое последствие простое: high-volume задачи можно уводить с дорогих frontier-моделей без боли. Там, где нужен предсказуемый формат, а не философия на 12 абзацев, Gemma и DeepSeek уже часто отбивают себя лучше.
Второе: выигрывают команды, которым важны локальный запуск, контроль данных и кастомизация. Проигрывают те, кто пытается одним и тем же стеком закрыть и рутинный документооборот, и сложных AI-агентов с длинным планированием.
Третье: 20% оставшихся задач как раз самые дорогие по ошибке. Длинные agentic workflows, нетривиальный reasoning, сложный tool use и пограничные кейсы всё ещё лучше держатся на закрытых frontier-моделях. Экономить там вслепую я бы не советовал.
Мы в Nahornyi AI Lab как раз решаем эту неприятную часть: не просто выбираем модель по хайпу, а собираем AI automation под конкретный процесс, где считается цена ошибки, latency и стоимость поддержки. Если у вас уже назрел вопрос, что можно безопасно перенести на Gemma или DeepSeek, а что лучше оставить на сильных API, давайте разберём ваш workflow и соберём рабочую схему без лишних токенов и лишней магии.