Omni, Gemini 3.5 Flash и странный ход Google

Google засветил Omni как новое видеонаправление внутри своих продуктов, а Gemini 3.5 Flash уже идет в API как быстрая модель. Для бизнеса это важно: AI integration можно запускать сразу на Flash, а Omni пока годится скорее для наблюдения и тестов перед реальным внедрением.

Технический контекст

Я посмотрел на свежие анонсы Google и у меня сразу разделилось впечатление на две части: Omni хочется потыкать руками, а Gemini 3.5 Flash уже выглядит как нормальная база под AI automation. Это разные новости по степени готовности, и путать их не стоит.

С Omni пока история сырая. По тому, что всплыло в продуктах и демо, это новое видео-направление уровня seedance 2: генерация, ремикс, шаблоны, возможно более связные переходы и лучшее удержание сцены. Но API я не вижу, публичной стабильной документации тоже. Значит, для моей AI architecture это пока не строительный блок, а интересный сигнал, куда Google тащит мультимодальность.

Gemini 3.5 Flash, наоборот, выглядит приземленно и полезно. Его подают как быструю модель, и если цифра 280+ по скорости держится в реальной нагрузке, это уже интересно не на слайде, а в проде. Плюс звучит важный момент: на части бенчей он обходит прошлую Pro-версию. Не везде, не магически, но сам вектор понятен.

Вот здесь я и остановился. Когда fast-tier модель сразу доступна по API, это намного важнее красивого демо. Я могу быстро проверить latency, tool calling, стабильно ли она держит длинные цепочки, как ведет себя на извлечении данных, маршрутизации запросов и в агентных сценариях.

Отдельно забавно с Antigravity CLI. Похоже, Google собирает новый слой dev-инструментов вокруг своих моделей и workflows. Если они доведут CLI до удобного состояния, старые привычки вокруг Gemini CLI реально могут поехать в сторону новой точки входа.

Что это меняет для бизнеса и автоматизации

Если коротко, выигрывает Gemini 3.5 Flash. Я бы смотрел на него для саппорта, внутренних ассистентов, классификации, суммаризации, мультимодального intake и дешевых агентных цепочек, где важны скорость и цена, а не рекорд по reasoning. Это уже похоже на нормальную artificial intelligence implementation, а не на витринную фичу.

Omni пока выигрывает только в одном: он поднимает планку ожиданий по видеогенерации внутри экосистемы Google. Но без API это не тот инструмент, на который я бы завязывал клиентский pipeline или AI solution development с понятным SLA.

Проигрывают здесь те, кто строит планы по слухам. Я такое видел много раз: красивый ролик вдохновляет, а потом оказывается, что интегрировать нечего. Поэтому мы в Nahornyi AI Lab обычно сначала собираем рабочий контур на доступных моделях, а уже потом добавляем новые, когда они реально становятся частью стека.

Если у вас как раз упирается в скорость ответов, стоимость inference или нужно аккуратно встроить AI integration в текущие процессы, давайте разложим это по вашему стеку. В Nahornyi AI Lab я такие вещи обычно приземляю без магии: выбираю модель, собираю архитектуру и помогаю build AI automation так, чтобы оно жило в проде, а не только в демо.

Хотя стратегия Google в отношении Gemini продолжает развиваться, модель была оценена для конкретных приложений. Ранее мы рассматривали Gemini наряду с другими инструментами на предмет ее производительности в составлении резюме совещаний с использованием ИИ, анализируя точность, риски галлюцинаций и стратегии безопасной автоматизации бизнеса.

Поделиться статьёй

Twitter/X LinkedIn Telegram

Omni, Gemini 3.5 Flash и странный ход Google

Технический контекст

Что это меняет для бизнеса и автоматизации

Ещё новости

Gemma 4 стала заметно практичнее на edge

364M параметров и новый шанс для on-device AI