Технический контекст
Я посмотрел на свежие анонсы Google и у меня сразу разделилось впечатление на две части: Omni хочется потыкать руками, а Gemini 3.5 Flash уже выглядит как нормальная база под AI automation. Это разные новости по степени готовности, и путать их не стоит.
С Omni пока история сырая. По тому, что всплыло в продуктах и демо, это новое видео-направление уровня seedance 2: генерация, ремикс, шаблоны, возможно более связные переходы и лучшее удержание сцены. Но API я не вижу, публичной стабильной документации тоже. Значит, для моей AI architecture это пока не строительный блок, а интересный сигнал, куда Google тащит мультимодальность.
Gemini 3.5 Flash, наоборот, выглядит приземленно и полезно. Его подают как быструю модель, и если цифра 280+ по скорости держится в реальной нагрузке, это уже интересно не на слайде, а в проде. Плюс звучит важный момент: на части бенчей он обходит прошлую Pro-версию. Не везде, не магически, но сам вектор понятен.
Вот здесь я и остановился. Когда fast-tier модель сразу доступна по API, это намного важнее красивого демо. Я могу быстро проверить latency, tool calling, стабильно ли она держит длинные цепочки, как ведет себя на извлечении данных, маршрутизации запросов и в агентных сценариях.
Отдельно забавно с Antigravity CLI. Похоже, Google собирает новый слой dev-инструментов вокруг своих моделей и workflows. Если они доведут CLI до удобного состояния, старые привычки вокруг Gemini CLI реально могут поехать в сторону новой точки входа.
Что это меняет для бизнеса и автоматизации
Если коротко, выигрывает Gemini 3.5 Flash. Я бы смотрел на него для саппорта, внутренних ассистентов, классификации, суммаризации, мультимодального intake и дешевых агентных цепочек, где важны скорость и цена, а не рекорд по reasoning. Это уже похоже на нормальную artificial intelligence implementation, а не на витринную фичу.
Omni пока выигрывает только в одном: он поднимает планку ожиданий по видеогенерации внутри экосистемы Google. Но без API это не тот инструмент, на который я бы завязывал клиентский pipeline или AI solution development с понятным SLA.
Проигрывают здесь те, кто строит планы по слухам. Я такое видел много раз: красивый ролик вдохновляет, а потом оказывается, что интегрировать нечего. Поэтому мы в Nahornyi AI Lab обычно сначала собираем рабочий контур на доступных моделях, а уже потом добавляем новые, когда они реально становятся частью стека.
Если у вас как раз упирается в скорость ответов, стоимость inference или нужно аккуратно встроить AI integration в текущие процессы, давайте разложим это по вашему стеку. В Nahornyi AI Lab я такие вещи обычно приземляю без магии: выбираю модель, собираю архитектуру и помогаю build AI automation так, чтобы оно жило в проде, а не только в демо.