Технічний контекст
Я подивився на свіжі анонси Google, і моє враження одразу розділилося на дві частини: Omni хочеться потикати руками, а Gemini 3.5 Flash вже виглядає як нормальна база під AI automation. Це різні новини за ступенем готовності, і плутати їх не варто.
З Omni поки історія сира. З того, що спливло в продуктах і демо, це новий відео-напрямок рівня seedance 2: генерація, ремікс, шаблони, можливо, більш зв'язні переходи та краще утримання сцени. Але API я не бачу, публічної стабільної документації теж. Отже, для моєї AI architecture це поки не будівельний блок, а цікавий сигнал, куди Google тягне мультимодальність.
Gemini 3.5 Flash, навпаки, виглядає приземлено і корисно. Його подають як швидку модель, і якщо цифра 280+ за швидкістю тримається в реальному навантаженні, це вже цікаво не на слайді, а в проді. Плюс звучить важливий момент: на частині бенчмарків він обходить попередню Pro-версію. Не скрізь, не магічно, але сам вектор зрозумілий.
Ось тут я і зупинився. Коли fast-tier модель одразу доступна по API, це набагато важливіше за красиве демо. Я можу швидко перевірити latency, tool calling, чи стабільно вона тримає довгі ланцюжки, як поводиться при вилученні даних, маршрутизації запитів і в агентних сценаріях.
Окремо кумедно з Antigravity CLI. Схоже, Google збирає новий шар dev-інструментів навколо своїх моделей і workflows. Якщо вони доведуть CLI до зручного стану, старі звички навколо Gemini CLI реально можуть поїхати в бік нової точки входу.
Що це змінює для бізнесу та автоматизації
Якщо коротко, виграє Gemini 3.5 Flash. Я б дивився на нього для сапорту, внутрішніх асистентів, класифікації, сумаризації, мультимодального intake і дешевих агентних ланцюжків, де важливі швидкість і ціна, а не рекорд з reasoning. Це вже схоже на нормальну artificial intelligence implementation, а не на вітринну фічу.
Omni поки виграє тільки в одному: він піднімає планку очікувань щодо відеогенерації всередині екосистеми Google. Але без API це не той інструмент, на який я б зав'язував клієнтський pipeline або AI solution development зі зрозумілим SLA.
Програють тут ті, хто будує плани на чутках. Я таке бачив багато разів: красивий ролик надихає, а потім виявляється, що інтегрувати нічого. Тому ми в Nahornyi AI Lab зазвичай спочатку збираємо робочий контур на доступних моделях, а вже потім додаємо нові, коли вони реально стають частиною стека.
Якщо у вас якраз проблема у швидкості відповідей, вартості inference або потрібно акуратно вбудувати AI integration в поточні процеси, давайте розкладемо це по вашому стеку. У Nahornyi AI Lab я такі речі зазвичай приземляю без магії: вибираю модель, збираю архітектуру і допомагаю build AI automation так, щоб воно жило в проді, а не тільки в демо.