Технический контекст
Я покопался в том, что NVIDIA реально показала, и тут история не про очередной «еще быстрее GPU». Они двигают целый AI factory стек: Rubin GPU, Vera CPU, NVLink 6, ConnectX-9, BlueField-4 и сетевую обвязку под огромные inference-нагрузки. Для тех, кто делает AI implementation в проде, это важнее красивых слайдов.
Самая приземленная штука здесь, на мой взгляд, это DGX Vera Rubin NVL72. В одной стойке собирают 72 Rubin GPU и 36 Vera CPU, а сверху обещают меньше узких мест на передаче данных и лучше cost per token относительно Blackwell. Я бы пока держал это в голове как vendor claims, но направление считывается очень четко.
Отдельно меня зацепил Vera CPU. NVIDIA не просто прилепила CPU «для галочки», а явно проектировала его под движение данных, reasoning-нагрузки и связку с ускорителями. Когда компания сама контролирует GPU, CPU, сеть и DPU, у нее уже получается не сервер, а цельная AI architecture.
Еще один сильный сигнал: они продолжают продавливать идею датацентра как симулируемого объекта. Перед физическим строительством гонять все через Omniverse digital twin звучит уже не как маркетинг, а как нормальная инженерная практика. Если это действительно обкатано на клиентах, значит проектирование AI-инфраструктуры становится ближе к software workflow, чем к классическому «построили и молимся».
С роботами история похожая. Публичных деталей меньше, чем хотелось бы, но NVIDIA опять сшивает железо, симуляцию и локальный инференс в один контур. И вот это уже база для физического AI, а не просто демки с выставки.
Что это меняет для бизнеса и автоматизации
Я вижу тут три последствия. Первое: крупный AI automation теперь все меньше про «выберите модель», и все больше про стоимость токена, сетевую топологию и память. Ошибка в архитектуре будет стоить дороже, чем ошибка в промпте.
Второе: выигрывают те, кто строит длинные пайплайны, агентные системы и роботизированные процессы. Проигрывают те, кто закупает железо без сценария использования и без расчета загрузки.
Третье: digital twin для infrastructure станет нормой. Я бы не удивился, если через пару циклов без симуляции уже никто серьезные AI-мощности не строит.
Именно на таких развилках обычно и нужен не «совет по AI», а нормальный AI solution development: что автоматизировать, где держать инференс, когда идти в on-prem, а когда не надо. Если у вас бизнес уже уперся в стоимость AI-процессов или в хаос вокруг внедрения, давайте посмотрим на это по-человечески: в Nahornyi AI Lab мы как раз собираем AI automation под реальные процессы, чтобы оно окупалось, а не просто красиво звучало в стратегии.