Skip to main content
NVIDIAVera RubinAI infrastructure

NVIDIA уже строит эпоху после Blackwell

NVIDIA показала, что Rubin уже уходит в производство: представлена новая платформа Vera Rubin, собственный CPU Vera, масштабирование через NVLink 6 и цифровые двойники дата-центров. Для бизнеса это важно, ведь интеграция и автоматизация ИИ теперь упираются в скорость и стоимость вычислений инференса.

Технический контекст

Я покопался в том, что NVIDIA реально показала, и тут история не про очередной «еще быстрее GPU». Они двигают целый AI factory стек: Rubin GPU, Vera CPU, NVLink 6, ConnectX-9, BlueField-4 и сетевую обвязку под огромные inference-нагрузки. Для тех, кто делает AI implementation в проде, это важнее красивых слайдов.

Самая приземленная штука здесь, на мой взгляд, это DGX Vera Rubin NVL72. В одной стойке собирают 72 Rubin GPU и 36 Vera CPU, а сверху обещают меньше узких мест на передаче данных и лучше cost per token относительно Blackwell. Я бы пока держал это в голове как vendor claims, но направление считывается очень четко.

Отдельно меня зацепил Vera CPU. NVIDIA не просто прилепила CPU «для галочки», а явно проектировала его под движение данных, reasoning-нагрузки и связку с ускорителями. Когда компания сама контролирует GPU, CPU, сеть и DPU, у нее уже получается не сервер, а цельная AI architecture.

Еще один сильный сигнал: они продолжают продавливать идею датацентра как симулируемого объекта. Перед физическим строительством гонять все через Omniverse digital twin звучит уже не как маркетинг, а как нормальная инженерная практика. Если это действительно обкатано на клиентах, значит проектирование AI-инфраструктуры становится ближе к software workflow, чем к классическому «построили и молимся».

С роботами история похожая. Публичных деталей меньше, чем хотелось бы, но NVIDIA опять сшивает железо, симуляцию и локальный инференс в один контур. И вот это уже база для физического AI, а не просто демки с выставки.

Что это меняет для бизнеса и автоматизации

Я вижу тут три последствия. Первое: крупный AI automation теперь все меньше про «выберите модель», и все больше про стоимость токена, сетевую топологию и память. Ошибка в архитектуре будет стоить дороже, чем ошибка в промпте.

Второе: выигрывают те, кто строит длинные пайплайны, агентные системы и роботизированные процессы. Проигрывают те, кто закупает железо без сценария использования и без расчета загрузки.

Третье: digital twin для infrastructure станет нормой. Я бы не удивился, если через пару циклов без симуляции уже никто серьезные AI-мощности не строит.

Именно на таких развилках обычно и нужен не «совет по AI», а нормальный AI solution development: что автоматизировать, где держать инференс, когда идти в on-prem, а когда не надо. Если у вас бизнес уже уперся в стоимость AI-процессов или в хаос вокруг внедрения, давайте посмотрим на это по-человечески: в Nahornyi AI Lab мы как раз собираем AI automation под реальные процессы, чтобы оно окупалось, а не просто красиво звучало в стратегии.

Параллельно с ростом производительности кремния возрастает и значимость аппаратной защиты обрабатываемых данных в облаке. Ранее мы подробно анализировали концепцию конфиденциальных вычислений, которая становится важнейшим стандартом безопасности для современных облачных инфраструктур.

Поделиться статьёй