Skip to main content
NVIDIADGX StationAI hardware

NVIDIA DGX Station меняет локальный AI

NVIDIA анонсировала настольный суперкомпьютер DGX Station для Windows с 748 ГБ быстрой когерентной памяти и вычислительной мощностью до 20 PFLOPS. Система способна локально запускать тяжелые языковые модели размером до 1 триллиона параметров. Для современного бизнеса это означает возможность безопасного внедрения сложных AI-решений без обязательной привязки к дорогостоящим облачным сервисам.

Технический контекст

Я посмотрел на DGX Station for Windows и сразу отметил не маркетинговую обертку, а архитектуру. Тут NVIDIA не просто собрала мощный десктоп, а подводит enterprise к локальному AI implementation там, где раньше почти все упиралось в облако.

База системы, судя по анонсу NVIDIA, это GB300 Grace Blackwell Ultra Desktop Superchip: 72-ядерный Grace CPU плюс Blackwell Ultra GPU, связанные через NVLink-C2C. Самое вкусное здесь не только вычисление, а память: до 748 ГБ когерентного пула, где 496 ГБ приходится на LPDDR5X, а еще 252 ГБ на HBM3e.

И вот на этой цифре я реально завис. Потому что 252 ГБ HBM3e с пропускной способностью около 7.1 ТБ/с рядом с 496 ГБ LPDDR5X на 396 ГБ/с дают не просто большой объем, а очень интересный баланс для тяжелого инференса, тонкой настройки и смешанных пайплайнов.

По производительности NVIDIA заявляет до 20 PFLOPS в FP4. Плюс компания прямо говорит о локальном запуске моделей до 1 трлн параметров и о сценариях с постоянными AI-агентами внутри Windows-окружения. Поставки обещают в Q4 2026 через ASUS, Dell, HP, MSI, GIGABYTE и Supermicro.

Цены, что показательно, публично не раскрыли. Когда вендор уводит в sales inquiry, я обычно мысленно перевожу это как «готовьте очень взрослый бюджет».

Что это меняет для бизнеса и автоматизации

Я вижу здесь три практических эффекта. Первый: команды, которым нельзя или очень больно выносить данные в облако, получают шанс строить AI automation локально, без вечной борьбы с безопасностью, задержками и стоимостью токенов.

Второй: меняется AI architecture для enterprise. Вместо схемы «все в облако» можно собрать гибрид: чувствительные агенты и приватные модели держать у себя, а наружу выносить только пики нагрузки или менее критичные задачи.

Третий: выигрывают R&D, финтех, медицина, industrial и все, у кого длинные циклы экспериментов. Проигрывают, как ни странно, те, кто купит такую машину без понимания пайплайна: железо само по себе не чинит хаос в процессах.

Я с таким сталкиваюсь постоянно: узкое место редко в FLOPS, чаще в том, как данные ходят между системами, кто вызывает модель, где живет контекст и как контролируется стоимость ответа. В Nahornyi AI Lab мы как раз раскладываем такие вещи по слоям и собираем AI integration так, чтобы оно работало в реальном бизнесе, а не только в демо на красивом столе.

Если вы уже смотрите на локальные модели, приватных агентов или гибридную инфраструктуру, давайте разберем ваш кейс без фантазий. Иногда достаточно не покупать «самолет на стол», а точно спроектировать AI solution development под ваши ограничения, и эффект для команды будет сильнее.

Полноценное использование мощных настольных суперкомпьютеров требует соответствующего локального софта, работающего без обращения к сторонним облачным сервисам. Ранее мы подробно разбирали архитектуру Rust LocalGPT, позволяющую развернуть производительный и независимый ИИ-ассистент непосредственно на собственном оборудовании.

Поделиться статьёй