Skip to main content
NVIDIADGX StationAI hardware

NVIDIA DGX Station revoluciona la IA local

NVIDIA anunció DGX Station para Windows, un potente sistema de escritorio con 748 GB de memoria coherente y hasta 20 PFLOPS FP4. Permite ejecutar localmente modelos de un billón de parámetros, ofreciendo a las empresas un cambio clave hacia una automatización de IA privada y sin dependencias de la nube.

Contexto técnico

Analicé la DGX Station para Windows y de inmediato me fijé en su arquitectura, más que en el envoltorio de marketing. NVIDIA no se ha limitado a ensamblar un escritorio potente, sino que acerca a las empresas al AI implementation local en un ámbito donde antes casi todo dependía de la nube.

La base del sistema, según el anuncio de NVIDIA, es el GB300 Grace Blackwell Ultra Desktop Superchip: un procesador Grace de 72 núcleos junto con una GPU Blackwell Ultra, conectados a través de NVLink-C2C. Lo más interesante aquí no es solo la computación, sino la memoria: hasta 748 GB de pool coherente, compuesto por 496 GB de LPDDR5X y otros 252 GB de HBM3e.

Esa cifra realmente me hizo detenerme a pensar. Disponer de 252 GB de HBM3e con un ancho de banda de unos 7,1 TB/s junto a 496 GB de LPDDR5X a 396 GB/s ofrece no solo una gran capacidad, sino un equilibrio muy interesante para inferencia pesada, ajuste fino y pipelines mixtos.

En rendimiento, NVIDIA promete hasta 20 PFLOPS en FP4. Además, la compañía habla explícitamente de la ejecución local de modelos de hasta 1 billón de parámetros y escenarios con agentes de IA persistentes en el entorno de Windows. Las entregas están previstas para el cuarto trimestre de 2026 a través de ASUS, Dell, HP, MSI, GIGABYTE y Supermicro.

Curiosamente, los precios no se revelaron públicamente. Cuando un proveedor remite a una consulta de ventas, suelo traducirlo mentalmente como «prepare un presupuesto muy considerable».

Qué cambia para los negocios y la automatización

Veo tres efectos prácticos aquí. Primero: los equipos que no pueden o tienen grandes dificultades para subir datos a la nube tienen la oportunidad de construir su AI automation localmente, sin la lucha constante por la seguridad, la latencia y el coste de los tokens.

Segundo: la AI architecture para empresas está cambiando. En lugar del esquema de «todo a la nube», se puede armar un híbrido: mantener los agentes sensibles y modelos privados de forma local, y derivar al exterior solo los picos de carga o tareas menos críticas.

Tercero: se benefician el I+D, las fintech, la medicina, el sector industrial y cualquiera con ciclos largos de experimentación. Pierden, por el contrario, quienes compren una máquina así sin entender su pipeline: el hardware por sí solo no soluciona el caos en los procesos.

Esto es algo con lo que me encuentro constantemente: el cuello de botella rara vez está en los FLOPS, sino más bien en cómo fluyen los datos entre sistemas, quién invoca al modelo, dónde reside el contexto y cómo se controla el coste de la respuesta. En Nahornyi AI Lab estructuramos estos elementos por capas y diseñamos la AI integration para que funcione en el negocio real, no solo en demostraciones sobre un escritorio bonito.

Si ya está evaluando modelos locales, agentes privados o una infraestructura híbrida, analicemos su caso sin rodeos. A veces, en lugar de comprar un «avión para el escritorio», diseñar con precisión un AI solution development adaptado a sus restricciones reales genera un impacto mucho mayor para su equipo.

El uso pleno de potentes supercomputadores de escritorio requiere un software local adecuado que funcione sin recurrir a servicios en la nube de terceros. Anteriormente, analizamos en detalle la arquitectura de Rust LocalGPT, que permite desplegar un asistente de IA de alto rendimiento de forma independiente en su propio equipo.

Compartir este articulo