Contexto técnico
He analizado en detalle lo que NVIDIA ha presentado realmente, y no se trata solo de otro 'GPU aún más rápido'. Están impulsando todo un ecosistema de fábrica de IA: Rubin GPU, Vera CPU, NVLink 6, ConnectX-9, BlueField-4 y la conectividad de red optimizada para cargas masivas de inferencia. Para quienes implementan soluciones de IA en producción, esto es mucho más relevante que unas diapositivas atractivas.
Lo más práctico aquí, en mi opinión, es el DGX Vera Rubin NVL72. Integra 72 GPUs Rubin y 36 CPUs Vera en un solo bastidor, prometiendo reducir los cuellos de botella en la transferencia de datos y ofrecer un mejor coste por token en comparación con Blackwell. Por ahora, tomaría estas promesas del fabricante con cautela, pero la dirección es sumamente clara.
Me ha llamado especialmente la atención la CPU Vera. NVIDIA no la diseñó simplemente por cumplir, sino que la proyectó claramente para la transferencia de datos, tareas de razonamiento y la conexión directa con los aceleradores. Cuando una sola compañía controla la GPU, la CPU, la red y el DPU, el resultado ya no es un simple servidor, sino una arquitectura de IA integrada.
Otra señal fuerte es que siguen promoviendo la idea del centro de datos como un objeto simulable. Ejecutar todo a través de un gemelo digital en Omniverse antes de la construcción física ya no suena a marketing, sino a una práctica de ingeniería sensata. Si esto ya se está aplicando con clientes reales, significa que el diseño de infraestructuras de IA se está acercando más al flujo de desarrollo de software que al clásico 'construir y rezar'.
La situación de la robótica es similar. Aunque hay menos detalles públicos de los que nos gustaría, NVIDIA vuelve a entrelazar el hardware, la simulación y la inferencia local en un solo ciclo de trabajo. Y esta es la base real para la IA física, más allá de las demostraciones de feria.
Qué cambia esto para los negocios y la automatización
Identifico tres consecuencias principales. Primero, la automatización de la IA a gran escala dependerá cada vez menos de 'qué modelo elegir' y mucho más del coste por token, la topología de red y la memoria. Un error de arquitectura será mucho más costoso que un error en el prompt.
Segundo, los ganadores serán quienes desarrollen flujos de trabajo extensos, sistemas basados en agentes y procesos robóticos. Perderán quienes adquieran hardware sin un escenario de uso claro ni proyecciones de carga de trabajo.
Tercero, el uso de gemelos digitales para la infraestructura se convertirá en un estándar. No me sorprendería si, en un par de ciclos, nadie construya capacidades de IA serias sin antes realizar simulaciones.
En estos puntos de inflexión es donde no se necesita un 'asesoramiento de IA' genérico, sino un desarrollo real de soluciones de IA (AI solution development): definir qué automatizar, dónde alojar la inferencia, cuándo optar por infraestructura propia (on-premise) y cuándo no. Si su empresa ya se está topando con límites debido al coste de los procesos de IA o el caos en la implementación, analicémoslo con pragmatismo. En Nahornyi AI Lab creamos automatización de IA adaptada a procesos reales para asegurar su rentabilidad, y no solo para que luzca bien en una presentación estratégica.