Skip to main content
распределенные вычисленияNVIDIA BlackwellAI automation

Span xFRA : un datacenter chez vous

Span a annoncé xFRA : un datacenter distribué où des nœuds d'IA sont installés chez les particuliers, rémunérés environ 150 $ par mois. Ce concept est clé pour l'AI implementation car il promet un calcul moins cher et résilient, bien qu'il ne s'agisse encore que d'un projet pilote.

Contexte technique

Je me suis penché sur l'annonce de Span xFRA non pas par curiosité, mais parce que ce genre de projet touche directement à l'AI automation et aux coûts d'infrastructure. Pour faire simple : Span veut installer des nœuds de calcul directement chez l'habitant, utiliser la capacité électrique inutilisée des foyers et payer le propriétaire environ 150 $ par mois pour l'électricité et la connexion internet.

Côté matériel, on ne parle pas d'un jouet. Chaque nœud est censé embarquer 16 cartes NVIDIA RTX PRO 6000 Blackwell Server Edition, 4 processeurs AMD EPYC, 3 To de RAM et un switch gigabit de 24 ports. La RTX PRO 6000 Blackwell elle-même est impressionnante : 96 Go de GDDR7 avec ECC, 24 064 cœurs CUDA, 752 Tensor Cores, PCIe 5.0 et une consommation pouvant atteindre 600 W par carte.

Et c'est là que j'ai tiqué. Installer 16 GPU de ce calibre crée un nœud extrêmement dense en termes de chaleur, d'alimentation électrique et de maintenance. Sur le papier, c'est magnifique, mais un domicile se transforme instantanément en mini-salle de serveurs avec son lot de désagréments : bruit, refroidissement, disponibilité, diagnostics à distance, remplacement de matériel et surprises réseau du dernier kilomètre.

Span indique qu'il existe actuellement une installation résidentielle en conditions réelles, qu'un projet pilote de 100 nœuds est prévu pour le troisième trimestre 2026, et que l'objectif ultime est d'atteindre 80 000 nœuds d'ici 2027. L'ambition est immense. Cependant, à la mi-2026, il s'agit bien d'un concept en phase de test terrain initial et non d'une alternative éprouvée aux datacenters traditionnels.

Autre point crucial : il n'existe aucune validation indépendante publique sur la latence, les performances réelles face à des charges de travail d'IA ou le coût de revient d'un nœud. On nous parle d'un calcul « 5 fois moins cher », mais sans économie claire concernant le CAPEX, la maintenance et les taux de panne, je n'intégrerais pas ces chiffres dans l'architecture d'un client.

Impact sur le business et l'automatisation

À qui cela peut-il profiter ? À ceux qui font de l'inférence par lots (batch), du rendu, de la préparation de données, ou qui ont des pipelines tolérants à la latence mais souffrent d'une pénurie constante de GPU. Pour ces tâches, l'AI integration distribuée peut s'avérer plus économique que d'attendre un créneau dans un cloud surchargé.

Qui va en souffrir ? Quiconque exige un SLA stable, une latence prévisible et une sécurité stricte. Je ne déploierais pas d'applications critiques sur un tel réseau sans une couche d'orchestration robuste, de la réplication et un failover adéquat, sous peine de voir cette belle idée se heurter brutalement à la réalité.

Pour être honnête, j'aime l'idée de départ. En période de crise énergétique, de pannes ou de pénurie d'infrastructures majeures, une architecture distribuée peut apporter une réelle résilience, à condition de savoir passer à l'échelle sans sombrer dans le chaos opérationnel.

Si vous évaluez actuellement si cette approche peut réduire vos coûts GPU, d'inférence ou votre AI automation interne, analysons ensemble votre architecture. Chez Nahornyi AI Lab, je sépare rapidement les concepts viables des simples présentations PowerPoint pour vous aider à concevoir un AI solution development capable de résister non seulement aux démos, mais aux contraintes réelles de la production.

Le désir de déployer des serveurs puissants directement chez soi reflète une tendance croissante vers une indépendance totale des calculs d'IA vis-à-vis des fournisseurs de cloud externes. Auparavant, nous avions analysé en détail comment mettre en place un assistant IA local performant sur ses propres ressources, sans envoyer de données confidentielles à des services tiers.

Partager cet article