Technischer Kontext
Ich habe mich nicht aus bloßer Neugier mit der Ankündigung von Span xFRA beschäftigt, sondern weil solche Modelle direkt die Themen AI automation und Infrastrukturkosten betreffen. Kurz gesagt: Span möchte Rechenknoten direkt in Wohnhäusern installieren, die ungenutzte Haushaltsstromkapazität nutzen und dem Besitzer rund 150 US-Dollar pro Monat für Strom und Internet zahlen.
Hardwareseitig handelt es sich keineswegs um ein Spielzeug. In einem einzigen Node sollen 16 NVIDIA RTX PRO 6000 Blackwell Server Edition GPUs, 4 AMD EPYC Prozessoren, 3 TB RAM und ein 24-Port-Gigabit-Switch verbaut sein. Die RTX PRO 6000 Blackwell selbst hat es in sich: 96 GB GDDR7 mit ECC, 24.064 CUDA-Kerne, 752 Tensor Cores, PCIe 5.0 und eine Leistungsaufnahme von bis zu 600 W pro Karte.
Und genau an dieser Stelle musste ich stutzen. Wenn man 16 solcher GPUs nimmt, erhält man einen extrem dichten Knoten in Bezug auf Wärme, Strom und Wartung. Auf dem Papier klingt das fantastisch, aber das Eigenheim verwandelt sich augenblicklich in einen Mini-Serverraum mit all den unschönen Problemen: Lärm, Kühlung, Uptime, Ferndiagnose, Hardwareaustausch und Netzwerküberraschungen auf der letzten Meile.
Span gibt an, dass derzeit eine aktive Hausinstallation existiert, ein Pilotprojekt mit 100 Nodes für das 3. Quartal 2026 geplant ist und das langfristige Ziel bei sage und schreibe 80.000 Nodes bis 2027 liegt. Das ist eine enorme Ambition. Stand Mitte 2026 handelt es sich jedoch um ein Konzept in der frühen Testphase und keineswegs um eine bewährte Alternative zu klassischen Rechenzentren.
Ein weiterer wichtiger Aspekt: Es gibt bisher keine unabhängige öffentliche Validierung bezüglich Latenz, tatsächlicher Leistung bei KI-Workloads oder den Kosten pro Node. Es wird zwar mit dem Argument geworben, es sei '5-mal günstiger', aber ohne eine transparente Wirtschaftlichkeitsrechnung zu CAPEX, Service und Ausfallraten würde ich solche Zahlen nicht in die Architektur eines Kunden einplanen.
Auswirkungen auf Business und Automatisierung
Wer profitiert potenziell davon? Alle, die Batch-Inference, Rendering, Datenaufbereitung oder Latenz-tolerante Pipelines betreiben und unter ständigem GPU-Mangel leiden. Für solche Aufgaben könnte eine dezentrale AI integration günstiger sein, als auf einen freien Platz in einer überlasteten Cloud zu warten.
Für wen wird es schwierig? Für alle, die stabile SLAs, vorhersagbare Latenzen und strenge Sicherheitsvorkehrungen benötigen. Ich würde kein kritisches Produktivsystem ohne eine solide Orchestrierungsschicht, Replikation und ein ordentliches Failover auf einem solchen Netzwerk betreiben, da eine schöne Idee sonst schnell an der Realität scheitert.
Ehrlich gesagt gefällt mir der Grundgedanke. In Zeiten von Energieengpässen, Ausfällen und dem Mangel an großen Rechenzentrumskapazitäten kann eine dezentrale Architektur tatsächlich Ausfallsicherheit bieten – vorausgesetzt, man kann sie skalieren, ohne im operativen Chaos zu versinken.
Wenn Sie gerade prüfen, ob sich mit diesem Ansatz Ihre GPU-Kosten, Inference-Prozesse oder die interne AI automation optimieren lassen, lassen Sie uns gemeinsam Ihre Architektur analysieren. Bei Nahornyi AI Lab trenne ich schnell tragfähige Konzepte von schönen Präsentationen und helfe Ihnen, ein AI solution development aufzubauen, das nicht nur der Demo, sondern auch der realen Last standhält.