Was genau kaputt war
Ich habe die Daten extra nochmal überprüft, weil solche Geschichten in Chats immer «gerade passieren». Der große Ausfall war am 2. Juni 2026, nicht am 24. Anthropic räumte einen Teilausfall ein, und Nutzer sahen massenhaft Fehler wie 529 Overloaded.
Spannender ist der Ingenieur-Fall. Branchenanalysen zufolge lag es an einem Bug in den Subagenten von Claude Code: Eine Schleife hörte nicht auf, Tokens schossen in die Höhe, Quotas waren binnen Minuten aufgebraucht. Genau hier sage ich Kunden immer, dass eine KI-Implementierung ohne Ausfallplan keine Automatisierung ist, sondern ein schicker Single Point of Failure.
Laut offizieller Zeitleiste von Anthropic begann die Untersuchung um 06:04 UTC, um 06:39 war das Problem identifiziert, später wurde ein Fix ausgerollt. Öffentlich sah es nach einem langwierigen Ausfall von Claude.ai, der API und verbundener Tools aus. Für Entwickler war der Schmerz doppelt: Service down, und bei einigen waren die Limits bereits verbraucht.
Eine wichtige Anmerkung: Ich sehe keine Belege dafür, dass der Markt «massenhaft zu Codex floh». Die tatsächliche Reaktion war erwachsener: Fallbacks, Wiederholungen mit exponentiellem Backoff, Routing auf einen anderen LLM – nicht der Kult um ein einziges Lieblingstool.
Was sich dadurch in Workflows ändert
Erstens: Ein Single-Vendor-Ansatz erscheint jetzt viel zu teuer. Wenn Code-Generierung, Support oder interne Suche an einer API hängen, wird aus einem Ausfall sofort eine Aufgabenwarteschlange und Handbetrieb.
Zweitens: Multi-LLM ist keine Paranoia mehr. In jede KI-Architektur würde ich mindestens drei Dinge einbauen: Health Checks, automatisches Szenario-Umschalten und einen sanften Degradierungsmodus, damit der Agent nicht den gesamten Prozess blockiert.
Drittens: Man muss nicht nur den Token-Preis, sondern auch die Kosten der Ausfallzeit rechnen. Manchmal werden KI-Lösungen für Unternehmen nicht wegen des Modells teurer, sondern weil niemand vorher eine Ausweichroute bedacht hat.
Bei Nahornyi AI Lab packen wir genau solche Engpässe praktisch an: Wo ein zweiter Anbieter nötig ist, wo Queue und Retries reichen und wo man die Logik besser ganz neu aufbaut. Wenn Ihre KI-Automatisierung bereits kritische Prozesse steuert, lassen Sie uns gemeinsam die Architektur anschauen und ein System bauen, das nicht wegen eines fremden Bugs ausfällt.