Uber dämpft den Hype um LLM-Ausgaben

Der COO von Uber hat öffentlich eine einfache Wahrheit ausgesprochen: Steigende Token-Ausgaben für große Sprachmodelle lassen sich ohne direkte Erträge kaum noch rechtfertigen. Dies ist ein entscheidendes Signal für die KI-Implementierung. Die Ära grenzenloser Experimente endet; Unternehmen bewerten nun greifbare und messbare Ergebnisse statt bloßer Neuheiten.

Technischer Kontext

Was mir hier auffiel, war nicht die Schlagzeile selbst, sondern die Formulierung. Andrew Macdonald, COO von Uber, sagte im Grunde: Wir verbrauchen mehr Token, aber ein klarer Anstieg des Produktnutzens ist nicht zu erkennen. Für mich ist dies ein sehr vertrautes Bild aus realen KI-Automatisierungsprojekten, in denen das Team die Modellaufrufe problemlos hochschraubt, die Verbindung zu den Geschäftskennzahlen jedoch schnell verschwimmt.

Die Hauptquelle hier ist ein von Business Insider zusammengefasstes Interview. Dort tauchte eine aufschlussreiche Episode auf: Intern wurde bei Uber diskutiert, dass das Claude Code-Budget für 2026 bereits ausgeschöpft sei. Dies war der genaue Moment, in dem die Leute aufhörten, LLMs als nahezu kostenlose Magie zu betrachten. Und das zu Recht, denn für einen einzelnen Mitarbeiter kostet ein Prompt Cents, aber für das gesamte Unternehmen wird es zu einer Architekturentscheidung mit einer sehr greifbaren Rechnung.

Was mich hier besonders trifft, ist nicht der Betrag an sich, sondern das Fehlen einer direkten Linie zwischen Aufwand und Ertrag. Wenn ich nicht nachweisen kann, dass mehr Token zu spürbar schnelleren Releases, einer besseren Supportqualität oder mehr automatisierten Abläufen geführt haben, dann habe ich keine KI-Integration – sondern eine teure Angewohnheit.

Und ja, die Nachricht ist frisch, Mai 2026, also ist dies keine Retrospektive. Es ist der neue Ton des Marktes: erst der Token-Zähler, dann die schönen Demos.

Auswirkungen auf Geschäft und Automatisierung

Ich sehe hier drei praktische Erkenntnisse. Erstens: Unternehmen werden nicht die KI selbst kürzen, sondern den unsystematischen Verbrauch von Modellen ohne Routing, Caching, Limits und die Bewertung, wo ein teures LLM wirklich benötigt wird und wo eine einfachere Kombination ausreicht.

Zweitens: Die Gewinner werden die Teams sein, die die Unit Economics auf Szenarioebene berechnen. Nicht "wir haben KI implementiert", sondern "dieser Agent hat die Ticketlösungszeit um 42 % verkürzt und amortisiert sich in einem Quartal". Genau so sieht die Entwicklung einer richtigen KI-Lösung aus, anstatt einfach nur den Zugriff auf ein weiteres Modell zu kaufen.

Die Verlierer werden diejenigen sein, die interne Prozesse auf einem unkontrollierten Copiloten aufgebaut haben, ohne an die KI-Architektur zu denken. Ich sehe das regelmäßig: Sobald echte Limits gesetzt werden, erweist sich die Hälfte der Ketten plötzlich als überflüssig.

Wenn Sie eine ähnliche Situation haben und die Modellkosten bereits mit Einstellungen konkurrieren, lassen Sie uns dies professionell analysieren. Im Nahornyi AI Lab beginnen wir normalerweise nicht mit einem neuen Modell, sondern mit einer Prozesskarte. Danach können wir die KI-Automatisierung so aufbauen, dass das Unternehmen für Ergebnisse zahlt und nicht für die spektakuläre Verbrennung von Token.

Zuvor haben wir technische Wege untersucht, den Token-Verbrauch drastisch zu reduzieren, z. B. durch die Übergabe von leichtem Markdown an KI-Agenten anstelle von schwerem HTML. Solche architektonischen Optimierungen werden gerade jetzt lebenswichtig, da Großunternehmen zunehmend an der Rentabilität generativer Modelle zweifeln.

Diesen Artikel teilen

Twitter/X LinkedIn Telegram

Uber dämpft den Hype um LLM-Ausgaben

Technischer Kontext

Auswirkungen auf Geschäft und Automatisierung

Weitere News

Gemma 4 wird deutlich praktischer auf Edge

364M Parameter und eine neue Chance für On-Device-KI