Skip to main content
multi-agentClaude CodeAI automation

Claude, Codex und Gemini in der Rolle von Orchestrierern

Moderne Multi-Agenten-Setups nutzen oft Claude, Codex und Gemini als CLI-Orchestrierer, mit Telegram als Schnittstelle. Dies ist für Unternehmen wichtig, da solche KI-Automatisierungen schnell nicht an Ideen, sondern an Aufgabenwarteschlangen, Kaltstarts und Hardwarebeschränkungen scheitern, was eine robuste Architektur erfordert.

Technischer Kontext

Ich liebe solche Nachrichten nicht wegen des Hypes, sondern wegen ihrer Bodenständigkeit. Hier werden endlich nicht abstrakte Agenten diskutiert, sondern ein reales Setup, in dem Claude, Codex und Gemini als übergeordnete CLI-Orchestrierer agieren und Telegram als einfacher Eingangspunkt für Aufgaben dient.

Im Grunde ist das Schema einfach: Ich sende eine Aufgabe an einen Bot, der Orchestrierer zerlegt sie in Teilaufgaben, startet die notwendigen CLI-Sitzungen und sammelt das Ergebnis. Für die KI-Automatisierung ist das kein Spielzeug mehr, sondern eine funktionierende Architektur, solange man nicht versucht, alles ohne Einschränkungen laufen zu lassen.

Ich habe mir die verfügbaren Muster angesehen, und das Bild ist ziemlich klar. Claude wird oft als Koordinator eingesetzt, Codex als starker Code-Executor und Gemini als spezialisierter Worker für eine eng definierte Rolle. In VS Code und Copilot werden solche Szenarien bereits offiziell hervorgehoben, während die Community dies schon lange mit Shell-Skripten, Markdown-Anweisungen und dateibasiertem Zustand umsetzt.

Der praktischste Punkt hier ist nicht die Wahl der Marke, sondern das Ausführungsmodell. Ein Kaltstart (Cold Start) sorgt für einen sauberen Kontext und weniger Überraschungen, verbraucht aber bei jedem Start Zeit. Ein Warmstart (Hot Start) ist schneller, besonders wenn Aufgaben in Serie von Telegram kommen, aber dann beginnt der Kontext-Drift, und der Agent erinnert sich an überflüssige Informationen.

Über das Limit von 10 Agenten auf einem Mac musste ich schmunzeln. Ja, das klingt wie ein normales Ingenieursexperiment, bis der Laptop anfängt zu summen wie eine Drohne. In der Praxis treten um diesen Schwellenwert herum CPU-Spitzen, Speicherdruck, IDE-Verlangsamungen und eine ärgerliche Verzögerung beim Starten neuer CLI-Prozesse auf.

Was bedeutet das für Unternehmen und Automatisierung?

Realistisch betrachtet gewinnen Teams, die nicht nur einen „intelligenten Chat“, sondern eine Pipeline benötigen: Dekomposition, parallele Implementierung, Überprüfung und Zusammenstellung der Antwort. Hier spart die Integration von künstlicher Intelligenz in Telegram oder einen internen Chat wirklich Zeit, da Mitarbeiter Aufgaben in einer vertrauten Oberfläche schreiben, anstatt zwischen fünf Werkzeugen zu wechseln.

Die Verlierer sind diejenigen, die versuchen, diesen ganzen Zoo lokal auf einem Mac zu betreiben und es als produktiv zu bezeichnen. Ich würde einen warmen Orchestrierer lokal behalten und die schweren Worker auf eine Linux-Box oder in die Cloud auslagern. Andernfalls frisst der Preis des Chaos schnell alle Gewinne auf.

Bei Nahornyi AI Lab lösen wir genau solche Probleme auf Architekturebene: Wo man Hot Sessions behält, was man kalt startet, wie man die Parallelität begrenzt und wohin man die Ausführenden verlagert. Wenn Ihre Prozesse bereits an der manuellen Koordination scheitern, können mein Team und ich eine KI-Lösungsentwicklung für Ihren realen Aufgabenfluss erstellen, ohne den Zirkus von zehn überhitzten Agenten auf einem Laptop.

Ein verwandter Teil dieser Diskussion ist, wie man die Leistung mehrerer konzertiert arbeitender Agenten effektiv nutzt. Wir haben bereits behandelt, wie parallele Claude-Code-Agenten Race Conditions in PRs erkennen können, was eine praktische Anwendung für den koordinierten Einsatz und die Verwaltung von KI-Agenten demonstriert.

Diesen Artikel teilen