Technischer Kontext
Ich habe lange darauf gewartet, dass jemand das Offensichtliche ausspricht: Das manuelle Prompten von Coding-Agenten wirkt zunehmend veraltet. Peter Steinberger hat genau darüber geschrieben, basierend auf seiner Erfahrung mit OpenClaw: Man muss nicht den perfekten Prompt feilen, sondern eine Schleife bauen, in der der Agent eine Aufgabe erhält, einen Schritt macht, geprüft wird und zur nächsten Iteration übergeht.
Und das sieht bereits nach einer richtigen KI-Architektur aus, nicht nach Prompt-Schamanismus. Ganz konkret fungiert sein OpenClaw als Supervisor über mehrere Codex-Agenten, wodurch der Fokus von „Was kann ich noch in den Prompt schreiben“ auf „Welche Sensoren, Prüfungen und Startregeln habe ich ins System eingebaut“ wechselt.
Ich würde die Idee so beschreiben: Dem Agenten wird nicht mehr blind vertraut. Er wird durch Kompilierung, Tests, Linter, Laufzeitfehler, Screenshots, API-Antworten und andere Signale geschleust, die ihn zurück in die Schleife führen. Der Mensch verschwindet dabei nicht, hört aber auf, jede Anweisung zu bedienen, und wird zum Architekten dieser Schleife.
Besonders interessant fand ich den Aspekt der Supervision. In der Diskussion zum Beitrag tauchte eine vom Autor erstellte Konfiguration für Paperclip auf, mit zwei Kontrollebenen: Ein bedingter CTO-Supervisor koordiniert die Entwicklung und misst die Effizienz, während Engineering-Ops anschließend Logs und Metriken analysiert und vorschlägt, wie man die Fähigkeiten der Agenten oder die Agents.md ändern sollte. Das ähnelt wirklich einem erwachsenen System und keinem Wochenendspielzeug.
Was das für Unternehmen und Automatisierung bedeutet
Erstens: Teams profitieren, die Wiederholbarkeit statt Magie brauchen. Wenn ich KI in die Entwicklung integriere, geht es mir nicht um „Wow, der Agent hat ein Feature selbst geschrieben“, sondern darum, dass das System Fehler zuverlässig abfängt, bevor sie in die Produktion gelangen.
Zweitens: Die Bedeutung des Drumherums explodiert. Das Modell selbst ist nicht mehr der Mittelpunkt des Universums; der Mittelpunkt ist die Schleife, die Prüfungen, die Aufgabenverteilung und die Supervisor-Rollen. Verlierer sind diejenigen, die Qualität immer noch an der Anzahl der Prompts in Notion messen.
Und drittens: Die parallele Arbeit mehrerer Agenten wird realistischer. Aber nur, wenn jemand die Schleife ordentlich entworfen hat, sonst erhält man keine KI-Automatisierung, sondern ein Halluzinationsorchester.
Genau solche Dinge baue ich in meiner Arbeit: nicht einfach ein Modell anzuschließen, sondern es in einen gesteuerten Prozess zu verwandeln. Wenn Ihr Entwicklungs-, Support- oder internes Ops-Team bereits an die Decke der manuellen Routine gestoßen ist, können Sie das ganz entspannt bei Nahornyi AI Lab analysieren und eine maßgeschneiderte KI-Lösungsentwicklung für Ihre reale Umgebung aufbauen – ohne Glauben an magische Prompts.