Technischer Kontext
Ich mag solche Dinge mehr als große Ankündigungen. Das ist keine weitere „Revolution“, sondern ein sehr bodenständiger PoC: Man wirft Referenzen in einen Ordner, am besten zusammen mit technischen Zeichnungen, gibt das Objekt vor und bekommt ein Bild und dann ein 3D-Modell für die Bereinigung oder den Druck.
Im Grunde ist das bereits eine ordentliche KI-Automatisierungskette, kein magischer Einzelprompt. Der Autor hat eine Kombination aus Claude + Gemini/OpenAI + Tencent zusammengestellt, und Midjourney soll später hinzugefügt werden. Und genau das gefällt mir: Jedes Werkzeug deckt seinen Teil ab, ohne zu versuchen, alles auf einmal von einem Modell erledigen zu lassen.
Schicht für Schicht betrachtet, dient Claude logischerweise als Orchestrator: die Aufgabe zerlegen, Charaktermerkmale extrahieren, den Stil halten und einen soliden Prompt vorbereiten. Gemini oder OpenAI treten in dieser Pipeline als Stufe der Generierung oder Nachbearbeitung des 2D-Bildes auf. Und Tencent übernimmt, dem Kontext nach, den schwersten Teil: die Umwandlung eines Bildes in ein 3D-Gitter.
Besonders beeindruckt hat mich die Zahl von 1,5 $ pro Modell. Das ist nach den Maßstäben nackter APIs kein Rekordtiefpreis, denn ähnliche Pipelines lassen sich noch weiter komprimieren, besonders wenn man einen Teil der KI-Integration in Open Source verlagert. Aber für einen funktionierenden PoC ist das ein angemessener Einstiegspreis: günstiger als manuelles Blockieren zu Beginn und billig genug, um schnell Hypothesen durchzuspielen.
Ein weiterer starker Punkt: das Versprechen, alles als Open Source zu veröffentlichen. Für solche Systeme ist das wichtiger als eine glänzende Demo, denn der echte Wert entsteht, wenn man die Orchestrierung der Schritte, Warteschlangen, Wiederholungen, Bildvorverarbeitung untersuchen und genau verstehen kann, wo die Pipeline bricht.
Was das für Unternehmen und Automatisierung verändert
Die erste Erkenntnis ist einfach: Kundenspezifische 3D-Assets rücken näher an einen kontinuierlichen Prozess statt an manuelle Einzelstücke. Für Brettspiele, Produktprototypen, Spielrequisiten und Miniatur-Marktplätze sieht das bereits nach einem funktionierenden KI-Implementierungsschema aus.
Der zweite Punkt ist weniger offensichtlich. Es gewinnen diejenigen, die eine Pipeline mit Qualitätskontrolle aufbauen können, nicht einfach drei APIs hintereinander aufrufen. Es verlieren diejenigen, die ein perfektes Gitter ohne manuelle Bereinigung erwarten: Die Nachbearbeitung ist noch nicht verschwunden.
Bei Kunden sehe ich dasselbe Muster: Das Problem ist nicht die Generierung, sondern die Übergänge zwischen den Schritten, die Fehlerkosten und die Wiederholbarkeit der Ergebnisse. Bei Nahornyi AI Lab bauen wir solche KI-Lösungen für Unternehmen genau so, dass sie nicht wie eine coole Demo am Freitag und ein kaputter Prozess am Montag aussehen.
Wenn Sie einen Katalog, ein Studio, eine Produktion oder ein Content-Team haben, in dem immer noch manuell gleichförmige visuelle Aufgaben abgearbeitet werden, lassen Sie uns gemeinsam auf den Prozess schauen. Manchmal reicht ein einziges sorgfältiges KI-Architekturdiagramm, um eine KI-Automatisierung für Ihren Anwendungsfall zu erstellen und Ihrem Team Stunden langweiliger Routine zu ersparen.