Contexte technique
Je ne mettrais pas cela sur le compte d’un « modèle soudainement devenu plus bête ». Le tableau est plus terre-à-terre : dans Claude Code, il y avait déjà des régressions de qualité officiellement reconnues dues aux paramètres du produit, et non aux poids du modèle. Anthropic a explicitement écrit au printemps 2026 que le problème venait d’un changement de reasoning-effort, d’un bug de perte de l’ancien thinking après idle et d’un mauvais prompt système.
Venons-en à Ultracode. Je constate le même piège dans lequel beaucoup tombent : il a été présenté comme étant simplement le « niveau de réflexion le plus puissant », alors qu’en réalité il se rapproche d’un mode d’orchestration. Autrement dit, il n’y a pas seulement du raisonnement, mais un workflow dynamique avec des sous-agents, et pour l’intégration de l’IA dans les processus métier, c’est une classe de comportement totalement différente.
C’est ce qui crée cet effet étrange : sur une tâche ordinaire, le mode se met à se compliquer la vie. Au lieu de suivre les instructions de façon linéaire, il construit un arbre de vérifications, de ramification et de délégation. Résultat : ce n’est pas « plus intelligent », c’est « plus bruyant » : le contexte s’étale, les étapes se perdent et la séquence dérive.
Le symptôme le plus révélateur ne se trouve pas dans la réponse, mais dans la télémétrie de session. Si le mode lance 20, 30, 50+ sous-agents pour une petite revue de code, ce n’est plus de la magie, c’est de la surenchère architecturale. Et oui, dans ce scénario, la limite quotidienne s’envole littéralement sous vos yeux.
C’est pourquoi le conseil de la communauté est judicieux : il ne faut pas comparer « Opus 4.8 est mauvais », mais Max face à Ultracode sur la même tâche. Il est fort possible que pour la plupart des scénarios du quotidien, Max apporte une intégration IA plus stable car il ne traîne pas une orchestration superflue.
Qu’est-ce que cela change pour les entreprises et l’automatisation
Si je construis de l’automatisation IA pour la production, je ne mets pas ce mode par défaut. Il est bon là où une véritable décomposition parallèle est nécessaire : un grand audit de code, une migration multi-fichiers, une vérification complexe.
Qui est gagnant ? Les équipes avec des tâches rares et lourdes, où le coût d’une erreur est supérieur au coût des tokens. Qui est perdant ? Tous ceux qui font passer des revues ordinaires, des corrections et des chaînes routinières par ce mode.
Côté finances, c’est simple : les sous-agents en trop frappent vos limites, et les instructions manquées frappent le temps de vos ingénieurs. Je traite généralement ces problèmes non pas avec une « foi dans un nouveau mode », mais avec une architecture IA solide : choisir le mode en fonction de la classe de tâche, limiter l’orchestration et instaurer des règles d’arrêt explicites pour l’agent.
Si votre Claude Code a déjà commencé à brûler des limites tout en perdant des étapes, je jetterais un œil au workflow lui-même, pas seulement au modèle. Chez Nahornyi AI Lab, c’est précisément ce type de goulots d’étranglement que nous décortiquons : où un seul agent fort suffit, où l’on a besoin d’automatisation avec IA, et où il vaut mieux ne pas toucher à Ultracode du tout, pour que l’entreprise ne paie pas pour le chaos.