Contexte technique
J'ai examiné ce qui se dit actuellement autour de Claude Fable 5, et ce qui compte, ce n'est pas le battage médiatique mais la prévisibilité. Si je construis une automatisation IA pour une équipe de développement, j'ai besoin de savoir quand le modèle gère une tâche lui-même et quand il transfère soudainement la requête à Opus.
D'après les données disponibles, Fable 5 dispose bien de guardrails intégrés et d'un mécanisme de repli. Mais le but officiel de ce routage est différent : il ne s'agit pas « d'analyser un vrai site web », mais de vérifier les requêtes à risque, principalement autour de la cybersécurité, de la biologie et des scénarios de distillation.
Et c'est là que ça devient agaçant. En utilisation réelle, les gens constatent que le simple fait de mentionner un site web réel ou de donner une tâche avec un contexte externe rend le comportement instable : le modèle peut devenir plus prudent, plus lent, voire carrément renvoyer la requête vers Opus.
Je n'aime pas ces choses pour une raison simple : l'architecture perd en transparence. Lorsque j'ai un agent dans mon pipeline qui doit analyser de manière fiable des interfaces, de la documentation ou une base de code, tout changement de modèle caché rompt les attentes en matière de qualité, de latence et de coût.
Les prix ne sont pas roses non plus. Dans le contexte de Fable 5, on parle d'un tarif d'environ 10 $ par million de tokens d'entrée et 50 $ par million de tokens de sortie, ce qui signifie que ce n'est pas un jouet pour des exécutions incontrôlées. Et si certaines tâches sont également routées vers Opus pour une évaluation supplémentaire, on ne peut plus estimer l'économie unitaire à vue de nez : il faut la calculer correctement.
Quant à GPT-5.6, je ne ferais aucun plan à ce sujet. Pour l'instant, il n'y a aucune confirmation solide qu'une sortie soit imminente, donc je ne baserais pas de décisions architecturales sur des allusions vues sur Twitter.
Impact sur les entreprises et l'automatisation
Les équipes qui privilégient la sécurité par défaut en sortent gagnantes. Celles qui attendent d'un assistant de codage une prévisibilité à toute épreuve sur des tâches réelles, notamment en frontend et dans les scénarios agentifs, y perdent.
En pratique, je vois trois conséquences. Premièrement, il faut concevoir l'intégration IA comme si le repli pouvait survenir à tout moment. Deuxièmement, on ne peut pas promettre à l'équipe une vitesse et un prix fixes sans tests réels. Troisièmement, le frontend et les produits destinés aux clients reposent toujours non seulement sur le code, mais aussi sur le goût, l'AQ et le jugement humain.
Chez Nahornyi AI Lab, nous sommes justement spécialisés dans l'identification de ces goulets d'étranglement : là où les modèles font réellement gagner des heures et là où ils créent une illusion d'automatisation. Si vous envisagez un développement de solutions IA pour le développement, le support ou les agents internes, nous pouvons décomposer votre processus étape par étape et construire un système sans surprises, plutôt que de miser sur une énième version tape-à-l'œil.