Contexte technique
J'ai examiné attentivement le document d'Anthropic sur l'auto-amélioration récursive (recursive self-improvement), et ma conclusion est simple : ce n'est pas encore l'AGI, mais ce n'est plus un simple jouet de démonstration. Ce qui m'a frappé, c'est autre chose : des étapes du cycle de R&D en IA qui reposaient auparavant uniquement sur l'humain commencent à être gérées par les modèles eux-mêmes. Et cela est déjà très proche de ce que je constate dans les projets réels d'automatisation de l'IA.
Le point principal d'Anthropic n'est pas que le modèle s'est soudainement « mis à se construire lui-même ». Ils précisent honnêtement : la difficulté actuelle ne réside pas tant dans l'exécution que dans le jugement (judgment), c'est-à-dire dans le choix de la direction, de l'objectif et des priorités de recherche. C'est une nuance importante, car sans elle, on tombe vite dans le piège du clickbait affirmant que « l'AGI est déjà là ».
Les chiffres révèlent une situation intéressante. Claude, selon leurs données, a atteint un taux de réussite de 76 % sur les tâches les plus ouvertes (open-ended) en mai 2026, et l'accélération dans l'optimisation des flux de travail expérimentaux est passée d'environ 3x à 52x en moins d'un an. Autre indicateur marquant : pour déterminer la direction des recherches futures, le modèle a orienté les travaux dans une voie productive dans 64 % des cas, contre 51 % pour les choix humains.
Cela m'a rappelé une ancienne expérience de la communauté avec micromorph : un agent auto-améliorant (self-improving agent) écrit en quelques centaines de lignes de Python, capable d'étendre lui-même ses fonctionnalités. Rien de magique, juste un cycle classique : planification, modification du code, exécution, vérification et répétition. Une fois doté des accès et d'un objectif, l'agent a configuré en quelques minutes sa propre communication via Telegram. Il ne s'agit pas de conscience récursive, mais d'un modèle d'ingénierie, et c'est précisément à partir de tels modèles que se construit l'implémentation pratique de l'IA.
Où imposerais-je immédiatement des limites ? Sur les rollbacks, les health-checks et les restrictions d'outils. Sans cela, tout agent « auto-améliorant » risque de se transformer rapidement en un programme qui s'autodétruit proprement.
Ce que cela change pour les entreprises et l'automatisation
Pour les entreprises, les grands gagnants seront ceux qui font face à de nombreuses tâches d'ingénierie répétitives : intégrations, bots internes, pipelines de test, petits ajustements autour des API. Dans ces domaines, le développement de solutions d'IA peut déjà être structuré comme un cycle avec auto-vérification, et non comme une simple requête ponctuelle dans un chat.
Les équipes qui confondent autonomie et absence de contrôle seront perdantes. Si vous laissez un agent écrire du code, modifier la production sans lui fixer de limites, il ne deviendra pas plus intelligent grâce à sa liberté ; il sera simplement plus coûteux à maintenir.
Aujourd'hui, je ne verrais pas cela como la naissance imminente de l'AGI, mais plutôt comme une nouvelle couche d'architecture IA : l'agent est capable non seulement d'exécuter une tâche, mais aussi de concevoir ses propres outils pour y parvenir. Chez Nahornyi AI Lab, nous concevons précisément ce type de solutions pour nos clients : là où il ne s'agit pas d'intégrer un chatbot pour faire joli, mais d'installer une véritable automatisation par l'IA avec des tests, des droits d'accès et un impact économique mesurable. Si vos processus accumulent les tâches techniques manuelles, nous pouvons les analyser ensemble pour concevoir un agent IA utile, pragmatique et performant.