Skip to main content
OpenAIматематикаAI automation

OpenAI a réfuté Erdős, mais ce n'est pas si simple

OpenAI a annoncé que son modèle de raisonnement a trouvé la première réfutation vérifiée de la conjecture des distances unitaires d'Erdős. C'est un jalon pour l'AI implementation, montrant que l'IA peut générer de nouvelles idées. Cependant, le manque de données sur le modèle et le calcul rend la reproductibilité floue.

Contexte technique

J'ai examiné les documents d'OpenAI et la vérification indépendante, et le tableau est plus intéressant qu'un simple communiqué de presse triomphant. Le fait est le suivant : un modèle de raisonnement interne d'OpenAI a trouvé un contre-exemple à la conjecture des distances unitaires d'Erdős, et des mathématiciens ont ensuite confirmé indépendamment la validité du résultat.

Pour moi, ce n'est plus un jouet ni un simple benchmark. C'est un cas où l'implémentation de l'intelligence artificielle ne se limite pas à un chatbot ou à la génération de code, mais à la production réelle d'une nouvelle idée qui peut ensuite être formalisée et vérifiée manuellement.

Le PDF d'OpenAI contient l'essentiel, mais il manque le plus douloureux : ils ne nomment pas le modèle exact, ne fournissent pas de détails sur la puissance de calcul utilisée et n'expliquent pas la reproductibilité du processus. Officiellement, il s'agit d'un « modèle de raisonnement interne à usage général ». Du point de vue de l'ingénierie, c'est insuffisant pour déterminer s'il s'agit d'une capacité stable du système ou d'un coup de chance ponctuel.

Cela dit, je ne suis pas dupe de l'argument « c'est du marketing, donc c'est du vent ». Le travail indépendant sur arXiv confirme que ce n'était pas une simple astuce de présentation. Le contre-exemple est réel, le théorème est réel, et le problème a déjà été marqué comme réfuté dans la base de données d'Erdős.

Mais mon scepticisme reste de mise. Si la formulation initiale du problème a été fortement préparée, si la recherche a impliqué une recherche exhaustive massive, si un humain a guidé soigneusement le modèle sur un chemin étroit, alors la valeur scientifique pour la théorie des LLM change considérablement. Le résultat mathématique demeure, mais les conclusions sur les capacités du modèle deviennent beaucoup moins spectaculaires.

Ce que cela change pour les entreprises et l'automatisation

Je n'en conclurais pas que « l'IA remplace déjà les chercheurs ». Je vois plutôt autre chose : les systèmes de raisonnement deviennent de plus en plus performants pour les tâches qui exigent d'itérer sur des hypothèses, d'écarter les impasses et d'assembler des constructions non triviales.

Cela a un impact direct sur l'automatisation par l'IA pour la R&D, la recherche de brevets, l'analytique, la conception et les flux de connaissances internes complexes. Non pas dans le sens d'une autonomie totale, mais dans celui d'une accélération drastique du cycle « idée → vérification → affinement ».

Les gagnants seront les équipes qui savent construire une architecture d'IA solide autour de la vérification, du traçage des étapes et de l'intervention humaine (human-in-the-loop). Les perdants seront ceux qui, après un tel cas, se contenteront d'ajouter un modèle sans contrôle en l'appelant « agent de recherche ».

C'est précisément ce type de goulots d'étranglement que j'analyse avec mes clients au Nahornyi AI Lab : où l'intégration de l'IA permet réellement d'économiser des heures de travail manuel, et où elle devient une illusion coûteuse sans vérification. Si vous avez un processus où les gens sont noyés sous les hypothèses, les vérifications et la recherche de solutions, nous pouvons l'analyser sereinement ensemble et élaborer une solution de développement IA sans magie ni battage marketing.

Bien que cet article souligne l'exploit remarquable d'OpenAI dans la résolution d'une hypothèse mathématique de longue date, il est essentiel de considérer les capacités cognitives sous-jacentes qui rendent de telles percées possibles. Nous avons précédemment exploré la 'pensée étendue' et l'intelligence de modèles comme Claude Opus 4.6, en analysant comment ces systèmes d'IA avancés traitent des problèmes complexes.

Partager cet article