Contexte technique
J'adore ce genre de cas : au départ, on a un chaos de PDF et de scans, mais on parvient quand même à mettre en place une intégration IA fonctionnelle. La question était simple : comment interpréter des schémas électriques du secteur de la construction quand chacun utilise sa propre notation, alors que l'objectif est précisément la détection d'éléments ?
Ici, je ne commencerais pas par la magie. Je commencerais par un dictionnaire de symboles de référence, et à ce titre, la norme IEC 60617 fonctionne très bien. C'est une base de données internationale de symboles graphiques pour les schémas électriques, en somme, un point d'ancrage visuel fiable pour le modèle.
C'est là que ça devient intéressant. Si vous disposez de Claude Sonnet ou d'un autre modèle multimodal puissant, vous pouvez lui fournir non seulement le schéma lui-même, mais aussi des exemples de symboles, des règles de nommage et des variantes proches issues de la bibliothèque QElectroTech. C'est alors que les performances en zero-shot ou few-shot deviennent nettement meilleures qu'avec un simple prompt sans contexte.
J'apprécie QElectroTech pour une raison pratique : ce n'est pas une norme abstraite sur papier, mais une bibliothèque vivante d'éléments compatibles avec l'approche IEC. Elle est pratique pour collecter des références, générer des données synthétiques pour l'entraînement, et même pour une validation simple lorsque je vérifie que le modèle ne confond pas un interrupteur avec un disjoncteur simplement à cause du style de dessin.
Si vous avez spécifiquement besoin de détection de boîtes englobantes (bbox), je ne serais pas trop optimiste avec les LLM. Sonnet est excellent en tant que couche de compréhension, de classification et de normalisation des noms, mais pour l'annotation en masse et en continu, je garderais un YOLO ou un autre détecteur à portée de main. La combinaison est judicieuse : un modèle de vision trouve les objets, et Sonnet les aligne sur la logique IEC et en extrait le sens.
Ce que cela change pour l'entreprise et l'automatisation
Premièrement, dans les secteurs de l'énergie et de la construction, on peut cesser d'attendre une norme parfaite de la part des sous-traitants. En construisant un pipeline autour de l'IEC 60617 et de QElectroTech, on obtient une véritable automatisation par l'IA pour l'analyse d'archives de schémas, l'audit de la documentation et la préparation des données pour les processus CAD/BIM.
Deuxièmement, le coût de départ diminue. Il n'est pas nécessaire d'annoter un gigantesque jeu de données à partir de zéro, car la norme et la bibliothèque de symboles fournissent déjà une base solide. Les seules équipes qui y perdent sont celles qui tentent de tout résoudre avec un simple OCR et s'étonnent ensuite que le schéma soit réduit à un tas de données inutilisables.
Troisièmement, l'architecture gagne en maturité. Je séparerais l'OCR, la détection, la classification des symboles et le post-traitement selon les règles du réseau, plutôt que de tout regrouper dans un seul prompt. Chez Nahornyi AI Lab, c'est précisément le type de solutions IA pour entreprises que nous construisons : quand il ne s'agit pas d'une simple démo sur un PDF, mais d'un système opérationnel pour un flux de documents réel. Si vos schémas ralentissent votre projet, nous pouvons analyser sereinement le processus et mettre en place une automatisation par l'IA sans tout le battage médiatique autour de l'« IA magique ».