Contexte technique
J'ai immédiatement repéré le QN10 non pas pour la marque, mais pour sa promesse d'une IA locale dans un boîtier minuscule. Pour l'automatisation de l'IA au bureau, c'est une proposition séduisante : Windows sur ARM, un NPU de 80 TOPS et un mini-PC silencieux que l'on peut installer sans avoir à gérer des configurations de serveurs complexes.
Selon les spécifications officielles d'ASUS, on y trouve un processeur Snapdragon X2 Elite, jusqu'à 32 Go de LPDDR5x, deux ports M.2, le Wi-Fi 7, sept ports USB et la prise en charge de quatre écrans 4K. Le boîtier compact de 0.7 litre se prête parfaitement à un usage d'appareil edge pour des agents locaux, de l'OCR, de la synthèse, des fonctions vocales et les fonctionnalités Copilot+.
Cependant, c'est là que le marketing a tendance à éluder les détails. ASUS ne publie pas de bande passante officielle en Go/s pour le QN10, mais les estimations de la communauté tournent autour de 152 Go/s. Même en prenant ce chiffre comme point de repère plutôt que comme une spécification validée, le constat est clair : le goulet d'étranglement n'est pas la performance du NPU, mais la mémoire.
C'est pourquoi je n'essaierais pas de comparer le QN10 en affirmant que « 80 TOPS équivalent presque à un DGX Spark ». Il s'agit d'une catégorie de matériel totalement différente. Des systèmes comme le Spark ou l'ASUS GX10 sur plateforme GB10 proposent quant à eux 128 Go de mémoire unifiée et environ 276 Go/s de bande passante, offrant ainsi une marge de manœuvre incomparable pour les grands modèles locaux.
Par conséquent, ma conclusion est simple : le QN10 est tout à fait adapté pour de l'inférence locale légère, mais ne saurait remplacer une machine dédiée aux expérimentations sérieuses sur les LLM. Si un modèle ne tient pas confortablement en mémoire ou se heurte à des limites de bande passante, aucune valeur flatteuse de TOPS ne pourra le sauver.
Ce que cela change pour les entreprises et l'automatisation
Si je conçois un projet de développement de solutions IA pour un bureau nécessitant des agents locaux, de la classification de documents, de la transcription de réunions et de l'inférence privée on-device, le QN10 s'avère tout à fait pertinent. Il est compact, économe en énergie, silencieux et dispose d'une bonne connectivité périphérique.
En revanche, si l'objectif est plutôt de faire tourner de grands modèles en local, d'exploiter du RAG avec des contextes volumineux ou de gérer plusieurs pipelines en parallèle, je m'orienterais vers une gamme supérieure. Dans ce cas, les machines dotées d'un bus mémoire plus large et d'un grand pool unifié l'emportent, même si les chiffres du NPU semblent moins impressionnants sur le papier.
Le grand perdant de cette histoire est celui qui choisit son matériel en se basant sur une seule ligne d'une diapositive publicitaire. Je constate régulièrement ce type d'erreur : des entreprises achètent un « AI PC » pour réaliser ensuite que leur implémentation réelle de l'IA est bridée par la RAM, la latence et la compatibilité logicielle. Chez Nahornyi AI Lab, nous analysons précisément ces cas d'usage avant tout investissement : nous concevons l'architecture, validons les scénarios et adaptons l'intégration de l'IA aux charges réelles, loin des promesses marketing simplifiées. Si vous hésitez sur le choix de votre équipement, nous pouvons évaluer rapidement si un boîtier compact suffit ou si vos besoins exigent une machine d'une tout autre envergure.