Copilot+ PC : pourquoi ce seuil imposé de 40 TOPS pour le NPU ?
Une version moderne d‘Ali Baba ?
Depuis l’annonce par Microsoft des Copilot+ PC, une question nous taraude : pourquoi avoir fixé la limite à 40 TOPS ? Certaines fonctionnalités demandent en effet bien moins de puissance pour tourner correctement.
Le 28 juin à 09h48
5 min
Hardware
Hardware
Comme expliqué lors de notre rapide prise en main, les machines estampillées Copilot+ PC doivent avoir au moins certaines caractéristiques matérielles : un SSD de 250 Go, 16 Go de mémoire vive et un NPU de 40 TOPS (Tera Operations per Second) minimum pour le traitement local des calculs liés à l’intelligence artificielle.
Copilot+ : un PC autour de trois piliers
Le SSD est désormais un élément quasi incontournable grâce à sa latence, sa consommation et son encombrement bien plus faibles que ceux d’un disque dur. Les SSD proposent en prime de meilleurs débits, surtout pour les versions PCIe/NVMe. Exiger un SSD s’explique donc sans problème dans une machine, qu’elle soit Copilot+ ou non d’ailleurs.
C’est un peu la même chose pour la mémoire vive. 8 Go pourraient certes suffire, y compris pour de l’intelligence artificielle (Apple le fait bien), mais 16 Go pour une machine sous Windows sont presque un minimum pour utiliser le système d’exploitation de Microsoft dans de bonnes conditions aujourd'hui.
Même sans tenir compte de la mention Copilot+, là encore on vous conseille d’éviter des portables avec 8 Go de RAM seulement.
Les avantages du NPU
Lors d’une conférence de présentation des machines la semaine dernière, Microsoft nous expliquait que l’intérêt du NPU est sa faible consommation pour effectuer rapidement des calculs d’IA. Un CPU ou un GPU saurait aussi les faire (les seconds affichent d’ailleurs de bonnes performances dans ce domaine), mais la consommation serait plus importante. La conséquence immédiate serait une autonomie réduite, alors que Microsoft cherche au contraire à la maximiser.
Reste une question : pourquoi 40 TOPS minimums pour le NPU ? Nous avons posé la question lors de la conférence, mais personne n’avait de réponse ou même un début d’explication à nous fournir, aussi bien lors des présentations que des démonstrations. Nous avons également interrogé le service presse de Microsoft et mettrons à jour cette actualité si de nouveaux éléments devaient nous parvenir.
Ça consomme combien de TOPS l’IA ?
Lors des démonstrations, on pouvait voir que le NPU était utilisé à moins de 10 % (selon le gestionnaire des tâches) lorsque deux fonctions liées à l’intelligence artificielle étaient en marche : le sous-titrage avec traduction automatique d’une vidéo en direct dans une fenêtre, ainsi que le floutage de l’arrière-plan pendant une visioconférence dans une autre. Il arrivait que le taux d'utilisation monte très brièvement jusqu’à 20/25 %.
Ces deux opérations étaient donc bien loin de surcharger le NPU du SoC Qualcomm, capable de tenir pour rappel 45 TOPS. Ainsi, nous étions aux alentours de 9 à 11 TOPS pour les deux utilisations des fonctions d’IA en simultané. Avec le seul floutage, le NPU était aux alentours de 7 % de charge, soit largement en dessous de 5 TOPS.
Un NPU avec bien moins de 40 TOPS pourrait donc tout à fait faire tourner correctement ces deux fonctionnalités d’intelligence artificielle de Copilot+. C’est le cas des Ryzen 8040 avec un NPU de 16 TOPS, mais aussi des Meteor Lake d’Intel à 11,5 TOPS.
En tout cas, utiliser le sous-titrage automatique ou le floutage devrait passer sans problème étant donné leur nombre de TOPS. Mais voilà, sans certification Copilot+, et donc sans NPU à 40 TOPS minimum, pas de fonctionnalités d’IA même si elles demandent bien moins pour fonctionner.
La génération d’image est gourmande
Sans surprise, la situation est bien différente avec la génération d’image : le NPU est alors totalement utilisé pendant plusieurs secondes de suite.
Avec un NPU quatre ou cinq fois moins puissant, on multiplierait donc d’autant la durée de génération des images, ce qui pourrait entacher l’expérience utilisateur si l’attente est trop longue. Imposer une puissance minimum peut s’entendre plus facilement et permet de tailler les logiciels de traitement des images sur mesure pour les NPU.
Trois SoC dépassent les 40 TOPS
Tout cela n’explique pas pourquoi s’être arrêté à 40 TOPS. Il peut s’agir d’un pied de nez aux 38 TOPS de la puce M4 d’Apple, de résultat d’analyses internes de Microsoft en gardant une marge de manœuvre suffisante pour toutes les situations, de discussions avec les partenaires, de prévoir de nouvelles fonctionnalités à venir…
Il y a une autre hypothèse : une puissance minimale exigée pour ne pas avoir à faire le tri des fonctions à la vente. En alignant le besoin sur celui de la fonction la plus gourmande, Microsoft s’assure de ne pas répéter un lancement à la Vista, avec un découpage des gammes et des fonctions différentes selon les machines. La société veut peut-être faire passer l’idée qu’une machine Copilot+ fournit toujours les mêmes capacités. Mais sans réponse de Microsoft, impossible de se prononcer en l’état.
Pour l’instant, trois séries de puces permettant à un ordinateur portable d'obtenir la certification Copilot+ sont les suivantes : les SoC Qualcomm X Plus et Elite (NPU de 45 TOPS), les CPU AMD Ryzen AI 300 (50 TOPS) ainsi que les processeurs Lunar Lake d’Intel (48 TOPS).
Elles se tiennent toutes les trois dans un mouchoir de poche au niveau de la puissance et l’expérience utilisateur ne devrait donc pas trop changer sur l’inférence d’IA. Les 40 TOPS minimum permettent en tout cas de disqualifier d’office les anciennes générations chez AMD et Intel, contrairement à la nouvelle plateforme de Qualcomm.
Le 28 juin à 09h48
Copilot+ PC : pourquoi ce seuil imposé de 40 TOPS pour le NPU ?
-
Copilot+ : un PC autour de trois piliers
-
Les avantages du NPU
-
Ça consomme combien de TOPS l’IA ?
-
La génération d’image est gourmande
-
Trois SoC dépassent les 40 TOPS
Commentaires (8)
Vous devez être abonné pour pouvoir commenter.
Déjà abonné ? Se connecter
Abonnez-vousLe 28/06/2024 à 10h13
#1
Dites, dans l'intro je pensais trouver un truc sur la définition des TOPS. Mais rien, alors qu'on parle de SSD débits et interface mais pas de ce truc qui est répété dans tout l'article.
Soit ne pas faire d'intro soit y mettre une explication du terme le plus répété de tout l'article non ?
/Raleur off
Le 28/06/2024 à 10h23
#1.1
Mais comme l'article est en français et trillion en anglais se traduit par billion en français, je trouve que l'article devrait parler de BOPS
Le 28/06/2024 à 10h47
#1.1.1
Le 28/06/2024 à 15h34
#1.1.2
Le 28/06/2024 à 16h07
#1.1.3
Sur les H100, on commence à compter en POPS. Sur les anciennes générations, on avait des GOPS. Je suis curieux de connaître la signification de ces acronymes si on exclut que le P puisse être pour Peta et le G pour Giga, bien entendu.
Le 28/06/2024 à 10h34
#1.2
Le 28/06/2024 à 10h59
#1.2.1
Le 28/06/2024 à 11h00
#2
Mais je trouve qu'il y a un énorme gap entre l'IA "assistante" et l'IA générative, avec beaucoup plus de potentiel dans la vie courante d'un utilisateur avec l'assistance. C'est donc dommage de priver une partie des utilisateurs de cette partie alors que leur matériel permet de le supporter.
Autres pistes possibles :
- C'est via l'IA générative que se base tout le modèle économique de Copilot+ (il me semble qu'il y a déjà des notions de crédits dans Paint par exemple), donc il faut qu'il ne soit utilisé que par des clients susceptibles de ramener de l'argent.
- C'était un deal avec les fabricants des modèles ARM pour les convaincre d'adhérer au projet, en leur proposant un avantage sur les modèles x86 sur l'année de lancement pour booster les ventes et leur assurer une meilleure rentabilité