#Nextquick Pourquoi tout le monde se jette encore sur les GPU NVIDIA pour l’IA
Dans l'IA, tous les chemins mènent à CUDA
Illustration : Flock
Le 12 juin à 09h39
NVIDIA est toujours le maître incontesté quand on parle d’entraînement et d’inférence de l’intelligence artificielle (générative). Ses GPU sont encore et toujours incontournables alors qu’il existe des alternatives, parfois plus économes, avec des puces spécialisées (ASIC) développées par Google, Microsoft ou encore Amazon. Pourquoi une telle situation ?
#Nextquick Pourquoi tout le monde se jette encore sur les GPU NVIDIA pour l’IA
Dans l'IA, tous les chemins mènent à CUDA
Illustration : Flock
NVIDIA est toujours le maître incontesté quand on parle d’entraînement et d’inférence de l’intelligence artificielle (générative). Ses GPU sont encore et toujours incontournables alors qu’il existe des alternatives, parfois plus économes, avec des puces spécialisées (ASIC) développées par Google, Microsoft ou encore Amazon. Pourquoi une telle situation ?
Hardware
Hardware
8 min
Avant toute chose, rendons à Furanku ce qui appartient à Furanku : l’idée de ce Nextquick. Dans les commentaires sur notre analyse de la consommation électrique des datacenters, il a soulevé une très intéressante question : « Pourquoi alors les TPU ne sont pas plus présents au sein des DC ? S’ils sont plus efficients, et – si j’ai bien suivi – plus économiques, comment se fait-il que tout le monde continue à se jeter sur des GPU ? »
Les TPU, ou Tensor Processing Unit (unité de traitement de tenseur), sont développés par Google, mais il existe aussi les Trainium de chez Amazon et les Maia chez Microsoft, pour ne citer qu’eux. Il s’agit d’ASIC, des circuits spécialisés, contrairement aux GPU qui sont généralistes (avec quand même une forte optimisation pour les calculs massivement parallélisables). Nous élargissons la question aux ASIC dans leur ensemble.
La réponse courte de la domination de NVIDIA tient en quatre lettres : CUDA, pour Compute Unified Device Architecture, une plateforme de programmation lancée en 2007, bien avant l’arrivée de l’IA. Depuis 20 ans, NVIDIA la développe et l’enrichit. La force de NVIDIA sur le logiciel est telle que son arrivée sur le quantique « fait peur à tout le monde ».
Maintenant, la réponse détaillée.
CUDA s’impose comme un standard de fait
Il reste 78% de l'article à découvrir.
Déjà abonné ou lecteur ? Se connecter
Soutenez un journalisme indépendant,
libre de ton, sans pub et sans reproche.
Accédez en illimité aux articles
Profitez d'un média expert et unique
Intégrez la communauté et prenez part aux débats
Partagez des articles premium à vos contacts
expert et sans pub.
Commentaires (11)
Aujourd'hui à 09h55
Je me doutais fortement qu'il y avait du lock-in dans tout cela, mais pas à ce point.
Et je suis même surpris que les régulateurs ne se penchent pas plus sur la question. Il y a une situation de monopole évidente. Alors quand on nous vend du "libre marché" et que l'on constate ce type de situation, avec un acteur qui étouffe tout un pan industriel...
Typiquement CUDA devrait, amha, finir comme un standard ouvert de facto.
Cela réduirait en partie la dépendance à NVIDIA, en plus de permettre à la concurrence d'arriver plus fortement sur les marchés l'intégrant, donc stimuler l'innovation.
Aujourd'hui à 10h08
Il y a 58 minutes
Aujourd'hui à 09h57
Aujourd'hui à 10h09
Il y a aussi torchTPU qui est, ou va sortir, et si je ne me trompe pas, qui a été développé par Google et le créateur de PyTorch. Et ça permettrait de faire tourner du PyTorch nativement sur des TPU. Ce qui déverrouille encore un peu le “lock-in”
Il y a 12 minutes
Aujourd'hui à 10h11
Il y a 31 minutes
Il y a en plus un coût énorme de migration (hardware et software) en plus des formations nécessaires pour les devs afin d'avoir en sortie des perfs similaires que peu sont près a encaisser.
À l'instant
La majorité des développeurs en ML, eux, utilisent des bibliothèques haut niveau comme pyTorch, Jax, Tensorflow. Le code est, pour l'immense majorité, ligne, agnostique du matos. Techniquement, si tu as le backend qui permet d'utiliser un TPU, il sera compatible avec les TPU. Microsoft a même créé un format ouvert "ONNX" pour les modèles de machine learning et avec un environnement capable de s'adapter à la machine.
Bon après, le TPU, c'est trop spécialisé, certain modèle risque de ne pas fonctionner là-dessus.
Aujourd'hui à 10h24
Et concernant l'enfermement dans le système CUDA, c'est un comble quand on vois que n projets sont rétroengeineré à coup d'IA pour ressortir du code dans un autre langage !
Il y a 8 minutes
Signaler un commentaire
Voulez-vous vraiment signaler ce commentaire ?