#Nextquick Pourquoi tout le monde se jette encore sur les GPU NVIDIA pour l’IA
Dans l'IA, tous les chemins mènent à CUDA
Illustration : Flock
Le 12 juin à 09h39
NVIDIA est toujours le maître incontesté quand on parle d’entraînement et d’inférence de l’intelligence artificielle (générative). Ses GPU sont encore et toujours incontournables alors qu’il existe des alternatives, parfois plus économes, avec des puces spécialisées (ASIC) développées par Google, Microsoft ou encore Amazon. Pourquoi une telle situation ?
#Nextquick Pourquoi tout le monde se jette encore sur les GPU NVIDIA pour l’IA
Dans l'IA, tous les chemins mènent à CUDA
Illustration : Flock
NVIDIA est toujours le maître incontesté quand on parle d’entraînement et d’inférence de l’intelligence artificielle (générative). Ses GPU sont encore et toujours incontournables alors qu’il existe des alternatives, parfois plus économes, avec des puces spécialisées (ASIC) développées par Google, Microsoft ou encore Amazon. Pourquoi une telle situation ?
Hardware
Hardware
8 min
Avant toute chose, rendons à Furanku ce qui appartient à Furanku : l’idée de ce Nextquick. Dans les commentaires sur notre analyse de la consommation électrique des datacenters, il a soulevé une très intéressante question : « Pourquoi alors les TPU ne sont pas plus présents au sein des DC ? S’ils sont plus efficients, et – si j’ai bien suivi – plus économiques, comment se fait-il que tout le monde continue à se jeter sur des GPU ? »
Les TPU, ou Tensor Processing Unit (unité de traitement de tenseur), sont développés par Google, mais il existe aussi les Trainium de chez Amazon et les Maia chez Microsoft, pour ne citer qu’eux. Il s’agit d’ASIC, des circuits spécialisés, contrairement aux GPU qui sont généralistes (avec quand même une forte optimisation pour les calculs massivement parallélisables). Nous élargissons la question aux ASIC dans leur ensemble.
La réponse courte de la domination de NVIDIA tient en quatre lettres : CUDA, pour Compute Unified Device Architecture, une plateforme de programmation lancée en 2007, bien avant l’arrivée de l’IA. Depuis 20 ans, NVIDIA la développe et l’enrichit. La force de NVIDIA sur le logiciel est telle que son arrivée sur le quantique « fait peur à tout le monde ».
Maintenant, la réponse détaillée.
CUDA s’impose comme un standard de fait
Il reste 78% de l'article à découvrir.
Déjà abonné ou lecteur ? Se connecter
Soutenez un journalisme indépendant,
libre de ton, sans pub et sans reproche.
Accédez en illimité aux articles
Profitez d'un média expert et unique
Intégrez la communauté et prenez part aux débats
Partagez des articles premium à vos contacts
expert et sans pub.
Commentaires (26)
Le 12 juin à 09h55
Je me doutais fortement qu'il y avait du lock-in dans tout cela, mais pas à ce point.
Et je suis même surpris que les régulateurs ne se penchent pas plus sur la question. Il y a une situation de monopole évidente. Alors quand on nous vend du "libre marché" et que l'on constate ce type de situation, avec un acteur qui étouffe tout un pan industriel...
Typiquement CUDA devrait, amha, finir comme un standard ouvert de facto.
Cela réduirait en partie la dépendance à NVIDIA, en plus de permettre à la concurrence d'arriver plus fortement sur les marchés l'intégrant, donc stimuler l'innovation.
Le 12 juin à 10h08
Le 12 juin à 10h43
Le 12 juin à 11h56
Il y aurait du y avoir une autorité de standards comme IEEE ou du genre pour tamponner la chose et la rendre ouverte. Ou un truc dirigé par des mathématiciens. Même si ce sont les pires programmeurs du monde AMHA.
Certes on ne pouvait pas imposer à NVidia de le faire mais cela aurait pu aider... chépa, l'humanité. C'est là ou l'on voit que ces entités n'ont quasi pas de pouvoir. C'est le marché qui décide. Donc c'est con.
Maintenant on ne peut pas enlever à NVidia le fait qu'ils aient eu le nez creux de miser dessus. Ce sont quand même des dépenses de développement sur le hardware et le soft.
Le 12 juin à 12h10
Bref, ils n'ont pas "misé" sur le GPGPU. Ils se sont laisser porter par la tendance, et n'y ont été qu'un peu à la fois. En revanche, ce qu'on ne peut pas leur enlever (et qui explique leur succès), c'est que leurs GPU sont puissants.
Le 12 juin à 13h47
Oui ils n'ont pas inventé le train mais sans la locomotive, le train, il reste sur place. Et le papier BrookGPU reste un papier errant dans les limbes d'une université. Comme tant d'autres papiers.
Je pense que c'est quand même un pari. Imagine que CUDA ait flopé... Ca en fait du transistor inutile.
Le 12 juin à 15h50
Et c'est clair que c'est le proof-of-concept qui a encourage nvidia à proposer CUDA.
Tu n'as même pas lu le message auquel tu réponds, en fait.
Les première versions de CUDA tournaient sur un GPU 100% conçu pour le graphisme. Si CUDA flopait, ça faisait 0 transistor inutile.
Le 12 juin à 16h29
Oui les premières version de CUDA sont logicielles. Maintenant Le fait que NVidia fasse de l'accélération hard pour CUDA est un engagement certain. Ça reste bel et bien de la place sur un 'die' avec toutes les problématiques que cela engendre (étude, complexité, TDP, taille, support etc...).
Modifié le 12 juin à 12h34
C'est comme pour les réseaux sociaux et tous les géants désormais encadrés par les DSA/DMA, ils ne sont pas nés gigantesques : ils le sont devenus.
Il est toujours plus facile de pointer ce qu'on aurait pu faire une fois qu'on a l'issue devant les yeux !
Cela étant, comme toujours dans le secteur du hardware, c'est pas dit que ça dure malgré tout. Vu les coûts associés et les besoins démentiels, c'est pas un hasard si justement d'autres essaient de se barrer sur d'autres solutions où y'a pas une autorité qui fixe les prix.
On voit déjà comment Microsoft/Google/Apple partent en solution proprio, tout en utilisant leur OS en cheval de Troie pour concurrencer les petits nouveaux avec leurs propres IA. Alors OK ils sont en retard pour l'instant, mais pour combien de temps ?
Puis ce sont pas les premiers à devenir tout puissant, on peut citer Intel qui faisait >80% du marché des CPU en 2004 et même 95% des processeurs pour serveurs en 2015. Ils font plus autant la fête maintenant, alors que même Windows s'ouvre à ARM...
Le 12 juin à 13h52
Ça ne veut pas dire exclure tout raisonnement commercial. Mais au moins voir un peu plus loin que le bout du nez. Avoir un "système CUDA de NVidia" ouvert et partagé se grave mieux dans l'histoire qu'un brevet propriétaire.
Le 12 juin à 14h55
On impose toutes les nouvelles technologies de devenir ouvertes ?
On déclare qu'à partir d'un certain temps elles peuvent pas perdurer si personne ne les concurrencent ?
On voit qu'il y a de plus en plus de volontés d'imposer un minimum d'ouverture et d'interopérabilité, et de plus en plus :
Pour autant, on ne peut pas intervenir en amont sur ces sujets, pour deux raisons :
1/ Parce que personne n'aura envie d'innover si tout le monde peut taper dedans tout de suite, c'est la base de la concurrence et ce qui justifie pour l'entreprise d'investir.
2/ Parce que personne ne sait quand ça débute si ça va avoir du succès. Les innovations qui font pschit, il y en a en pagaille. On va pas tout réguler dès qu'une entreprise dépose un brevet ou sort un truc, sinon ça veut dire aussi qu'on s'arrête à la première version qui tombe, même si c'est pas la meilleure.
Après, le marché est régulé par des vrais gens, pas par un Deep State qui guide ou on va.
Comme on pourrait le dire pour PHP, Rust ou même les nouveaux mots de la langue française, CUDA s'est développé parce qu'il y a des humains (ici les développeurs) qui se sont mis dessus, dans 1, 10, 100 puis 1000 entreprises. Parce que c'était attractif (documentation, performances...), parce que l'alternative n'était pas plus intéressante (réapprendre pour faire pareil ou moins bien), puis au fil du temps parce que tout le monde était dessus et qu'il fallait y être aussi (recrutement, bibliothèques, entraide, etc.) : c'est devenu un standard incontournable.
C'est donc surtout de la pédagogie générale sur les risques liés aux écosystèmes captifs, de la même façon qu'un consommateur lambda doit avoir conscience qu'une fois qu'il a acheté son Apple Watch et son HomePod, il lui sera compliqué de passer d'iPhone à Android lorsqu'il voudra renouveler son smartphone.
D'ailleurs, on voit bien que les stratégies d'exploitation de l'IA sont distinctes.
Certains construisent des outils qui permettent de switcher entre les modèles d'IA, permettant alors demain de passer d'Anthropic à OpenAI en quelques minutes, alors que d'autres vont foncer tête baissée avec des requêtes qui fonctionnent exclusivement avec l'un d'eux, dont ils seront complètement dépendants, exigeant des mois de travail pour essayer de changer un jour.
Le 12 juin à 16h46
Pour Apple je sais pas. Pour le reste :
C'est à cause du bordel déjà présent que l'UE a imposé l'USB-c. Les prises de recharge auto... ça en prenait le même chemin méchamment. Donc plutôt gris que noir ou blanc.
Et surtout c'est de la veille technologique. Celle qui manque cruellement à l'appel en France (ou en UE). Et là je tousse comme un tabagique de 40 ans de carrière en fin de cancer (soutenu par un protocole de recherche à OncoLand) pour faire un signe... Même si je clope pas...
La concurrence est peut-être un souci. Mais bon la situation actuelle entre AMD NVidia montre bien que c'est encore un foutoir. Il y a un moment il faut décider. Cela peut se traduire par des aides pour celui qui est le plus 'sound' (qui fait sens) dans un écosystème.
Je pense que les états du monde entier devraient faire une petit obole pour les paroisses linuxiennes. Pourquoi ne pas le faire pour d'autres choses ? C'est aussi un moyen d'organiser et de sussiter. Bien évidement avec du contrôle et de la veille techno... khoffff, khofff
Le 12 juin à 12h30
Le 12 juin à 12h44
Le 12 juin à 09h57
Le 12 juin à 10h09
Il y a aussi torchTPU qui est, ou va sortir, et si je ne me trompe pas, qui a été développé par Google et le créateur de PyTorch. Et ça permettrait de faire tourner du PyTorch nativement sur des TPU. Ce qui déverrouille encore un peu le “lock-in”
Le 12 juin à 11h29
Le 12 juin à 10h11
Le 12 juin à 11h10
Il y a en plus un coût énorme de migration (hardware et software) en plus des formations nécessaires pour les devs afin d'avoir en sortie des perfs similaires que peu sont près a encaisser.
Le 12 juin à 11h42
La majorité des développeurs en ML, eux, utilisent des bibliothèques haut niveau comme pyTorch, Jax, Tensorflow. Le code est, pour l'immense majorité, ligne, agnostique du matos. Techniquement, si tu as le backend qui permet d'utiliser un TPU, il sera compatible avec les TPU. Microsoft a même créé un format ouvert "ONNX" pour les modèles de machine learning et avec un environnement capable de s'adapter à la machine.
Bon après, le TPU, c'est trop spécialisé, certain modèle risque de ne pas fonctionner là-dessus.
Le 12 juin à 10h24
Et concernant l'enfermement dans le système CUDA, c'est un comble quand on vois que n projets sont rétroengeineré à coup d'IA pour ressortir du code dans un autre langage !
Le 12 juin à 11h33
Le 12 juin à 19h46
Qu'est-ce que ce ce ironique, que CUDA soit rétro ingénié à l'aide d'une IA à base de CUDA. 😁
Le 12 juin à 19h23
Modifié le 12 juin à 20h08
https://www.modular.com/democratizing-ai-compute
Le 15 juin à 07h23
On peut acheter des GPGPU et monter sa propre ferme souveraine, de toute taille.
Qui va aller faire l'effort de solliciter de la concurrence en utilisant des ressources pour changer d'habitudes/API/cadre d'application si la cible est verrouillée, et uniquement disponible dans la crèmerie du fournisseur ?
Encore une démonstration que les seuls gagnants certains d'une ruée vers l'or sont les vendeurs d'outils.
D'ailleurs, ce sont les quelques rares externalités au circuit fermé de la bulle.
Signaler un commentaire
Voulez-vous vraiment signaler ce commentaire ?