L’IA générative, une bulle ? Goldman Sachs met les pieds dans le plat
À la recherche de la killer app
Depuis un an au moins, diverses voix s'élèvent pour qualifier la frénésie autour de l'IA générative de bulle. Une idée qui devient d'autant plus sérieuse que la banque Goldman Sachs elle-même donne crédit à ce type d'analyse.
Le 10 juillet à 17h03
9 min
Économie
Économie
Fin juin, Goldman Sachs publiait un rapport (.pdf) passé relativement inaperçu. Son titre : « IA générative : trop de dépenses, trop peu de bénéfices ? ». En 31 pages, le département de recherche de la banque d’investissement offre un aperçu plus mesuré qu’habituellement des potentiels de l’intelligence artificielle générative.
Plus précisément, les interviews de l’économiste Daron Acemoglu, professeur au MIT, et du responsable de la recherche sur les marchés mondiaux de Goldman Sachs Jim Covello donnent à entendre des points de vue très critiques de la frénésie autour de la technologie.
Pour la prochaine décennie, Daron Acemoglu n’envisage que de très faibles progrès économiques directement liés à l’IA générative. Jim Covello, lui, constate que les infrastructures d’IA sont beaucoup plus chères, de l’ordre de mille milliards de dollars, que celles qui ont permis, par exemple, l’émergence d’internet. « La question cruciale est donc : quel est le problème à mille milliards de dollars que l’IA permettra de résoudre ? »
Et les deux de pointer qu’à l’heure actuelle, aucune application précise justifiant ces coûts n’a été trouvée.
Goldman Sachs étant, par essence, à la recherche de profit, sa publication est un argument supplémentaire en faveur d’une bulle de l’intelligence artificielle générative… dont l’explosion pourrait se produire à une échéance relativement courte -à défaut d’application convaincante, Jim Covello l’envisage d'ici 12 à 18 mois.
Aucune application prometteuse… sauf à être plus coûteuses que l’original
Dans un récent article intitulé « La simple macroéconomie de l’IA » (.pdf), Daron Acemoglu prévoit que l’intelligence artificielle générative ne produise que peu d'augmentations de la productivité et du PIB (respectivement de l’ordre de 0,5 % et de 1 % sur les dix prochaines années aux États-Unis). L’économiste y souligne aussi que l’IA générative ne devrait pas accroître les inégalités autant que l’adoption d’autres technologies, dans la mesure où ses effets sont plus largement partagés à travers la population. En revanche, il considère qu’elle pourrait accroître celles qui séparent les revenus tirés du capital de ceux tirés du travail.
En comparaison de ses estimations, Goldman Sachs prévoit environ 9 % d’augmentation de la productivité, et 6,1 % de progrès du PIB des États-Unis sur dix ans. Interrogé par les équipes de recherche de la banque sur cet écart, l’économiste souligne l’importance du temps. Sans nier le potentiel de l’IA générative pour la science, la recherche et développement et l’innovation, il explique que, compte tenu des « priorités et de l’architecture actuelle » de l’IA générative, « les véritables transformations ne se produiront pas rapidement, et peu – voire aucune – ne se produira dans les dix prochaines années ».
Pour lui, les tâches effectivement touchées dès maintenant par l’IA générative sont extrêmement simples. En revanche, les technologies actuelles sont incapables de remplacer des tâches plus complexes (que l’écriture de sous-routines simples en HTML, par exemple, via GitHub Copilot), et encore moins de manière rentable. Jim Covello exprime la même idée, citant un exemple interne à Goldman Sachs : « Nous avons constaté que l’IA peut actualiser des données historiques beaucoup plus rapidement que nous ne le faisions manuellement dans nos modèles. Sauf qu’elle le fait pour un coût six fois plus élevé. »
« De manière générale, les gens surestiment largement ce dont la technologie est capable aujourd’hui », ajoute-t-il. « D’après notre expérience, même les résumés les plus simples donnent des résultats souvent illisibles ou absurdes. » Et d’enfoncer le clou : « Malgré son prix élevé, la technologie est loin d'être à la hauteur, même pour des tâches aussi basiques. »
Manque de méthodologie robuste
Chacun des deux experts décortique ensuite certains des arguments habituellement avancés en faveur de l'IA générative.
Daron Acemoglu s’inscrit en faux de l’idée selon laquelle multiplier les données et les GPU suffirait à améliorer les systèmes d’IA, par exemple : « Que signifie doubler les capacités de l'IA ? Pour les tâches ouvertes comme le service à la clientèle ou la compréhension et le résumé de textes, aucune mesure claire n’existe qui démontrerait un résultat deux fois meilleur. »
Il souligne l’enjeu de l’accès à des données de qualité pour entraîner les modèles : aucune indication claire n'existe sur la provenance de ces données de meilleure qualité, de même que rien ne permet d'assurer que celles-ci seront facilement accessibles, et à bas coût. En cela, il se fait l’écho de multiples spécialistes du secteur qui regrettent le manque de méthodologies claires pour qualifier les capacités de l’IA.
Enfin, malgré l’aspect bluffant des capacités d’un ChatGPT, « il faut beaucoup de foi pour croire qu’une architecture permettant de prédire le mot suivant dans une phrase permettra d’obtenir des performances proche de celle d’HAL 9000 dans 2001 l’Odyssée de l’espace ». À l’inverse, quelques pages plus loin, l’analyste de Goldman Sachs Joseph Briggs reste enthousiaste, au point de citer la potentielle émergence d’une « superintelligence » comme « possible, mais prématurée » au regard des modèles existants.
Des pertes sous-estimées
Daron Acemoglu se penche aussi sur les pertes que certains investisseurs, aussi variés soient-ils, devront essuyer. D’un point de vue financier, des pertes sont probables sans que ce soit négatif : elles seront le résultat des expérimentations d’automatisation par l’IA qui ne fonctionneront pas.
Le domaine devra aussi composer avec des problématiques comme l’accès à l’énergie et aux puces, comme le montre l'analyse de la banque privée. Cofondateur de Cloverleaf Infrastructure, Brian Janous cite le cas de Dublin, où le fournisseur public EirGrid a posé un moratorium sur la création de nouveaux data centers jusqu’à 2028 pour réussir à absorber la demande, ou d’Amsterdam, qui a passé une loi susceptible de pénaliser les data centers qui n’éteignent pas leurs serveurs inactifs pour économiser de l’énergie, et une autre qui limite les espaces dans lesquels il est possible d’installer de nouveaux centres.
Des critiques (de la critique) mal informées ?
« Même à ses débuts, l'internet était une solution technologique peu coûteuse qui a permis au commerce électronique de remplacer les solutions coûteuses des opérateurs historiques » rappelle son collègue Jim Covello, interrogé sur la comparaison quelquefois opérée entre l’intelligence artificielle générative et internet (y compris la bulle internet). « À l’inverse, les technologies d’IA sont exceptionnellement coûteuses, et pour justifier ces coûts, elles devraient être capables de résoudre des problèmes complexes, ce qu’elles ne sont pas conçues pour faire. »
« Remplacer des emplois peu coûteux par des technologies chères, c’est fondamentalement le contraire des transitions technologies précédentes dont j’ai été témoin en trente ans de travail sur l’industrie de la tech », déclare-t-il encore.
De même, le chercheur qualifie d’ « histoire révisionniste » l’argument selon lequel les nouvelles technologies commencent nécessairement par être chères avant de devenir de plus en plus abordables. Si la loi de Moore a permis la création de puces toujours plus petites et plus rapides, pointe-t-il, c’est parce qu’AMD a forcé Intel et les autres entreprises du secteur à se lancer dans une réelle compétition. Or, c’est loin d’être le cas dans l’IA générative dans la mesure où NVIDIA détient quasiment les clés du royaume (des GPU).
En définitive, Jim Covello explique que plus le temps passe sans application claire de ce qu’apporte l’IA générative, plus le récit de transformation vendu avec sera compliqué à maintenir. En conséquence, il estime que « l’enthousiasme des investisseurs pourrait commencer à s’évaporer dans les 12 à 18 mois ».
Notons qu’à peine une semaine après la publication de Goldman Sachs, Sequoia, l’un des plus gros fonds de capital-risque de la Silicon Valley, a à son tour publié une analyse dans laquelle il estimait que « la bulle de l’IA atteint un point de rupture ».
Le PIB n’est pas tout
Si les autres analystes de Goldman Sachs restent optimistes sur la capacité de l’IA à générer des retours sur investissements une fois trouvées ses applications les plus efficaces (« killer app »), Daron Acemoglu invite de son côté à ne pas analyser les coûts de la technologie d’un seul point de vue financier : « Le PIB n’est pas tout. »
Sans se déclarer spécifiquement inquiets par la profusion de deepfakes, l’économiste rappelle que les IA génératives alimentent la désinformation, de même qu’elles peuvent être utilisées de manière malveillante. Or « un investissement de mille milliards de dollars dans les deepfakes ajouterait mille milliards de dollars au PIB, mais je ne pense pas que la plupart des gens s’en réjouiraient ni n’en bénéficieraient ».
Daron Acemoglu invite à se projeter dans l'avenir. Pour lui, « le risque que nos enfants ou petits-enfants en 2074 nous reprochent d'aller trop lentement en 2024 au détriment de la croissance semble bien plus faible que le risque que nous finissions par aller trop vite et que nous détruisions les institutions, la démocratie et plus encore dans le processus ».
L’IA générative, une bulle ? Goldman Sachs met les pieds dans le plat
-
Aucune application prometteuse… sauf à être plus coûteuses que l’original
-
Manque de méthodologie robuste
-
Des pertes sous-estimées
-
Des critiques (de la critique) mal informées ?
-
Le PIB n’est pas tout
Commentaires (8)
Vous devez être abonné pour pouvoir commenter.
Déjà abonné ? Se connecter
Abonnez-vousLe 10/07/2024 à 17h43
ChatGPT n'est qu'un démonstrateur qui sert à attirer les investisseurs.
Le 10/07/2024 à 18h08
Sauf que l'EPR (a part peut être faire des modifs pour produire plus de tritium) n'a rien a voir avec la fusion, si ce n'est qu'il y a le mot nucléaire dedans.
L'idée des LLM est de passer le test de Turing, sauf que passer le test de Turing, contrairement a ce que ce dernier pensait n'est pas du tout suffisant pour avoir une IA générale.
On n'a aucune idée de chemin a suivre pour avoir une IA générale (a coté, la fusion ca a l'air facile)
Modifié le 10/07/2024 à 18h14
Peut-être parce qu'on est sur une techno encore émergente ? Combien de temps a-t-il fallu pour Internet à devenir un marché mondial au coeur de toutes les spéculations et usages ?
Ah OK, IA générative = ChatGPT. Ou GPT.
Et comparaison entre un robot conversationnel et une IA conçue pour gérer un vaisseau spatial et une mission d'exploration saturnienne/jupitérienne (dépend si roman ou film). C'est un peu absurde je trouve comme propos.
Donc les CPU, chers au début, ont gagné en puissance et baissé en coût car il y a eu de la concurrence pour challenger un acteur unique.
Mais pour les GPU il n'existe pas de concurrence ?
De ce que je comprends dans cette phrase, la situation est donc la même que pré-AMD pour Intel.
Bref, considérer que la bulle d'investissement autour de l'IA générative va éclater est bien une réalité à court terme, comme tout investissement frénésie de ce genre. Mais j'ai l'impression que le sujet a été à peine effleuré en regardant selon ChatGPT, comme d'hab. Pour rappel, l'IA générative n'est pas que ChatGPT. Ni GPT lui-même.
Edit : en info du jour, BNP Paribas qui a signé un accord avec Mistral AI pour les développements de services basé IA (assistants conversationnels, y compris audio, pour les clients et les conseillers).
Le 10/07/2024 à 20h26
Mais dès le début, le mail et les transferts de fichier à bas cout ont été une révolution. Plus besoin de faire appel à Fedex pour échanger des données par disquettes. Et possibilité de communiquer a distance de manière instantannée avec des collègues à l'autre bout du monde.
Et l'essor d'internet s'est fait dans un système économique de partage des couts. La notion de peering qu'on a sur Internet rendait les telco traditionnels dingues. Pour eux, ce qui comptait c'était la facturation des secondes, quite a se facturer les uns les autres, avec des contrats écrits par une armée d'avocats. Mais pour les boites internet, c'était plus du genre a négocier un truc autour d'une bière et essayer de limiter les couts.
L'internet de nos jours par contre c'est une autre histoire : 1) on remplace le réseau cuivre par de la fibre, ce qui coute une blinde et 2) le marché téléphonique s'est réduit comme une peau de chagrin et ne fait plus qu'utiliser des infras construites spécifiquement pour internet, l'exact inverse de ce qu'on avait au début.
Un truc me fait dire qu'on est dans une bulle, c'est les pivots IA. 2 exemples : un grand groupe francais qui embauche il y a 5 ans un "expert" pour qu'il monte une stratégie blockchain et metavers. Le même gars aujourd'hui organise des formations sur l'IA et les LLM. Ou Zoom, qui a explosé avec la pandemie avant de retomber dans l'obscurité (merci MS Teams) mais qui fait toute sa com en disant qu'ils sont une désormais boite "AI-Centric". Comme Tesla d'ailleurs. Ou Facebook/Meta qui va bientot se renommer Artificial ou un truc du genre.
Et sinon, le fait que BNP Paribas investisse dans un truc a tendence à me faire fuir :)
Le 10/07/2024 à 22h47
Je n'ai jamais vu un seul projet autour des blockchain / NFT qui apportait du concret. Que de l'hypothèse, et aucune n'a dépassé le stade du papier de mon expérience. Le metaverse était quant à lui vendu en mode "achetez votre place dedans pour avoir de la visibilité". Traduction, juste un emplacement virtuel pour mettre des 4 par 3 publicitaires.
L'IA générative, j'ai vu en six mois cinq cas d'usage POCés dont deux transformés en concret. Par contre, l'adoption en entreprise est forcément un peu plus lente car il reste toujours les questions juridiques autour de la propriété intellectuelle (certains ont eut des réponses assez astucieuses là dessus), mais aussi celle d'évaluer où partent les données quant les modèles sont en SaaS.
Dans les POC en question, il n'était pas question que de LLM.
Le 11/07/2024 à 14h47
Le 10/07/2024 à 22h18
J'espère que l'IA ne va pas remplacer les autres contenus.
Le 11/07/2024 à 17h45
Le véritable problème réside dans notre capitalisme néolibéral, totalement déconnecté de la réalité, qui ne se focalise que sur le profit, la croissance et le PIB comme seuls critères d'évaluation. Cette vision étriquée engendre des bulles spéculatives et des krachs, comme la bulle internet, le krach de 1929 ou la crise de 2008.
Il s'agit d'un aveuglement collectif, de personnes qui se prétendent intelligentes et rationnelles, mais qui poursuivent des profits rapides d'une manière fondamentalement irrationnelle.