Empreinte écologique : l’IA générative va-t-elle relancer une course folle ?

La semaine dernière, nous nous sommes intéressés à la course-poursuite entre les terminaux, les infrastructures et les logiciels, sous l’angle de l’empreinte environnementale. Une révolution se déroule actuellement et pourrait changer la donne : l’IA générative.

Un directeur énergie et infrastructure chez Google, un responsable stratégie innovation AI chez SAP et deux experts en numérique responsable nous apportent des éclairages et des perspectives.

Course-poursuite entre terminaux, infrastructures et logiciels : à quand la fin ?

Dans la première partie de notre dossier, nous adoptions une position sceptique (mais argumentée) face à la croissance future de l’empreinte du numérique. Les choses demeurent évidemment incertaines. Des observateurs pensent que le Métavers, la réalité augmentée et les wearables n’ont pas dit leur dernier mot : il va bientôt falloir tout jeter et acheter encore plus d’objets connectés.

Les perspectives sont encore plus incertaines avec l’arrivée de l’IA générative, événement majeur de 2023 : l’industrie de la tech la considère généralement comme une transformation du même ordre que celui du PC ou du Cloud (donc devant des évolutions telles que l’IoT, la blockchain, voire le mobile). Prudence cependant, car cela dépendra grandement, in fine, des cas d’usage où l’IA générative sera appliquée.

Une seule chose apparaît certaine à ce stade : l’IA générative va augmenter les besoins en capacité de calcul, et a fortiori de data centers. Selon Marc Oman, responsable énergie-infrastructure chez Google, « l’IA générative nécessite un réseau neuronal et des ensembles de données plus importants, nécessitant une augmentation des capacités des data centers ».

Pour le reste, le consensus parmi les experts est que nous n’avons à peu près aucune idée de là où nous allons, ni dans quelle mesure les bénéfices environnementaux de l’IA ne seront supérieurs à leurs coûts. Malgré le flou, il est possible de décrire quelques-uns des mécanismes majeurs en jeu.

L’IA générative est pour l’instant partie pour s’intégrer dans les terminaux existants

Tous les logiciels seront remis à niveau, c’est une certitude. Cela ne signifie pas forcément dire qu’il faudra renouveler les terminaux. Microsoft intègre l’IA générative dans Word, Excel et PowerPoint sans qu’il soit nécessaire de renouveler les PC.

Google a annoncé une percée significative dans la performance de ses modèles d’IA générative, limitant considérablement les capacités de calcul nécessaire, au point où des IA sophistiquées pourront tourner sur nos smartphones existants. Stéphan Peccini, consultant expert en numérique responsable, se veut également rassurant sur ce point : « je n’anticipe pas de besoin de renouvellement des appareils, le traitement des besoins se réalisant côté data center, qui, eux, devront supporter tout l’accroissement de puissance nécessaire ».

À moyen terme cependant, il est difficile de faire des prédictions. Les gains d’efficience pourraient dépasser l’accroissement des besoins, ou vice versa, par exemple avec l’avènement d’IA personnelles particulièrement gourmandes en données.

Les terminaux pourraient aussi devenir obsolètes au regard de l’évolution des modes d’interaction entre l’utilisateur et l’IA. Si les PC devenaient conversationnels, alors les moyens actuels d’entrée de données (clavier, souris…) pourraient disparaître, et l’appareil dans sa globalité pourrait ressembler à une sorte de mélange d’Alexa et de l’assistant Cortana, avec une interface physique et logicielle que notre esprit ne peut encore imaginer.

L’omniprésence future de l’IA générative dans l’industrie est loin d’être garantie

L’IA générative fait clairement l’objet d’une accélération en 2023, et on est aujourd’hui au sommet du hype cycle de Gartner. Il est cependant difficile de savoir à quel point cette technologie sera généralisée au point de « tout » révolutionner.

Un point d’incertitude majeur est le niveau de déploiement de l’IA générative à travers les processus industriels. Au regard de leurs besoins de personnalisation, de protection de la propriété intellectuelle, et de maintien de leur avantage concurrentiel, les entreprises vont demander des IA spécifiquement entraînées, et en permanence ré-entraînées. Plus les cas d’usage se multiplieraient, plus la consommation de data et d’énergie sera importante.

Or, il n’est pas certain que les industriels confient la gestion de leurs processus critiques à une machine dont la fiabilité serait en-dessous de 100 %, sans même parler des risques d’hallucination. Par définition, le modèle probabiliste de l’IA générative peut difficilement répondre à des besoins où la fiabilité, même élevée à 99,9 %, resterait insuffisante.

En couplant les réseaux neuronaux profonds de l’IA générative à d’autres techniques comme le reinforcement learning, les niveaux de précision pourraient atteindre 100 %... mais cela demeure hypothétique à ce jour.

L’IA générative comme facilitatrice de la transition énergétique ?

Emmanuel Cassimatis, responsable stratégie innovation AI chez SAP, invite à tenir compte des gains possibles d’efficience environnementale (énergie, matière…) que permettrait l’IA générative, en retour de l’investissement énergétique que demandent son entraînement et son utilisation. « L’IA nous permettra d’optimiser l’allocation des données et des serveurs, de rationaliser le développement des logiciels, de supprimer les applications redondantes ou inefficaces… ».

Les bénéfices iraient au-delà du secteur de la tech. L’IA pourrait nous apprendre ce qu’on ignore dans la connaissance du monde vivant, de la chimie et des matériaux : « Elle pourrait nous guider dans le choix des végétaux à planter pour absorber le plus de CO₂, nous faire découvrir des composants permettant d’augmenter significativement la performance des panneaux solaires… », poursuit Emmanuel Cassimatis.

Son de cloche similaire chez Marc Oman, responsable énergie-infrastructure chez Google. Il est difficile à ce stade de prédire quel sera le bilan environnemental de l’IA générative. Un cas de figure actuellement à l'étude concerne la possibilité d’entraîner les modèles d’IA de manière intermittente, pour mieux correspondre à la disponibilité des réseaux électriques dominés par les énergies variables que sont l’éolien et le solaire.

Selon Marc Oman, les data centers de l’IA générative offrent de nouvelles perspectives de stabilisation du réseau à travers l’interruptabilité de certains processus liés aux modèles d’IA. « Nous étudions si les data centers déployés pour l’IA générative accepteraient de tourner de manière fractionnée. Si c’est le cas, ce mode de fonctionnement serait très différent de celui des data centers traditionnels, qui ne peuvent tolérer que cinq secondes de défaillance par an ! Un exemple simple serait la musique en streaming : on ne peut pas interrompre le service en soi, mais il serait possible d’interrompre l’entraînement de l’algorithme de reconnaissance des préférences musicales ».

Cela ouvrirait un nouveau champ des possibles : « les data centers de l’IA générative vont certes consommer beaucoup d’électricité, mais grâce à leur souplesse, ils pourraient fonctionner surtout lorsqu’il y a du vent et du soleil en excès, et être interrompus lorsque les énergies variables manquent, réduisant ainsi la dépendance actuelle à l'électricité d’origine fossile [gaz et charbon] ».

Ainsi, cela éviterait au réseau électrique de devoir augmenter ses capacités de production pour servir les pointes de consommation : les data centers de l’IA générative tourneraient lorsqu’il y a des pointes de production et une faible consommation (l’été par exemple, lorsque les panneaux solaires produisent beaucoup et que les gens sont à la plage), et s’effaceraient pour soulager le réseau lorsque celui-ci est tendu (une froide nuit d’hiver avec peu de vent, par exemple).

La faisabilité technique reste à démontrer, mais Google en observe déjà quelques prémices. En octobre 2023, Varun Mehra publia un article sur la modulation de la charge de travail des data centers pour contribuer à répondre aux tensions de l’hiver 2022 sur le réseau électrique européen, en pleine crise du gaz russe.

Syndrome de la Reine Rouge : quel plan si on perd le contrôle de la situation ?

Les considérations éthiques et environnementales ex-ante sont pertinentes, mais l’expérience montre que le monde ne se pose pas de questions sur l’utilité réelle du numérique avant de s’y engager. Il ne fait pas le tri entre usages utiles et moins utiles.

« L’IA va se déployer de manière massive, c’est une certitude, et on verra bien dans quelle mesure on saura en gérer les conséquences », affirme Stéphan Peccini. « Il y aura de plus en plus de services délégués à l’IA, dont très sûrement des services essentiels. Le risque étant qu’on perde la connaissance du fonctionnement du système, et qu’on se retrouve à poil, incapables de revenir en arrière en cas de problème, par exemple au niveau des ressources critiques ou des vulnérabilités face aux cyberattaques. Les menaces vont au-delà de la seule augmentation de l’empreinte environnementale (énergie, climat, pollution minière) : le risque est que la complexité du système finisse par nous échapper, sans retour en arrière possible. ».

Benjamin Lang, expert en numérique responsable, poursuit : « le numérique, comme d’autres domaines de l’économie, est soumis au syndrome de la Reine Rouge : que ce soit à l’échelle d’un pays ou d’une entreprise, il faut suivre la tendance et accélérer. Aucun acteur n’a intérêt à sortir du jeu, il n’aurait aucun impact sur le système, s’écroulerait, et fournirait en plus des raisons supplémentaires aux autres pour continuer d’accélérer ».

Selon notre interlocuteur, « face à la dégradation des conditions d’habitabilité de la planète et les difficultés économiques, on va vouloir remettre des couches de solutions techniques. En allant jusqu’au bout de cette logique économique, la machine va finir par se gripper… nous devons faire émerger des contre-modèles, des champions d’une économie alternative ».

Commentaires (5)

eglyn Abonné

Le 16/01/2024 à 08h46

mais l’expérience montre que le monde ne se pose pas de questions sur l’utilité réelle du numérique avant de s’y engager.

Et je trouve cela plutôt bien en fait, ça permet d'innover plus rapidement, même si certaines voies sont sans issue.
Si on se pose trop de questions, on avance pas (et les autres si

)

barlav Abonné

Le 16/01/2024 à 08h59

#1.1

... jusqu'à se poser la question du monstre construit.

Me vient en tête le modèle des pubs avec leur budget sans limites du moment qu'on peut enfoncer une pub dans un crâne, peut importe l'impact écologique et la débauche de moyens.

okgenial

Le 16/01/2024 à 09h53

En allant jusqu’au bout de cette logique économique, la machine va finir par se gripper… nous devons faire émerger des contre-modèles, des champions d’une économie alternative ».

Et un article sur "les limites de la croissance" de Meadows serait un bonne suite ?
Avec l'équipe de steep ?
https://steep.inria.fr/

matt050 Abonné

Le 16/01/2024 à 16h06

Vu le titre, je m'attendais à ce que l'article donne quelques chiffres pour pouvoir se faire une idée de l'empreinte écologique (mwh et nombre de machines/autres utilisées pour l'entrainement de l'IA, wh pour chaque requête ...).
Ce que je retiens de l'article sur ce sujet, c'est que l'on n'a pas de chiffres à se mettre sous la dent et que les parties prenantes qui ont un interet direct ou indirect à faire avancer l'IA essayent d'être rassurantes.

Beltharod Abonné

Le 17/01/2024 à 08h23

Un article de Cyrus sur Next?! Mais quelle bonne idée ! (J'avais rate celui de la semaine dernière)

Catégories

Nous suivre

À propos

Empreinte écologique : l’IA générative va-t-elle relancer une course folle ?

L’IA générative est pour l’instant partie pour s’intégrer dans les terminaux existants

L’omniprésence future de l’IA générative dans l’industrie est loin d’être garantie

L’IA générative comme facilitatrice de la transition énergétique ?

Syndrome de la Reine Rouge : quel plan si on perd le contrôle de la situation ?

Sommaire de l'article

Introduction

L’IA générative est pour l’instant partie pour s’intégrer dans les terminaux existants

L’omniprésence future de l’IA générative dans l’industrie est loin d’être garantie

L’IA générative comme facilitatrice de la transition énergétique ?

Syndrome de la Reine Rouge : quel plan si on perd le contrôle de la situation ?

Granite : IBM lance son pavé dans la mare des modèles de langage pour la génération de code

Stack Overflow signe avec OpenAI

La RATP expérimente sa vidéosurveillance algorithmique pour les concerts de Taylor Swift

FurMark débarque en version 2.3, avec la prise en charge des Raspberry Pi

Boeing Starliner n’a finalement toujours pas décollé…

Chang’e 6 fait route vers la Lune, avec l’instrument français DORN

Pass Monitor : Proton Pass comble (enfin) certaines lacunes

Dirty Stream : quand une application Android peut écraser les fichiers d’une autre

Raspberry Pi Compute Module 4S : jusqu’à 8 Go de mémoire, production jusqu’en 2034

Calendrier de publication d’Ubuntu 24.10 (Oracular Oriole)

Commentaires (5)