Connexion Abonnez-vous

#Nextquick : le coût en eau d’une requête ChatGPT

Message in a bottle, yeah !

#Nextquick : le coût en eau d’une requête ChatGPT

Régulièrement sur les réseaux sociaux, la même rengaine revient : le coût en eau d’une requête sur ChatGPT. Après les GW comme unité de calcul de puissance des GPU, le litre pour le coût environnemental des IA génératives ?

Le 31 octobre à 15h00

50 cl d’eau par requête ChatGPT ? Chiche !

Selon certains, une requête « consommerait 50 cl d'eau ». Partons de ce postulat. Selon Sam Altman, ChatGPT aurait plus de 800 millions d’utilisateurs actifs par semaine pour 2,5 milliards de requêtes par jour. Cela donnerait donc 1,25 milliard de litres (1 250 000 m³) d’eau par jour, ou encore 450 millions de m³ d’eau sur l’année.

À titre de comparaison, Microsoft annonce des prélèvements de 10,4 millions de m³ d’eau en 2024 au niveau mondial (5,8 millions en Amérique du Nord). Selon l’USGS (United States Geological Survey), la consommation des États-Unis en 2015 était de 322 milliards de gallons (1,2 milliard de m³ d’eau) par jour, soit 450 milliards de m³ par an.

On résume : sur la base des hypothèses, ChatGPT consommerait 45 fois plus d’eau que Microsoft au niveau mondial ou 0,1 % de la consommation totale des États-Unis (en 2015).

Avec 50 cl d’eau par requête, il ne faudrait que 60 millions de requêtes ChatGPT par jour pour arriver à la consommation totale d’eau de Microsoft.

Comment calculer combien d’eau consomme une requête ?

Deuxième approche, comment passe-t-on d’un prompt à un volume d’eau et peut-on retomber sur 50 cl par requête ? Déjà existe-t-il un lien de causalité entre une requête et une consommation d’eau. Oui : l’eau est utilisée pour refroidir les serveurs informatiques. Pour estimer la consommation, deux approches.

La première à partir de la consommation exacte d’une requête. Avec une règle de trois, en connaissant la consommation totale en électricité et en eau sur une période, on pourrait en déduire le volume d’eau moyen pour une requête. Mais on ne connait pas le coût énergétique d’une requête.

La deuxième avec le nombre total de requêtes sur une période (en partant du principe que le serveur ne fait rien d’autre). Si on connait la quantité d’eau utilisée, on peut obtenir la consommation moyenne d’une requête.

Attention, dans les deux cas on parle de moyenne sur l'ensemble des requêtes. Certaines sont plus longues que d’autres et consomment donc davantage.

Les datacenters ne sont pas égaux

Autre point important : la localisation des serveurs. Imaginons que la requête se fasse sur Azure de Microsoft (partenaire d’OpenAI), la consommation d’eau par kWh (on parle de WUE) varie entre 0,02 L/kWh (Irlande) et 1,52 L/kWh (Arizona) selon les données de Microsoft, soit jusqu’à 80x plus. Sur les datacenters Azure aux États-Unis, le WUE va de 0,1 à 1,52, soit un rapport de x15. Une même requête consommerait donc 80 fois plus d’eau en Arizona qu’à Singapour ou en Irlande.

Sans connaitre le datacenter (et on ne le connait pas quand on fait une requête), sa consommation électrique ni son WUE, impossible d’en déduire une estimation (même vague) de la consommation d’une requête à ChatGPT.

« 500 ml pour environ 10 à 50 réponses de longueur moyenne »

D’où viennent alors les 500 ml (50 cl) qu’on voit revenir plus ou moins régulièrement ? D’une étude américaine publiée dans la revue Communications of ACM :

« En prenant comme exemple le modèle GPT-3 avec ses 175 milliards de paramètres, nous montrons que l'entraînement de GPT-3 dans les centres de données américains de Microsoft peut consommer un total de 5,4 millions de litres d'eau, dont 700 000 litres de consommation d'eau sur site (scope 1). De plus, GPT-3 a besoin de « boire » (c'est-à-dire de consommer) une bouteille d'eau de 500 ml pour environ 10 à 50 réponses de longueur moyenne, selon le moment et le lieu de son déploiement ».

500 ml pour 10 à 50 réponses, soit 10 à 50 ml pour une requête GPT-3. OpenAI est depuis passé à GPT-5, mais nous n’avons pas de détails sur son coût environnemental. On se doute qu’il est bien plus important, mais dans quelles proportions ?

Les 10 à 50 ml sont-ils liés au datacenter avec le plus petit WUE, celui avec le plus gros ou à une moyenne ? Selon les hypothèses, la consommation pourrait donc varier de 0,7 à 750 ml… À ce niveau-là, difficile de dire qu’on tient une piste.

« Consommer » de l’eau ?

Et puis, qu’appelle-t-on consommation d’eau ? Microsoft fait bien la différence entre prélèvement, consommation et rejet. La consommation est égale aux prélèvements moins les rejets. Les 10 millions de m³ sont des prélèvements, pour une consommation de 5,8 millions de m³, le reste de l’eau étant rejeté. Rappelons que sur Terre l’eau ne disparait pas, elle suit un cycle.

Dernier point : on n’a même pas parlé du coût de l’entrainement du modèle (des batteries de GPU pendant des mois), de la production de l’électricité, du réseau… Mais ce serait autant d’éléments à intégrer.

Commentaires (14)

votre avatar
Merci bcp pour cette article.

Moi la comparaison, que je fais quand j'entends ce type d'info. c'est avec le sang de notre corp.

Une fexion de bras = 3 ml de sang (aucune donnée sérieuse, chiffre donnée au pif juste pour avoir un ancrange).

Si je fais 100 relevées de bras par jour sur 10 jours, aurais-je consommée 3 litres de sang ?
L'anémie me gette alors. :phibee:
votre avatar
En ce qui te concerne, tu es en circuit fermé (hors blessure ouverte...), ce qui n'est pas forcément le cas des datacenters.
votre avatar
Même les mauvais data center, serait avec l'analogie de la transpiration humaine.
Donc oui il y a "une consomation" mais cette eau rejetté c'est au mieu de la vapeur d'eau au pire de l'eau "chaude".


Rien à voir avec d'autres industries, et je ne pense pas au nucléaire car on est sur le même type de (faux ?)débat mais plutôt les mines d'or par exemple...
votre avatar
Donc oui il y a "une consomation" mais cette eau rejetté c'est au mieu de la vapeur d'eau
Donc de l'eau qui sort du circuit potable.
votre avatar
Et qui y revient...
votre avatar
Pas forcément (si ca tombe dans l'océan, elle n'est plus potable), et pas forcément au même endroit non plus (les nuages se déplacent).
votre avatar
J'aurai du précisé dans le cycle général de l'eau.
votre avatar
Ca ne change absolument rien : ca fait une belle jambe à ceux qui souffrent de sécheresse de savoir qu'il pleut à plusieurs (dizaines de) milliers de km de chez eux.
votre avatar
Les questions seraient plutôt :
- quelle quantité d'eau a-t-on besoin pour fléchir le bras ?
- quelle qualité de l'eau ? (minéraux, vitamines, anti-oxydants, etc)
- quelle quantité d'eau est rejetée pour fléchir le bras ? (Urines, sécrétions, transpiration, etc)
- quelle quantité d'eau sera immédiatement utilisable pour continuer à fléchir le bras encore quelques années ? Boire son urine ou capter la vapeur d'eau de l'atmosphère est impossible en l'état actuel des technologies, donc il faut un bon fournisseur externe doté d'une logistique adéquat
votre avatar
[...]Boire son urine ou capter la vapeur d'eau de l'atmosphère est impossible en l'état actuel des technologies, donc il faut un bon fournisseur externe doté d'une logistique adéquat[...]

hum ... comment dire ... les technologies existent... et heureusement.
C'est justement le but (autre autre) de centrale de traitement de l'eau.
Et c'est aussi le cas dans les stations spatiales....

Pour la captation d'eau de l'atmosphère, plusieurs techniques de survie le permettent.

Après boire (s'hydrater) directement avec son urine ou de l'atmosphère là oui c'est pas perenne.
votre avatar
Déjà, merci pour cet article.
Je m'étais déjà renseignée (plusieurs fois) sur la question sans trouver de source neutre ou fiable.
Surtout qu'il me semble que le gros de la consommation d'eau (ou plutôt son utilisation) se fait durant l'entraînement des modèles et non pas par l'utilisateur en "bout" de chaîne.

Cependant bien que l'eau ne disparaît pas sur terre, la critique principale qui est faite sur les industries consommatrice (hors polluant) est qu'elle sort cette eau des circuits potables (que ce soit pour la consommation humaine que l'agriculture ou simplement la nature).

La question est importante puisqu'aux USA, certaines régions sont en proie à d'importante sécheresse et incendie.
votre avatar
Au dela de l'eau, il y a aussi les ressources en matériaux pour fabriquer des datas center... dont certains seront quasi impossible à récupérer car éparpillés dans des dilutions très faibles. Un vrai gaspi à tous les niveaux.
votre avatar
La consommation est égale aux prélèvements moins les rejets. Les 10 millions de m³ sont des prélèvements, pour une consommation de 5,8 millions de m³, le reste de l’eau étant rejeté. Rappelons que sur Terre l’eau ne disparait pas, elle suit un cycle.
C'est à la fois vrai et faux. Certes elle est rejeté (dans les circuits d'eaux usées ou dans des fleuves) et donc continue le cycle. Néanmoins comme vous le souligniez dans votre article sur le rapport de l'ARCEP, si elle est potable en entrée, en sortie elle ne le sera plus. Et ca a un impact non négligeable (en tout cas pour la France puisque rapport ARCEP).
votre avatar
Moi je dis : ça en fait de la flotte, en équivalent "chasse d'eau"...

#Nextquick : le coût en eau d’une requête ChatGPT

  • 50 cl d’eau par requête ChatGPT ? Chiche !

  • Comment calculer combien d’eau consomme une requête ?

  • Les datacenters ne sont pas égaux

  • « 500 ml pour environ 10 à 50 réponses de longueur moyenne »

  • « Consommer » de l’eau ?

Fermer