Quand l’IA agentique coûte plus cher que de payer ses employés humains

Le 25 mai à 11h48

3 min

Économie

Alors que les entreprises se tournent vers l’IA agentique pour booster leur productivité, mais que les agents sont de plus en plus facturés en fonction du nombre de tokens utilisés, et non plus sous forme d’abonnement forfaitaire, il devient plus coûteux de payer l’IA que des employés, relève Fortune.

Ce qui pourrait compliquer les projets de ces entreprises vantant un avenir « agentique », alors que Jensen Huang, le PDG de Nvidia, a récemment déclaré qu’il pensait qu’un jour, 100 agents IA travailleraient aux côtés de chaque employé de son entreprise.

Cette incitation pressante à recourir à l’IA agentique s’est traduite par une nouvelle pratique, et expression, le « tokenmaxxing », visant non pas tant à produire plus de code utile qu’à faire croire à ses N+1 que l’on serait surproductif, en générant artificiellement de l’activité IA afin d’améliorer ses statistiques.

Une pratique encouragée par certaines entreprises, Amazon ayant par exemple fixé comme objectif de dépasser le seuil des 80 % de développeurs utilisant l’IA chaque semaine, tout en suivant la consommation de tokens de ses employés. Un tableau de bord interne chez Meta attribuait même des statuts de « Token Legend » aux employés en consommant le plus.

IA

Tokenmaxxing : quand les salariés d’Amazon brûlent des tokens pour se faire bien voir

IA

Mercredi 13 mai 2026 à 08h50 13/05/2026 08h50

14

À mesure que la consommation augmente, le coût unitaire des tokens « devrait chuter de manière spectaculaire », avance Fortune. Un récent rapport de Gartner estime que d’ici 2030, l’inférence sur un LLM hautement sophistiqué pourrait coûter 90 % de moins qu’en 2025.

Gartner prévoit néanmoins que cela ne se traduira pas par une baisse du coût total de l’IA, les modèles agentiques nécessitant bien plus de jetons par tâche que les modèles standards. Si la consommation de jetons augmente plus vite que la baisse des coûts unitaires, le coût total risque dès lors d’augmenter, voire de devenir insoutenable.

Microsoft, qui avait invité en décembre dernier des milliers de ses développeurs à utiliser Claude Code, vient par exemple d’annuler ses licences et de leur demander de passer par GitHub Copilot CLI, indiquait récemment The Verge.

Fin avril, Microsoft avait lui-même restreint la souscription de nouveaux abonnements individuels à GitHub Copilot, annonçant passer en juin à une tarification basée sur l’usage réel, en fonction du volume de tokens consommé.

IA

GitHub Copilot passe à une facturation à l’usage à partir du 1er juin

IA

Mardi 28 avril 2026 à 09h26 28/04/2026 09h26

12

Fortune relève que Praveen Neppalli Naga, le CTO d’Uber, avait déclaré avoir brûlé l’intégralité de son budget IA 2026 en seulement quatre mois. « Pour mon équipe, le coût de la puissance de calcul dépasse de loin celui des salaires des employés », a de son côté déclaré Bryan Catanzaro, vice-président chargé de l’apprentissage profond appliqué chez Nvidia.

Jean-Marc Manach

Le 25 mai à 11h48

Commentaires (22)

Abonnez-vous pour prendre part au débat

Cet article est en accès libre, mais il est le produit d'une rédaction qui ne travaille que pour ses lecteurs, sur un média sans pub et sans tracker. Soutenez le journalisme tech de qualité en vous abonnant.

Accédez en illimité aux articles d'un média expert

Profitez d'au moins 1 To de stockage pour vos sauvegardes

Intégrez la communauté et prenez part aux débats

Partagez des articles premium à vos contacts

Abonnez-vous

pamputt Premium

Le 25 mai à 12h04

Ok, l'IA agentique coute plus cher qu'un humain, mais si elle travaille mieux et plus vite, les entreprises sont quand même gagnante non ?

Z-os Premium

Le 25 mai à 17h26

Du moment qu'elle cotise pour sa retraite et son chomage, tout va bien.

deathscythe0666 Premium

Le 25 mai à 18h10

Ok, l'IA agentique coute plus cher qu'un humain, mais si elle travaille mieux et plus vite

Si on dit qu'elle coûte plus cher, je suppose que ça implique à iso-travail.

Neliger Premium

Le 25 mai à 12h25

Faites entrer les clowns ! 😹

SebGF Premium

Le 25 mai à 12h28

L'éternel recommencement. On avait (a toujours) le même problème avec le Cloud non maîtrisé et les souscriptions qui coûtent vite une blinde.

Et avec ces histoires d'objectifs d'usage qui démontrent la débilité profonde des dirigeants de ces entreprises, ça ne va pas s'arranger. Mettre des objectifs sur l'usage d'une techno a autant d'intérêt qu'un livret A, mais bon...

Tatamix Premium

Le 25 mai à 12h57

J'aimerai bien comprendre à partir de quand cela devient rentable d'investir dans une machine pour faire tourner des agents en local et quel type de config/budget est le plus adapté? Il semble facile de cramer quelques centaines d'€ en une journée avec un workflow soutenu. Est-ce qu'un pc avec du matos optimisé à 5000-10 000€ ne devient pas plus rentable sur le moyen-terme?

Selenith Premium

Modifié le 25 mai à 13h40

C'est possible à priori pour moitié moins que ça en bidouillant un peu. Quelqu'un a fait un post à ce sujet sur linuxfr : https://linuxfr.org/users/jflesch/journaux/auto-heberger-ses-ia

antinea Premium

Le 25 mai à 18h55

Bonjour, vous pouvez acheter une petite Nvidia DGX Spark, ca coute environ 5000 € et on peut faire tourner pas mal de chose dessus. Pas forcement rapide, mais on reste indépendant d'internet une fois bien paramétré.

Pour ma part, ca fait tourner en meme temps, OpenWebUI avec 2 modeles (GPT Oss 20G, Qwen 3.6), Whisper CPP, LibreTranslation et quelques outils carto interne et y a encore de la marge...

Hors de question de payer à l'usage, trop risqué et pas besoin que ca sorte vers internet

Liam

Le 25 mai à 19h39

Les modèles capables de tourner sur DGX Spark sont quand même significativement derrière les modèles SOTA. GPT-OSS même la version 120B était derrière ne serait-ce qu'o3. Alors, à l'heure de GPT 5.5...

graveen Premium

Modifié le 25 mai à 21h28

en fait ca va juste etre dépendant des fonctions que tu veux offrir à tes users. Agents simples (résumé de tout, gestion des emails planning, réservations...) couplés à la problématique de confidentialité vont se faire plutot bien sur ce genre de HW, mais faire des swarms ou chercher à concurrencer les modèles payants est bien moins efficace/pratique.

Cetera Premium

Le 25 mai à 14h10

C’est un peu comme le début de l’ère de la robotisation industrielle massive dans les années 70-80 chez les fabricants automobiles.

Les robots de l’époque étaient très cher à comparer à la masse salariale économisée sur le moment. Néanmoins, cela n’a pas empêché les industriels de remplacer leur MO d’ouvriers spécialisés par ces robots. Et le processus ne s’est jamais arreté, d’ailleurs : la robotisation ira jusqu’aux usines noires, sans lumière.

A l’époque, les cols blancs disaient aux ouvriers spécialisés au chômage, qu’il leur fallait accepter le progrès technologique et qu’ils pourraient toujours se reconvertir dans des emplois de service par exemple.
Le service auprès de ceux qui ont les moyens, la servitude volontaire.

Un peu ironique aujourd’hui, de regarder l’évolution des cols blancs dans leur conception du progrès.

OB Premium

Le 25 mai à 15h14

Pour moi, la robotisation massive a aussi été assez largement soutenue par le pétrole (même après les crises pétrolières, le litre de pétrole coûte toujours moins cher qu'un péon) - et c'est toute l'industrie logistique & transport qui en bénéficie.

Or malgré toute les étoiles (et les dollars) dans les yeux des actionnaires que l'IA amène, je n'arrive pas à imaginer un monde avec 20x plus de production électrique que maintenant (surtout à court terme), une consommation d'eau assez énorme surtout dans des moments où les crises climatiques vont se succéder, le pétrole (donc les matières premières) aussi.

Le tout pour exacerber encore les inégalités, car dans l'IA on ne parle pas du tout de redistribution: sur sur sujet, curieusement le 18ème siècle reste la référence (Alors vous allez me dire , comme avec tout ce qu'il y a ci-dessus la population va chuter drastiquement une fois le papyboom passé, peut-être que...)

Z-os Premium

Le 25 mai à 17h27

Après le papyboom, on va récupérer tout plein de logements vacants... Mais dans quel état

deathscythe0666 Premium

Le 26 mai à 15h51

C'est surtout que la robotisation des chaînes de production a un intérêt concret : permettre de produire des quantités d'objets plus importantes, plus vite, plus robustement et moins cher qu'à base d'une main d’œuvre humaine qui peut tout simplement ne pas suivre la demande. Avec l'IA, on produit de l'immatériel (des documents numériques), dont la caractéristique principale est d'être quasi gratuit à copier à l'infini. Donc, à moins de vouloir chacun son application (bugguée) de calendrier, de covoiturage (mais comment parler avec celle du conducteur ?), etc., ça ne répond pas vraiment à un besoin critique.

Même au niveau ROI : Uber a mis les pieds dans le plat récemment en disant (après avoir consommé en 4 mois ses 3.5 G$ d'IA affectés à l'année complète 2026) qu'ils ne voyaient concrètement pas d'effet mesurable sur la qualité de leur production logicielle.

Cetera Premium

Le 26 mai à 18h36

Je suis d'accord et je suis pessimiste. La raison et le bien commun semblent avoir été congédiés. Ils sont remplacés par la logique financière, cupide et sans limite de captation de richesses par les couches les plus aisées. Tout le monde sait qu'il n'y aura pas assez pour donner à bouffer à tout le monde, ceux qui le peuvent se gavent, les autres sont peu à peu ignorés, invisibilisés et enfin de compte effacés.

Heureusement, je suis optimiste, donc cela finira mal, certainement.

Voir "la grande bouffe" Ferreri 1973 pour la métaphore. ;)

fofo9012 Premium

Le 30 mai à 21h33

pas vraiment : robotiser ton usine coûte très cher à l'achat puis quasi rien à l'usage. donc c'est amortissable sans problème.

L'IA c'est l'inverse : ça coûte rien à la mise en place (un peu de formation), et très cher à l'usage et y'a réellement aucun espoir que ça baisse un jour...

fdorin Premium

Le 31 mai à 11h18

Autre élément qui à son importance : la robotisation te rend indépendant à l'usage.

L'IA créé une dépendance à une entité tierce. Elle est en panne ? Tes services sont bloqués. Elle décide de faire un x10 ? Tu dois payer. etc.

Jarodd Premium

Modifié le 25 mai à 18h15

tokenmaxxing

Je suis content d'apprendre qu'il existe un mot pour décrire cette situation. C'est presque rassurant de voir que je ne suis pas le seul à avoir cet usage de l'IA.

gragra Premium

Le 26 mai à 10h16

"À mesure que la consommation augmente, le coût unitaire des tokens « devrait chuter de manière spectaculaire »"
Il faudra m'expliquer comment...
De ce que je comprends, l'inférence c'est de la puissance de calcul spécialisée + de la mémoire HBM soit 2 éléments matériels très couteux qu'il faut installer proprement dans des datacenters.
Quelle feuille de route réaliste permet de diviser le coût par 10 en seulement 4 ans ?

deathscythe0666 Premium

Le 26 mai à 15h56

Pour moi, c'est un rêve basé sur des modèles économiques comme Amazon ou Uber dans lesquels un gros CAPEX (quand même 10 ou 20 fois inférieur à celui des LLM) permet ensuite de satisfaire une demande énorme (potentiellement pls continents, voire le monde) pour des OPEX réduits.

Mais les OPEX des LLM sont aussi gigantesques, donc je ne vois pas plus que toi ce qui permettrait de diminuer le coût unitaire des tokens. L'argument serait entendable si tous les datacenters pour LLM étaient déjà construits, qu'ils ne se déprécient jamais (lol, avec NV qui planifie maintenant une génération de puce par année) et qu'ils ne soient pas encore à 100% de leur taux d'usage (et, accessoirement, qu'ils ne consomment pas chacun 1 ou 2 GW).

EricB

Modifié le 26 mai à 11h39

le tokenmaxxing parait vraiment stupide alors que justement on devrait trouver des solutions pour mieux utiliser l'IA et économiser des token. Jongler entre les modèles et gérer la conso des token fait partie du nouveau job des ingénieurs gérant l'orchestration des agents IA.
Cela passe aussi par des IA mieux adaptées aux usages, avec des modèles spécifiques plutôt qu'un énorme truc générique trop consommateur.
dans certains cas, générer des token soit même avec peut-être ses propres machines, est aussi + pertinent que de seulement consommer des tokens.

33A20158-2813-4F0D-9D4A-FD05E2C42E48

Le 26 mai à 14h10

dans certains cas, générer des token soit même avec peut-être ses propres machines, est aussi + pertinent que de seulement consommer des tokens.

Ou les agents en local qui délèguent à des agents externes quand ils sont incapables de faire le taf eux-mêmes ? Je vois bien un système où le gros code est généré par la dernière version de Madame Claude et les derniers ajustements faits en local. Madame Claude = développeur senior, agent local = interne qui lie le design dans la US.

S'abonner à

Quand l’IA agentique coûte plus cher que de payer ses employés humains

Tokenmaxxing : quand les salariés d’Amazon brûlent des tokens pour se faire bien voir

GitHub Copilot passe à une facturation à l’usage à partir du 1er juin

Commentaires (22)

Cet article est en accès libre, mais il est le produit d'une rédaction qui ne travaille que pour ses lecteurs, sur un média sans pub et sans tracker. Soutenez le journalisme tech de qualité en vous abonnant.

Signaler un commentaire