Tokenmaxxing : quand les salariés d’Amazon brûlent des tokens pour se faire bien voir

La course au token

Illustration : Flock

Mickael Bazoge

Le 13 mai à 08h50

Des salariés d’Amazon utilisent un outil maison équivalent à OpenClaw pour brûler des tokens et générer artificiellement de l’activité IA pour éviter de mauvaises évaluations. Ce phénomène du « tokenmaxxing » n’est pas propre à Amazon.

Tokenmaxxing : quand les salariés d’Amazon brûlent des tokens pour se faire bien voir

La course au token

Illustration : Flock

Mickael Bazoge

Le 13 mai à 08h50

IA et algorithmes

5 min

Les entreprises qui investissent lourdement dans l’IA générative poussent leurs employés à utiliser cette technologie au quotidien, ne serait-ce que pour justifier les sommes ahurissantes mises sur la table pour développer des modèles et faire pousser les centres de données. Amazon en fait partie : le géant du commerce en ligne a ainsi annoncé 200 milliards de dépenses d’investissement (capex) pour 2026 : il faut prouver que tout cet argent sert à quelque chose et les salariés sont mis à contribution.

Économie

Dopés par l’IA, les géants du cloud projettent 700 milliards $ d’investissements en 2026

Économie

Jeudi 30 avril 2026 à 16h16 30/04/2026 16h16

2

Amazon a lancé il y a quelques semaines un nouvel outil interne, MeshClaw, qui fonctionne sur le même principe qu’OpenClaw. Il permet de déployer des agents IA pour accomplir des tâches au nom de l’utilisateur : MeshClaw peut ainsi trier des courriels, interagir dans la messagerie Slack, déployer du code, surveiller des apps ou encore exécuter des tâches répétitives.

Le Financial Times rapporte que certains salariés d’Amazon font tourner MeshClaw non pas parce qu’ils en ont besoin, mais pour générer artificiellement de l’activité IA et améliorer leurs statistiques.

Si les stats d’utilisation de tokens IA ne sont pas censées servir à l’évaluation des performances des salariés d’Amazon, plusieurs d’entre eux ressentent une pression très forte pour les intégrer dans leur travail. L’entreprise a fixé des objectifs ambitieux : dépasser le seuil des 80 % de développeurs utilisant l’IA chaque semaine. La direction aurait aussi commencé à suivre la consommation de tokens dans des classements internes.

« Les managers regardent ces chiffres », affirme un employé sous le sceau de l’anonymat. « À partir du moment où l’usage est surveillé, ça crée des effets pervers et certaines personnes deviennent très compétitives là-dessus. » À cela s’ajoutent des craintes concernant l’autonomie assez large donnée aux agents MeshClaw, qui a accès à des outils internes sensibles. Ce qui ouvre la porte à des erreurs pouvant provoquer de sérieux incidents.

IA

Pannes chez AWS dues à son agent IA : Amazon se défausse sur ses employés

IA

Vendredi 20 février 2026 à 12h23 20/02/2026 12h23

23

Le nouveau Graal de la Silicon Valley

Ce phénomène du « tokenmaxing » n’est pas circonscrit à Amazon. De nombreuses entreprises ont des objectifs d’usage de l’IA, ce qui peut déboucher sur des abus. Un tableau de bord interne chez Meta attribuait des statuts (« Token Legend ») aux employés qui consommaient le plus de tokens. Ce classement, développé par un employé sans l’aval du groupe, a été retiré depuis… même s’il existe un tableau de bord officiel qui suit l’usage de l’IA au global (pas uniquement la consommation de tokens).

Une étude réalisée par Jellyfish publiée le mois dernier remettait en cause cette idée très répandue dans la Silicon Valley (et ailleurs) que les gains de productivité sont liés à la consommation de tokens IA. Les auteurs ont analysé les usages de 12 000 développeurs répartis dans 200 entreprises au premier trimestre 2026.

Le premier enseignement, c’est qu’il existe une grande disparité dans la consommation de tokens : un développeur « médian » utilise environ 51 millions de tokens par mois, quand les 10 % des plus gros consommateurs dépassent les 380 millions de tokens mensuels. Une consommation massive qui coûte très cher, environ 52 dollars par mois pour un utilisateur moyen selon les tarifs de l’API Claude, mais près de 700 dollars par mois pour les plus gros utilisateurs.

C’est le rapport coût/productivité qui est le plus intéressant ici. Les développeurs qui consomment énormément de tokens produisent effectivement davantage de code, et même s’il est correct, il nécessite davantage de travail : plus d’allers-retours, plus de supervision humaine, plus de corrections, et au bout du compte plus d’abandon de code. Tout cela fait grimper la facture bien plus vite que la productivité gagnée.

Les auteurs de l’étude estiment que les 20 % des développeurs les plus économes en tokens génèrent en moyenne 11 modifications de code validées et intégrées aux projets (pull request fusionnées) pour 3 dollars de tokens sur un trimestre. Les 20 % des plus gros consommateurs en comptabilisent en moyenne 23, mais la facture est de 1 822 dollars.

Consommer plus de tokens permet effectivement de produire davantage, mais le coût unitaire se révèle bien plus élevé. L’étude dresse une comparaison intéressante : les tokens ressemblent à du carburant de fusée. On peut aller plus vite mais chaque gain supplémentaire nécessite énormément plus de ressources. Dans ces conditions, un usage modéré et raisonnable de l’IA semble bien plus indiqué que de forcer une consommation poussée à l’extrême.

IA

#Nextquick : Pourquoi et comment Opus 4.7 crame ses tokens beaucoup plus vite qu’Opus 4.6

IA

Vendredi 01 mai 2026 à 09h09 01/05/2026 09h09

20

Commentaires (14)

Abonnez-vous pour prendre part au débat

Cet article est en accès libre, mais il est le produit d'une rédaction qui ne travaille que pour ses lecteurs, sur un média sans pub et sans tracker. Soutenez le journalisme tech de qualité en vous abonnant.

Accédez en illimité aux articles d'un média expert

Profitez d'au moins 1 To de stockage pour vos sauvegardes

Intégrez la communauté et prenez part aux débats

Partagez des articles premium à vos contacts

Abonnez-vous

SebGF Premium

Le 13 mai à 08h56

Le premier enseignement, c’est qu’il existe une grande disparité dans la consommation de tokens : un développeur « médian » utilise environ 51 millions de tokens par mois, quand les 10 % des plus gros consommateurs dépassent les 380 millions de tokens mensuels.

Une métrique intéressante sur l'usage des modèles pour mesurer leur coût par employé.

Pour le reste, voilà ce qui se passe quand le management marche à coup d'OKR / PKI éclatés au sol et déconnectés de réels objectifs.
L'IA en entreprise (et pas que) n'est qu'un miroir à la gloire de la stupidité naturelle.

scandinave Premium

Le 13 mai à 09h28

"Quand une mesure devient un objectif, elle cesse d'être une mesure pertinente"

Refhi Premium

Le 13 mai à 10h20

Si la jauge baisse, mettez un scotch dessus.

gripho Premium

Le 13 mai à 13h33

Encore une belle illustration de la loi de Goodhart oui

fred42 Premium

Le 13 mai à 10h30

Les auteurs de l’étude estiment que les 20 % des développeurs les plus économes en tokens génèrent en moyenne 11 modifications de code validées et intégrées aux projets (pull request fusionnées) pour 3 dollars par tokens sur un trimestre. Les 20 % des plus gros consommateurs en comptabilisent en moyenne 23, mais la facture est de 1 822 dollars.

Consommer plus de tokens permet effectivement de produire davantage, mais le coût unitaire se révèle bien plus élevé.

Si payer, 1819 $ par trimestre, permet de plus que doubler la productivité (mesurée en modifications de codes validées), ça reste très rentable par rapport au coût d'un employé supplémentaire qui coûtera bien plus de 603 $ par mois.

J'ai donc du mal avec cette conclusion :

Dans ces conditions, un usage modéré et raisonnable de l’IA semble bien plus indiqué que de forcer une consommation poussée à l’extrême.

kampuchea Premium

Le 13 mai à 12h02

le point est que c'est un prix au coût actuel des tokens. On sait que le prix devrait grimper dans les prochains mois entre un x2 (Anthropic admet par exemple financer 50% des tokens actuellement utilisés) et un x10 pour les plus pessimistes. La piste du x5 est communément admise.

Le +25% sur Kimi chez Moonshot ou la disparition de Claude Code de leur abonnement à 20€ (imposant de prendre l'abonnement à 100€/mois) sont des premiers frémissements de cette tendance.

La rentabilité existe aujourd'hui mais elle risque de se transformer rapidement en dépendance et de devenir une perte quand les tarifs augmenteront sérieusement.

white_tentacle Premium

Le 13 mai à 14h16

Même à ×5, ça reste discutable. 3000$ par mois, c’est pas le prix d’un dev chargé en France. Du coup, pareil, j’ai du mal avec la conclusion de l’étude.

kampuchea Premium

Le 13 mai à 15h19

pour quel gain de productivité en delivery  ? Doubler la productivité des codeurs, c'est comme quand on les évaluait à la ligne de code ; un non-sens.

Dans l'article on parle de nombre de PR. Bah c'est un peu le sujet de discussion du moment, le review bottleneck qui vient effacer ces gains de productivités (un exemple : https://www.alexcloudstar.com/blog/ai-code-review-bottleneck-2026/)

Et sans même parler de la review bottleneck, les mesures de delivery et de qualité (étude DORA de Google) laissent à désirer.

Bref, 3000$ par mois, c'est cher payé pour pour 15-20% de productivité en plus (chiffres internes à ma propre société, l'étude DORA de 2024 parlait carrément d'une perte de productivité de 1,5%)

white_tentacle Premium

Le 13 mai à 22h34

Dans l’ensemble, je suis plutôt d’accord avec toi, la métrique est mauvaise, et les effets positifs du dev assité par ia ne sont vraisemblablement pas si nets que ça. Mais ce que soulignait Fred42, et que je partage totalement, c’est que la conclusion de l’étude n’est pas du tout cohérente avec les chiffres qu’elle donne.

La seule conclusion qu’on peut tirer d’une telle étude, c’est qu’elle est biaisée.

deathscythe0666 Premium

Le 14 mai à 16h31

J'attends toujours de voir le PIB mondial bondir de 30% vu les chiffres (source : trust me bro) qu'on nous balance à longueur de journée. Pour l'heure, hors des ventes de GPU (actuellement entassés dans des hangars et en attente des milliards de GW de datacenters spatiaux qui fonctionnent à l'énergie libre), j'ai peu vu (sachant que l'inflation due à la guerre en Iran pourra masquer un peu la dèche).

aaaa

Le 13 mai à 15h46

S'il va bien y avoir un rattrapage sur les prix cette année, la tendance reste à un doublement de l'efficacité tout les 24 mois.
Donc même avec un x10 aujourd'hui, ce sera complètement effacé dans 10 ans.

toma Premium

Le 18 mai à 19h47

Je pense que c'est parce qu'on peut faire le calcul suivant :
3 / 11 = 0.27€/pull request
1822 / 23 = 79.21€/pull request

Après, il manque une donnée pour vraiment se faire un avis :
Quelle est la moyenne trimestrielle de pull request sans IA ?

fred42 Premium

Modifié le 19 mai à 13h42

C'est idiot comme calcul : l'IA est minoritaire dans le coût, c'est le développeur qui est représente l'essentiel du coût.

Si l'on prend le pull request comme indicateur de productivité (ce qui est discutable, mais c'est le présupposé) il faut regarder l'ensemble des coûts pour voir si l'IA est rentable ou pas.

deathscythe0666 Premium

Le 19 mai à 12h36

ce qui est discutable

Oui, carrément, pour ne pas dire totalement stupide.