Connexion Premium

Tokenmaxxing : quand les salariés d’Amazon brûlent des tokens pour se faire bien voir

La course au token

Tokenmaxxing : quand les salariés d’Amazon brûlent des tokens pour se faire bien voir

Illustration : Flock

Des salariés d’Amazon utilisent un outil maison équivalent à OpenClaw pour brûler des tokens et générer artificiellement de l’activité IA pour éviter de mauvaises évaluations. Ce phénomène du « tokenmaxxing » n’est pas propre à Amazon.

Les entreprises qui investissent lourdement dans l’IA générative poussent leurs employés à utiliser cette technologie au quotidien, ne serait-ce que pour justifier les sommes ahurissantes mises sur la table pour développer des modèles et faire pousser les centres de données. Amazon en fait partie : le géant du commerce en ligne a ainsi annoncé 200 milliards de dépenses d’investissement (capex) pour 2026 : il faut prouver que tout cet argent sert à quelque chose et les salariés sont mis à contribution.

Amazon a lancé il y a quelques semaines un nouvel outil interne, MeshClaw, qui fonctionne sur le même principe qu’OpenClaw. Il permet de déployer des agents IA pour accomplir des tâches au nom de l’utilisateur : MeshClaw peut ainsi trier des courriels, interagir dans la messagerie Slack, déployer du code, surveiller des apps ou encore exécuter des tâches répétitives.

Le Financial Times rapporte que certains salariés d’Amazon font tourner MeshClaw non pas parce qu’ils en ont besoin, mais pour générer artificiellement de l’activité IA et améliorer leurs statistiques.

Si les stats d’utilisation de tokens IA ne sont pas censées servir à l’évaluation des performances des salariés d’Amazon, plusieurs d’entre eux ressentent une pression très forte pour les intégrer dans leur travail. L’entreprise a fixé des objectifs ambitieux : dépasser le seuil des 80 % de développeurs utilisant l’IA chaque semaine. La direction aurait aussi commencé à suivre la consommation de tokens dans des classements internes.

« Les managers regardent ces chiffres », affirme un employé sous le sceau de l’anonymat. « À partir du moment où l’usage est surveillé, ça crée des effets pervers et certaines personnes deviennent très compétitives là-dessus. » À cela s’ajoutent des craintes concernant l’autonomie assez large donnée aux agents MeshClaw, qui a accès à des outils internes sensibles. Ce qui ouvre la porte à des erreurs pouvant provoquer de sérieux incidents.

Le nouveau Graal de la Silicon Valley

Ce phénomène du « tokenmaxing » n’est pas circonscrit à Amazon. De nombreuses entreprises ont des objectifs d’usage de l’IA, ce qui peut déboucher sur des abus. Un tableau de bord interne chez Meta attribuait des statuts (« Token Legend ») aux employés qui consommaient le plus de tokens. Ce classement, développé par un employé sans l’aval du groupe, a été retiré depuis… même s’il existe un tableau de bord officiel qui suit l’usage de l’IA au global (pas uniquement la consommation de tokens).

Une étude réalisée par Jellyfish publiée le mois dernier remettait en cause cette idée très répandue dans la Silicon Valley (et ailleurs) que les gains de productivité sont liés à la consommation de tokens IA. Les auteurs ont analysé les usages de 12 000 développeurs répartis dans 200 entreprises au premier trimestre 2026.

Le premier enseignement, c’est qu’il existe une grande disparité dans la consommation de tokens : un développeur « médian » utilise environ 51 millions de tokens par mois, quand les 10 % des plus gros consommateurs dépassent les 380 millions de tokens mensuels. Une consommation massive qui coûte très cher, environ 52 dollars par mois pour un utilisateur moyen selon les tarifs de l’API Claude, mais près de 700 dollars par mois pour les plus gros utilisateurs.

C’est le rapport coût/productivité qui est le plus intéressant ici. Les développeurs qui consomment énormément de tokens produisent effectivement davantage de code, et même s’il est correct, il nécessite davantage de travail : plus d’allers-retours, plus de supervision humaine, plus de corrections, et au bout du compte plus d’abandon de code. Tout cela fait grimper la facture bien plus vite que la productivité gagnée.

Les auteurs de l’étude estiment que les 20 % des développeurs les plus économes en tokens génèrent en moyenne 11 modifications de code validées et intégrées aux projets (pull request fusionnées) pour 3 dollars de tokens sur un trimestre. Les 20 % des plus gros consommateurs en comptabilisent en moyenne 23, mais la facture est de 1 822 dollars.

Consommer plus de tokens permet effectivement de produire davantage, mais le coût unitaire se révèle bien plus élevé. L’étude dresse une comparaison intéressante : les tokens ressemblent à du carburant de fusée. On peut aller plus vite mais chaque gain supplémentaire nécessite énormément plus de ressources. Dans ces conditions, un usage modéré et raisonnable de l’IA semble bien plus indiqué que de forcer une consommation poussée à l’extrême.

Commentaires (14)

votre avatar
Le premier enseignement, c’est qu’il existe une grande disparité dans la consommation de tokens : un développeur « médian » utilise environ 51 millions de tokens par mois, quand les 10 % des plus gros consommateurs dépassent les 380 millions de tokens mensuels.
Une métrique intéressante sur l'usage des modèles pour mesurer leur coût par employé.

Pour le reste, voilà ce qui se passe quand le management marche à coup d'OKR / PKI éclatés au sol et déconnectés de réels objectifs.
L'IA en entreprise (et pas que) n'est qu'un miroir à la gloire de la stupidité naturelle.
votre avatar
"Quand une mesure devient un objectif, elle cesse d'être une mesure pertinente"
votre avatar
Si la jauge baisse, mettez un scotch dessus.
votre avatar
Encore une belle illustration de la loi de Goodhart oui
votre avatar
Les auteurs de l’étude estiment que les 20 % des développeurs les plus économes en tokens génèrent en moyenne 11 modifications de code validées et intégrées aux projets (pull request fusionnées) pour 3 dollars par tokens sur un trimestre. Les 20 % des plus gros consommateurs en comptabilisent en moyenne 23, mais la facture est de 1 822 dollars.
Consommer plus de tokens permet effectivement de produire davantage, mais le coût unitaire se révèle bien plus élevé.
Si payer, 1819 $ par trimestre, permet de plus que doubler la productivité (mesurée en modifications de codes validées), ça reste très rentable par rapport au coût d'un employé supplémentaire qui coûtera bien plus de 603 $ par mois.

J'ai donc du mal avec cette conclusion :
Dans ces conditions, un usage modéré et raisonnable de l’IA semble bien plus indiqué que de forcer une consommation poussée à l’extrême.
votre avatar
le point est que c'est un prix au coût actuel des tokens. On sait que le prix devrait grimper dans les prochains mois entre un x2 (Anthropic admet par exemple financer 50% des tokens actuellement utilisés) et un x10 pour les plus pessimistes. La piste du x5 est communément admise.

Le +25% sur Kimi chez Moonshot ou la disparition de Claude Code de leur abonnement à 20€ (imposant de prendre l'abonnement à 100€/mois) sont des premiers frémissements de cette tendance.

La rentabilité existe aujourd'hui mais elle risque de se transformer rapidement en dépendance et de devenir une perte quand les tarifs augmenteront sérieusement.
votre avatar
Même à ×5, ça reste discutable. 3000$ par mois, c’est pas le prix d’un dev chargé en France. Du coup, pareil, j’ai du mal avec la conclusion de l’étude.
votre avatar
pour quel gain de productivité en delivery  ? Doubler la productivité des codeurs, c'est comme quand on les évaluait à la ligne de code ; un non-sens.

Dans l'article on parle de nombre de PR. Bah c'est un peu le sujet de discussion du moment, le review bottleneck qui vient effacer ces gains de productivités (un exemple : https://www.alexcloudstar.com/blog/ai-code-review-bottleneck-2026/)

Et sans même parler de la review bottleneck, les mesures de delivery et de qualité (étude DORA de Google) laissent à désirer.

Bref, 3000$ par mois, c'est cher payé pour pour 15-20% de productivité en plus (chiffres internes à ma propre société, l'étude DORA de 2024 parlait carrément d'une perte de productivité de 1,5%)
votre avatar
Dans l’ensemble, je suis plutôt d’accord avec toi, la métrique est mauvaise, et les effets positifs du dev assité par ia ne sont vraisemblablement pas si nets que ça. Mais ce que soulignait Fred42, et que je partage totalement, c’est que la conclusion de l’étude n’est pas du tout cohérente avec les chiffres qu’elle donne.

La seule conclusion qu’on peut tirer d’une telle étude, c’est qu’elle est biaisée.
votre avatar
J'attends toujours de voir le PIB mondial bondir de 30% vu les chiffres (source : trust me bro) qu'on nous balance à longueur de journée. Pour l'heure, hors des ventes de GPU (actuellement entassés dans des hangars et en attente des milliards de GW de datacenters spatiaux qui fonctionnent à l'énergie libre), j'ai peu vu (sachant que l'inflation due à la guerre en Iran pourra masquer un peu la dèche).
votre avatar
S'il va bien y avoir un rattrapage sur les prix cette année, la tendance reste à un doublement de l'efficacité tout les 24 mois.
Donc même avec un x10 aujourd'hui, ce sera complètement effacé dans 10 ans.
votre avatar
Je pense que c'est parce qu'on peut faire le calcul suivant :
3 / 11 = 0.27€/pull request
1822 / 23 = 79.21€/pull request

Après, il manque une donnée pour vraiment se faire un avis :
Quelle est la moyenne trimestrielle de pull request sans IA ?
votre avatar
C'est idiot comme calcul : l'IA est minoritaire dans le coût, c'est le développeur qui est représente l'essentiel du coût.

Si l'on prend le pull request comme indicateur de productivité (ce qui est discutable, mais c'est le présupposé) il faut regarder l'ensemble des coûts pour voir si l'IA est rentable ou pas.
votre avatar
ce qui est discutable
Oui, carrément, pour ne pas dire totalement stupide.