Connexion Premium

Quand l’IA agentique coûte plus cher que de payer ses employés humains

Alors que les entreprises se tournent vers l’IA agentique pour booster leur productivité, mais que les agents sont de plus en plus facturés en fonction du nombre de tokens utilisés, et non plus sous forme d’abonnement forfaitaire, il devient plus coûteux de payer l’IA que des employés, relève Fortune.

Ce qui pourrait compliquer les projets de ces entreprises vantant un avenir « agentique », alors que Jensen Huang, le PDG de Nvidia, a récemment déclaré qu’il pensait qu’un jour, 100 agents IA travailleraient aux côtés de chaque employé de son entreprise.

Cette incitation pressante à recourir à l’IA agentique s’est traduite par une nouvelle pratique, et expression, le « tokenmaxxing », visant non pas tant à produire plus de code utile qu’à faire croire à ses N+1 que l’on serait surproductif, en générant artificiellement de l’activité IA afin d’améliorer ses statistiques.

Une pratique encouragée par certaines entreprises, Amazon ayant par exemple fixé comme objectif de dépasser le seuil des 80 % de développeurs utilisant l’IA chaque semaine, tout en suivant la consommation de tokens de ses employés. Un tableau de bord interne chez Meta attribuait même des statuts de « Token Legend » aux employés en consommant le plus.

À mesure que la consommation augmente, le coût unitaire des tokens « devrait chuter de manière spectaculaire », avance Fortune. Un récent rapport de Gartner estime que d’ici 2030, l’inférence sur un LLM hautement sophistiqué pourrait coûter 90 % de moins qu’en 2025.

Gartner prévoit néanmoins que cela ne se traduira pas par une baisse du coût total de l’IA, les modèles agentiques nécessitant bien plus de jetons par tâche que les modèles standards. Si la consommation de jetons augmente plus vite que la baisse des coûts unitaires, le coût total risque dès lors d’augmenter, voire de devenir insoutenable.

Microsoft, qui avait invité en décembre dernier des milliers de ses développeurs à utiliser Claude Code, vient par exemple d’annuler ses licences et de leur demander de passer par GitHub Copilot CLI, indiquait récemment The Verge.

Fin avril, Microsoft avait lui-même restreint la souscription de nouveaux abonnements individuels à GitHub Copilot, annonçant passer en juin à une tarification basée sur l’usage réel, en fonction du volume de tokens consommé.

Fortune relève que Praveen Neppalli Naga, le CTO d’Uber, avait déclaré avoir brûlé l’intégralité de son budget IA 2026 en seulement quatre mois. « Pour mon équipe, le coût de la puissance de calcul dépasse de loin celui des salaires des employés », a de son côté déclaré Bryan Catanzaro, vice-président chargé de l’apprentissage profond appliqué chez Nvidia.

Commentaires (5)

votre avatar
Ok, l'IA agentique coute plus cher qu'un humain, mais si elle travaille mieux et plus vite, les entreprises sont quand même gagnante non ? :troll:
votre avatar
Faites entrer les clowns ! 😹
votre avatar
L'éternel recommencement. On avait (a toujours) le même problème avec le Cloud non maîtrisé et les souscriptions qui coûtent vite une blinde.

Et avec ces histoires d'objectifs d'usage qui démontrent la débilité profonde des dirigeants de ces entreprises, ça ne va pas s'arranger. Mettre des objectifs sur l'usage d'une techno a autant d'intérêt qu'un livret A, mais bon...
votre avatar
J'aimerai bien comprendre à partir de quand cela devient rentable d'investir dans une machine pour faire tourner des agents en local et quel type de config/budget est le plus adapté? Il semble facile de cramer quelques centaines d'€ en une journée avec un workflow soutenu. Est-ce qu'un pc avec du matos optimisé à 5000-10 000€ ne devient pas plus rentable sur le moyen-terme?
votre avatar
C'est possible à priori pour moitié moins que ça en bidouillant un peu. Quelqu'un a fait un post à ce sujet sur linuxfr : https://linuxfr.org/users/jflesch/journaux/auto-heberger-ses-ia