OpenAI et Anthropic envisageraient de casser les prix des tokens

Le 12 juin à 08h32

3 min

IA et algorithmes

Le secteur de l’IA se dirige-t-il vers une guerre des prix du token ? Les deux principaux labos IA dans le paysage, OpenAI et Anthropic, envisageraient en effet une baisse du tarif du jeton, au grand bénéfice des consommateurs – mais probablement moins de la marge de profit des deux entreprises. Selon l’analyste Ed Zitron, en l’état actuel, les « utilisateurs peuvent dépenser entre 8 et 13,50 dollars pour chaque dollar de leurs revenus d’abonnement ».

Les utilisateurs grand public voient surtout les modèles d’IA à travers le prix d’un abonnement mensuel, quitte à se heurter parfois à des limites d’usage. Pour les entreprises, l’angle est très différent. Derrière chaque requête adressée à GPT ou Claude se cache une consommation de tokens qui finit par apparaître sur les factures. Les organisations qui se servent des modèles d’Anthropic ont d’ailleurs pu s’en apercevoir ces dernières semaines avec Opus 4.7 et suivants. Et à mesure que les usages se multiplient, les dépenses s’alourdissent.

Droit

#Nextquick Une simple requête à ChatGPT, c’est déjà des centaines de milliards de calculs

Droit

Vendredi 16 janvier 2026 à 10h45 16/01/2026 10h45

21

Les budgets ne sont pas extensibles à l’infini. Le directeur technique d’Uber s’était étonné d’avoir explosé son budget IA de l’année… en seulement quatre mois. À cela s’ajoute la pratique du tokenmaxxing, utilisée par les employés de certaines entreprises pour gonfler inutilement leur consommation de jetons et ainsi, se faire bien voir de leur direction. Amazon a récemment fait fermer un classement pour limiter les abus.

Pendant ce temps, OpenAI et Anthropic ramassent la mise, enfin, façon de parler : les deux entreprises sont encore loin d’être rentables. Chaque token facturé génère certes des revenus, mais ceux-ci peinent encore à compenser les coûts colossaux des centres de données, des puces et du développement de nouveaux modèles. Et pourtant, les deux labos rivaux envisageraient de baisser le prix du token.

Sam Altman a expliqué lors d’un événement relaté par le Wall Street Journal que le coût du token était un « gros problème » : « Je pense que nous trouverons de nombreuses façons de permettre à nos clients d’en faire plus tout en dépensant moins ». Le patron d’OpenAI anticiperait une baisse des prix du token chez Anthropic, dont les produits – notamment Claude Code – sont devenus des outils du quotidien dans de nombreuses entreprises. OpenAI a riposté avec Codex, mais elle a pris du retard.

Le hic, c’est qu’une éventuelle guerre tarifaire pourrait satisfaire les clients, mais elle retarderait encore davantage la perspective de bénéfices pour les deux sociétés qui s’apprêtent à entrer en Bourse. Et à force de se courir après, les services d’OpenAI et d’Anthropic courent le risque de devenir interchangeables, en se différenciant uniquement sur les tarifs.

Mickael Bazoge

Le 12 juin à 08h32

Commentaires (32)

Abonnez-vous pour prendre part au débat

Cet article est en accès libre, mais il est le produit d'une rédaction qui ne travaille que pour ses lecteurs, sur un média sans pub et sans tracker. Soutenez le journalisme tech de qualité en vous abonnant.

Accédez en illimité aux articles d'un média expert

Profitez d'au moins 1 To de stockage pour vos sauvegardes

Intégrez la communauté et prenez part aux débats

Partagez des articles premium à vos contacts

Abonnez-vous

fdorin Premium

Le 12 juin à 08h48

Donc, si je comprends bien, si on veut que le système soit à l'équilibre (même pas rentable, juste à l'équilibre), il faudrait multiplier le prix par 8 à 13,5. Au lieu de ça, ils vont diminuer les prix.

Je me demande vraiment ce qui pourrait mal se passer... /sacarsme

tipaul Premium

Le 12 juin à 08h57

et pendant ce temps là, il semble que l'introduction de spaceX/Xai/X/muskcorp soit un succès avec une demande de 4x l'offre.

Oui, vraiment, qu'est-ce qui pourrait mal se passer ?

Aqua Premium

Le 12 juin à 09h04

Ah parfois la différence entre stratège de génie qui va vendre au bon moment et pigeon qui se retrouve avec la patate chaude est assez faible. Rien de nouveau

Inodemus

Modifié le 13 juin à 08h21

4x peut-être pas, y a eu une grosse hausse la 1ère minute de cotation, puis ça s'est pas mal calmé pour atteindre +30% puis redescendre lentement à+20% en fin de journée. Au final c'est plutôt un succès pour le moment, mais pas une explosion. On verra les prochains jours, là il n'y a eu qu'une 1/2 journée de cotation.

Après j'ai l'impression qu'ils abandonnent un peu la course avec les autres sur les performances de leur modèle, pour se recycler vers la mise à disposition de puissance de calcul à leurs (anciens) concurrents, ceux qui justement veulent ici baisser leurs prix sans baisser leurs coûts. Ce qui les rapproche plus du vendeur de pioches avec des revenus stables et des investissements plus maîtrisés que de l'incertitude de celui qui cherche l'or. Et l'IA n'est qu'une partie de leur activité.

DetunizedGravity Premium

Le 12 juin à 09h05

Si je comprends bien la dynamique, le but officiel est d'augmenter les usages pour justifier les milliards en cours d'investissement dans les infrastructures et réussir un passage a l'échelle qui rendrait le modèle viable. Dit autrement le but d'une éventuelle guerre des prix est de permettre au marché de continuer à augmenter en taille pour rassurer les investisseurs.

MisterDams Premium

Modifié le 12 juin à 09h32

C'est le nouveau fonctionnement économique mondial centré sur la startup : on grandit d'abord, on voit pour l'argent ensuite. Ça permet de faire du dumping pour étouffer la concurrence dès le départ et qu'elle ne puisse arriver que quand l'entreprise est déjà trop grosse pour perdre son leadership.

C'est comme ça qu'Uber s'est développé, rien n'était rentable dans la quasi totalité des pays, mais ils voulaient créer le "réflexe Uber" à la sortie de l'avion n'importe où dans le monde. Aujourd'hui, c'est devenu quasiment une antonomase synonyme de "taxi" dans le langage courant. D'ailleurs, Uber a aussi grandit si vite que la législation sur le droit du travail ne l'a rattrapé que bien plus tard avec la notion d'uberisation.

On peut citer aussi Netflix, Spotify...

Furanku Premium

Le 12 juin à 10h00

Et Amazon en premier lieu. Limite comme des précurseurs de la chose.

MisterDams Premium

Le 12 juin à 10h37

Effectivement, j'ai oublié Amazon !

Après Amazon est un peu différent, car ils jouent sur plusieurs secteurs en même temps entre la logistique et le Cloud. Il me semble qu'AWS a permis d'assurer une grande partie du financement des activités Amazon "delivery" sans organiser autant de levées de fonds que ce qu'on constate aujourd'hui avec l'IA.

Aqua Premium

Modifié le 12 juin à 09h07

Avant la vision des investisseurs chez Uber, Netflix et autre (ex)-startup c'était "on investit massivement pour détruire la concurrence et ensuite une fois que le marché est captif on monte les prix et/ou on vend."
Au moins on savait à quoi s'attendre.

là je suis plus très sûr que les types sachent comment eux-mêmes pourront s'en sortir (sans parler de nous autres péquins moyens dont ils ont rien à carrer).

Gamble

Le 12 juin à 10h11

Aller en bourse, rafler la mise et filer la grenade dégoupillée aux petits investisseurs qui perdront tout quand ça s'effondrera

Patch Premium

Le 12 juin à 10h12

S'ils vendent au bon moment, ils gagneront sur tous les fronts. Sinon... Ils seront "victimes" de leurs propres décisions.

fdorin Premium

Le 12 juin à 10h16

"on investit massivement pour détruire la concurrence et ensuite une fois que le marché est captif on monte les prix et/ou on vend."

La vision start-up, ce n'était pas spécialement de détruire la concurrence (car il n'y en avait pas), mais plutôt d'inonder rapidement le marché pour ne pas laisser de place à la concurrence future, via un effet réseau/réputation/etc.

Là, il y a de la concurrence. Forte même. Et vu les sommes en jeu, chercher à couler la concurrence ne peut se faire qu'en se ruinant soit même. Et ils continuent de trouver des investisseurs. Je me dis qu'il y a vraiment quelque chose qui ne tourne pas rond dans le monde actuel...

SebGF Premium

Le 12 juin à 10h35

Et vu les sommes en jeu, chercher à couler la concurrence ne peut se faire qu'en se ruinant soit même

Ce qui est effectivement le cas vu la quantité de leurs bénéfices qu'ils injectent dans ces investissements.

Aqua Premium

Le 12 juin à 10h58

La vision start-up, ce n'était pas spécialement de détruire la concurrence (car il n'y en avait pas), mais plutôt d'inonder rapidement le marché pour ne pas laisser de place à la concurrence future, via un effet réseau/réputation/etc.

Oé...
Netflix et Airbnb passe encore, ils sont arrivés en terrain vierge à peu près.

Booking a détruit les sites de réservation qui existaient (B&Bn Gîtes, etc...) et l'autonomie des hôtels.
Uber & co ont détruit le marché des petites entreprises de livraison
Amazon idem. C'est pas comme si on se faisait pas déjà livrer avant.

Chaque vendeur sur Etsy qui copie avec de l'IA un truc artisanal créé/inventé avec des vrais neurones et des vraies petites mains fait la même chose. Couper l'herbe sous le pied, raffler la clientelle, vendre du caca.

MisterDams Premium

Modifié le 12 juin à 09h23

Tout dépend de comment tout ça va évoluer.

A mon avis, on va pas tarder à voir à se déployer fortement le on device pour déléguer une partie des tâches chez l'utilisateur via les NPU et des modèles légers. Cette partie du traitement ne coûtera rien à exploiter pour ceux qui semblent désormais s'appeler les MANGOS (Meta, Anthropic, nVidia, Google, OpenAI, SpaceX).

Ils pourront aussi optimiser via les modèles embarqués les requêtes complexes envoyées aux serveurs pour assurer les mêmes qualité de réponses pour beaucoup moins de consommation. Et là je pense que le coût réel du token va chuter drastiquement sans qu'ils aient à baisser beaucoup le prix.

C'est un peu l'approche de Google (Gemini Nano à 2,7 milliards de paramètres) et c'est la direction que prend aussi Apple Intelligence (AFM 3 Core Advanced annoncé avec 20 milliards de paramètres activables par lots de 1 à 4 milliards).

C'est pas innocent qu'on nous sorte des RTX Spark à 1 pétaflops comme la nouvelle norme...

Arkeen Premium

Le 12 juin à 15h17

A mon avis, on va pas tarder à voir à se déployer fortement le on device pour déléguer une partie des tâches chez l'utilisateur via les NPU et des modèles légers.

J'entends l'argument, mais même les modèles locaux demandent pas mal de puissance, et au vu de l'envolée stratosphérique du prix des composants, même faire tourner un modèle en local va demander un sacré investissement ...

À moins éventuellement d'optimiser et de spécialiser très fort les modèles, mais ça ne semble pas être le cas actuellement.

TheKillerOfComputer

Le 13 juin à 23h11

Comment ? Tu n'es pas en capacité d'acquérir ce genre de machines pour un modèle local en CPU ?

bingo.crepuscule Premium

Le 12 juin à 10h13

D'autant plus que c'est une grosse blague cette histoire, les coûts ont explosé ces derniers mois. Au lieu d'augmenter les tarifs ils ont drastiquement limités les usages, ce qui revient strictement au même.

Tout ça c'est du marketing bullshit, diviser les usages sur les abonnements par 5 pour ensuite dire qu'il vont diviser le prix par deux (au pif), ça ne s'appelle pas casser les prix, ça s'appelle prendre les gens pour des cons et faire passer des vessies pour des lanternes.

dyfuge Premium

Le 19 juin à 22h41

J'ai lu la source de la source, qui explique que Claude avec l'abonnement à 100$/mois équivaut à 1354$ via l'API. Ce n'est pas du tout le ratio entre le coût de l'abonnement et le coût "réel" d'inférence

darkjack Premium

Le 12 juin à 09h09

Géniale le dessin de Flock

SebGF Premium

Le 12 juin à 09h17

Le domaine de l'IA est vraiment un accélérateur pour tout. Il réussi en deux ou trois ans à faire ce que le tout Cloud et le tout SaaS ont fait en dix :

Frénésie move to Cloud et SaaS first

Se rendre compte après 10 ans que finalement, ça coûte super cher (surtout parce que non maîtrisé) avec une plus value non démontrée (rappelez vous le discours : vous n'aurez plus besoin d'admin système - c'est vrai, désormais faut une armée d'admin Cloud)

Retourner au on-premise

Ici :

2023 : Faut mettre de l'IA partout !

2026 : Bon, en fait ça coûte cher, allez-y mollo...

gg40

Le 12 juin à 11h30

Marrant je viens de refaire, ce matin, un comparo rapide cloud/baremetal (car j'en ai un peu marre de gérer du matériel) et on est encore sur du 5 fois plus cher pour le cloud :(

imfromtatooine

Modifié le 12 juin à 10h01

Je suis consultant IT (architecture) et ce qui me terrifie c'est le manque d'anticipation de la "merdification" à venir chez mes clients. Tout le monde se jette à corps perdu dans une totale dépendance aux LLMs et donc à quelques acteurs Américains. Plus personne ne forme de juniors, plus personne n'investit dans quoi que ce soit d'autre.

Mais quand le marché sera bien verrouillé et que les gentils investisseurs vont exiger une marge plutôt que de la croissance, quand les services vont devenir moins bien et plus chers, les DSI vont tous se retrouver captifs d'une prison qu'ils auront construite eux-même sans rien anticiper.

On a vraiment un problème de niveau des soit-disant élites, c'est impressionnant.

Patch Premium

Le 12 juin à 10h14

Et c'est systématique, quelque soit le sujet, avec eux.

Grutorel Premium

Le 12 juin à 10h20

Je rajoute l’aspect "magique" des LLM. tu fais des prompts, ils te donnent des infos, du code, des docs. Super. On a complétement perdu la vision de qui possède les données, qui peut les lire et les utiliser. La souveraineté d'un entreprise, son savoir-faire, son "idéal" a disparu au profit de géant américain....
Quand je parle de monter des modèles locaux sur des serveur stocker dans l'entreprise, de suite on me parle de cout financier alors que l'on devrais parler de cout "légitime".
Bref, c'est une bulle qui risque de faire mal aux entreprises devenu trop accro et oubliant les bases d'une société: son savoir-faire.

hypo Premium

Le 12 juin à 10h24

Comme on se le dit avec mes collègues:
"Eux, ils savent..."

potn Premium

Le 12 juin à 10h27

Le problème aussi, c'est qu'une entreprise (par exemple une ESN) qui oserai prendre la chose à contre-pied va se retrouver moins compétitive que les autres et va donc faire faillite, alors que c'est celle qui tiendrai sur le long terme...

MisterDams Premium

Modifié le 12 juin à 11h28

Elle est là la question : depuis quand le long terme (ré)intéresse les entreprises ?

Labsyb Premium

Le 12 juin à 13h09

Arrêtez de psychoter. De gémir. D’ergoter.
Tout va bien se passer. L’humanité entre dans une nouvelle ère.
Et vous, vous avez peur, vous avez les jetons. Vous tremblez.
Alors qu’il suffit de se laisser porter.
En vérité je vous le dis : nous allons tous prospérer, l’être humain se transforme déjà en sa future vibrance. Tiens il se raconte qu’une deuxième queue va pousser entre les jambes des uns tandis qu’un deuxième vagin se creuse chez les autres. J’y crois.
Nous allons bientôt jouir doublement.
Et ça tombe bien, il n’y aura plus que ça à faire. Car tout le reste sera pris en charge par l’intelligence artificielle. Celle que nous avons créée. Celle qui va nous servir. Celle qui va nous libérer de toutes ces contingences.
Celle que nous devons plébisciter.
Le monde peut brûler.
Elle est désormais là pour le sauver.
Alors arrêtez de geindre.
Vivez cette métamorphose comme une bénédiction.
Car en vérité je vous le dis : vous serez tous délivrés du mal.

En attendant, pour accélérer votre voyage vers ce futur radieux, n’hésitez pas à créditer mon compte. Je vous le garantie : vous ne regretterez pas.

Mhon Premium

Le 12 juin à 14h14

Oui, j'ai peur. J'ai les jetons, à fond.
C'est ma manière à moi de faire du tokenmaxxing.

TexMex Premium

Modifié le 12 juin à 14h13

Comme le dit @fdorin ... tout est normal.

Toutefois je ne vois aucune entreprise se lancer la dedans sans espoir de rafler la mise ou d'un gain. Et on voit tout un tas de DSI se jeter dedans. Ce que dit @imfromtatooine .

Du coup la bonne question est : Qu'est qui insuffle ce comportement de cassage de prix ? On est d'accord que ça n'a ni queue ni tête vu de loin.

On sait que l'état américain est derrière. Comme bien d'autres fois sur d'autres marchés... comme le PC... Mais cet état, aussi puissant soit il, ne peut pas le faire sans avoir un minimum de sécurité derrière (lui aussi). Ça c'est les assureurs.

Parce qu'on est certains d'un truc. L'IA n'est pas rentable et avec ceci, elle le sera moins. On dit ça à un entrepreneur/investisseur, il te dit d'aller jouer avec tes crottes de nez. Alors pourquoi ?

Il nous manque un gros morceau en fait. La farandole de redistribution entre les acteurs du jeu (AMD, NVIDA, etc.) n'est peut-être que le tout petit bout de l'iceberg.

Quand un truc beaucoup plus gros pète, ça donne quoi ? L'effet de vague pourrait bien sévèrement faire de la misère.

Si c'est seulement économique c'est vraiment chelou. Si c'est de séquestrer les savoirs-faire. Les dégâts sont déjà là. Chez les étudiants par exemple ou les gosses (2 et 2 ! -attend je demande à ChatGPT...) . Et là c'est pire. Dés-apprendre prend 10 fois moins de temps... Et ça nous emmène sur le plan géopolitique (Bourdieu mon amour).

brazomyna

Modifié le 13 juin à 12h50

Un serveur, 8x H200, c'est environ 300k€. C'est largement à portée de portefeuille d'une simple PME. Et ça couvre tout aussi largement la plupart des besoins.

L'investissement n'est pas déconnant pour avoir sa capacité IA on-premise, et sécuriser ainsi son "approvisionnement".

Encore faut-il savoir ce qu'on en fait et comment on l'insère de façon adéquate dans l'activité ; element critique qui déterminera le ROI. Et c'est plus souvent là que ça pêche.

S'abonner à

OpenAI et Anthropic envisageraient de casser les prix des tokens

#Nextquick Une simple requête à ChatGPT, c’est déjà des centaines de milliards de calculs

Commentaires (32)

Cet article est en accès libre, mais il est le produit d'une rédaction qui ne travaille que pour ses lecteurs, sur un média sans pub et sans tracker. Soutenez le journalisme tech de qualité en vous abonnant.

Signaler un commentaire