Connexion Premium

OpenAI et Anthropic envisageraient de casser les prix des tokens

Le secteur de l’IA se dirige-t-il vers une guerre des prix du token ? Les deux principaux labos IA dans le paysage, OpenAI et Anthropic, envisageraient en effet une baisse du tarif du jeton, au grand bénéfice des consommateurs – mais probablement moins de la marge de profit des deux entreprises. Selon l’analyse Ed Zitron, en l’état actuel, les « utilisateurs peuvent dépenser entre 8 et 13,50 dollars pour chaque dollar de leurs revenus d’abonnement ».

Les utilisateurs grand public voient surtout les modèles d’IA à travers le prix d’un abonnement mensuel, quitte à se heurter parfois à des limites d’usage. Pour les entreprises, l’angle est très différent. Derrière chaque requête adressée à GPT ou Claude se cache une consommation de tokens qui finit par apparaître sur les factures. Les organisations qui se servent des modèles d’Anthropic ont d’ailleurs pu s’en apercevoir ces dernières semaines avec Opus 4.7 et suivants. Et à mesure que les usages se multiplient, les dépenses s’alourdissent.

Les budgets ne sont pas extensibles à l’infini. Le directeur technique d’Uber s’était étonné d’avoir explosé son budget IA de l’année… en seulement quatre mois. À cela s’ajoute la pratique du tokenmaxxing, utilisée par les employés de certaines entreprises pour gonfler inutilement leur consommation de jetons et ainsi, se faire bien voir de leur direction. Amazon a récemment fait fermer un classement pour limiter les abus.

Pendant ce temps, OpenAI et Anthropic ramassent la mise, enfin, façon de parler : les deux entreprises sont encore loin d’être rentables. Chaque token facturé génère certes des revenus, mais ceux-ci peinent encore à compenser les coûts colossaux des centres de données, des puces et du développement de nouveaux modèles. Et pourtant, les deux labos rivaux envisageraient de baisser le prix du token.

Sam Altman a expliqué lors d’un événement relaté par le Wall Street Journal que le coût du token était un « gros problème » : « Je pense que nous trouverons de nombreuses façons de permettre à nos clients d’en faire plus tout en dépensant moins ». Le patron d’OpenAI anticiperait une baisse des prix du token chez Anthropic, dont les produits – notamment Claude Code – sont devenus des outils du quotidien dans de nombreuses entreprises. OpenAI a riposté avec Codex, mais elle a pris du retard.

Le hic, c’est qu’une éventuelle guerre tarifaire pourrait satisfaire les clients, mais elle retarderait encore davantage la perspective de bénéfices pour les deux sociétés qui s’apprêtent à entrer en Bourse. Et à force de se courir après, les services d’OpenAI et d’Anthropic courent le risque de devenir interchangeables, en se différenciant uniquement sur les tarifs.

Commentaires (24)

votre avatar
Donc, si je comprends bien, si on veut que le système soit à l'équilibre (même pas rentable, juste à l'équilibre), il faudrait multiplier le prix par 8 à 13,5. Au lieu de ça, ils vont diminuer les prix.

Je me demande vraiment ce qui pourrait mal se passer... /sacarsme
votre avatar
et pendant ce temps là, il semble que l'introduction de spaceX/Xai/X/muskcorp soit un succès avec une demande de 4x l'offre.

Oui, vraiment, qu'est-ce qui pourrait mal se passer ?
votre avatar
Ah parfois la différence entre stratège de génie qui va vendre au bon moment et pigeon qui se retrouve avec la patate chaude est assez faible. Rien de nouveau
votre avatar
Si je comprends bien la dynamique, le but officiel est d'augmenter les usages pour justifier les milliards en cours d'investissement dans les infrastructures et réussir un passage a l'échelle qui rendrait le modèle viable. Dit autrement le but d'une éventuelle guerre des prix est de permettre au marché de continuer à augmenter en taille pour rassurer les investisseurs.
votre avatar
C'est le nouveau fonctionnement économique mondial centré sur la startup : on grandit d'abord, on voit pour l'argent ensuite. Ça permet de faire du dumping pour étouffer la concurrence dès le départ et qu'elle ne puisse arriver que quand l'entreprise est déjà trop grosse pour perdre son leadership.

C'est comme ça qu'Uber s'est développé, rien n'était rentable dans la quasi totalité des pays, mais ils voulaient créer le "réflexe Uber" à la sortie de l'avion n'importe où dans le monde. Aujourd'hui, c'est devenu quasiment une antonomase synonyme de "taxi" dans le langage courant. D'ailleurs, Uber a aussi grandit si vite que la législation sur le droit du travail ne l'a rattrapé que bien plus tard avec la notion d'uberisation.

On peut citer aussi Netflix, Spotify...
votre avatar
Et Amazon en premier lieu. Limite comme des précurseurs de la chose.
votre avatar
Effectivement, j'ai oublié Amazon !

Après Amazon est un peu différent, car ils jouent sur plusieurs secteurs en même temps entre la logistique et le Cloud. Il me semble qu'AWS a permis d'assurer une grande partie du financement des activités Amazon "delivery" sans organiser autant de levées de fonds que ce qu'on constate aujourd'hui avec l'IA.
votre avatar
Avant la vision des investisseurs chez Uber, Netflix et autre (ex)-startup c'était "on investit massivement pour détruire la concurrence et ensuite une fois que le marché est captif on monte les prix et/ou on vend."
Au moins on savait à quoi s'attendre.

là je suis plus très sûr que les types sachent comment eux-mêmes pourront s'en sortir (sans parler de nous autres péquins moyens dont ils ont rien à carrer).
votre avatar
Aller en bourse, rafler la mise et filer la grenade dégoupillée aux petits investisseurs qui perdront tout quand ça s'effondrera
votre avatar
S'ils vendent au bon moment, ils gagneront sur tous les fronts. Sinon... Ils seront "victimes" de leurs propres décisions.
votre avatar
"on investit massivement pour détruire la concurrence et ensuite une fois que le marché est captif on monte les prix et/ou on vend."
La vision start-up, ce n'était pas spécialement de détruire la concurrence (car il n'y en avait pas), mais plutôt d'inonder rapidement le marché pour ne pas laisser de place à la concurrence future, via un effet réseau/réputation/etc.

Là, il y a de la concurrence. Forte même. Et vu les sommes en jeu, chercher à couler la concurrence ne peut se faire qu'en se ruinant soit même. Et ils continuent de trouver des investisseurs. Je me dis qu'il y a vraiment quelque chose qui ne tourne pas rond dans le monde actuel... :craint:
votre avatar
Et vu les sommes en jeu, chercher à couler la concurrence ne peut se faire qu'en se ruinant soit même
Ce qui est effectivement le cas vu la quantité de leurs bénéfices qu'ils injectent dans ces investissements.
votre avatar
La vision start-up, ce n'était pas spécialement de détruire la concurrence (car il n'y en avait pas), mais plutôt d'inonder rapidement le marché pour ne pas laisser de place à la concurrence future, via un effet réseau/réputation/etc.
Oé...
Netflix et Airbnb passe encore, ils sont arrivés en terrain vierge à peu près.

Booking a détruit les sites de réservation qui existaient (B&Bn Gîtes, etc...) et l'autonomie des hôtels.
Uber & co ont détruit le marché des petites entreprises de livraison
Amazon idem. C'est pas comme si on se faisait pas déjà livrer avant.

Chaque vendeur sur Etsy qui copie avec de l'IA un truc artisanal créé/inventé avec des vrais neurones et des vraies petites mains fait la même chose. Couper l'herbe sous le pied, raffler la clientelle, vendre du caca.
votre avatar
Tout dépend de comment tout ça va évoluer.

A mon avis, on va pas tarder à voir à se déployer fortement le on device pour déléguer une partie des tâches chez l'utilisateur via les NPU et des modèles légers. Cette partie du traitement ne coûtera rien à exploiter pour ceux qui semblent désormais s'appeler les MANGOS (Meta, Anthropic, nVidia, Google, OpenAI, SpaceX).

Ils pourront aussi optimiser via les modèles embarqués les requêtes complexes envoyées aux serveurs pour assurer les mêmes qualité de réponses pour beaucoup moins de consommation. Et là je pense que le coût réel du token va chuter drastiquement sans qu'ils aient à baisser beaucoup le prix.

C'est un peu l'approche de Google (Gemini Nano à 2,7 milliards de paramètres) et c'est la direction que prend aussi Apple Intelligence (AFM 3 Core Advanced annoncé avec 20 milliards de paramètres activables par lots de 1 à 4 milliards).

C'est pas innocent qu'on nous sorte des RTX Spark à 1 pétaflops comme la nouvelle norme...
votre avatar
D'autant plus que c'est une grosse blague cette histoire, les coûts ont explosé ces derniers mois. Au lieu d'augmenter les tarifs ils ont drastiquement limités les usages, ce qui revient strictement au même.

Tout ça c'est du marketing bullshit, diviser les usages sur les abonnements par 5 pour ensuite dire qu'il vont diviser le prix par deux (au pif), ça ne s'appelle pas casser les prix, ça s'appelle prendre les gens pour des cons et faire passer des vessies pour des lanternes.
votre avatar
Géniale le dessin de Flock :incline:
votre avatar
Le domaine de l'IA est vraiment un accélérateur pour tout. Il réussi en deux ou trois ans à faire ce que le tout Cloud et le tout SaaS ont fait en dix :


  • Frénésie move to Cloud et SaaS first

  • Se rendre compte après 10 ans que finalement, ça coûte super cher (surtout parce que non maîtrisé) avec une plus value non démontrée (rappelez vous le discours : vous n'aurez plus besoin d'admin système - c'est vrai, désormais faut une armée d'admin Cloud)

  • Retourner au on-premise



Ici :


  • 2023 : Faut mettre de l'IA partout !

  • 2026 : Bon, en fait ça coûte cher, allez-y mollo...

votre avatar
Marrant je viens de refaire, ce matin, un comparo rapide cloud/baremetal (car j'en ai un peu marre de gérer du matériel) et on est encore sur du 5 fois plus cher pour le cloud :(
votre avatar
Je suis consultant IT (architecture) et ce qui me terrifie c'est le manque d'anticipation de la "merdification" à venir chez mes clients. Tout le monde se jette à corps perdu dans une totale dépendance aux LLMs et donc à quelques acteurs Américains. Plus personne ne forme de juniors, plus personne n'investit dans quoi que ce soit d'autre.

Mais quand le marché sera bien verrouillé et que les gentils investisseurs vont exiger une marge plutôt que de la croissance, quand les services vont devenir moins bien et plus chers, les DSI vont tous se retrouver captifs d'une prison qu'ils auront construite eux-même sans rien anticiper.

On a vraiment un problème de niveau des soit-disant élites, c'est impressionnant.
votre avatar
Et c'est systématique, quelque soit le sujet, avec eux.
votre avatar
Je rajoute l’aspect "magique" des LLM. tu fais des prompts, ils te donnent des infos, du code, des docs. Super. On a complétement perdu la vision de qui possède les données, qui peut les lire et les utiliser. La souveraineté d'un entreprise, son savoir-faire, son "idéal" a disparu au profit de géant américain....
Quand je parle de monter des modèles locaux sur des serveur stocker dans l'entreprise, de suite on me parle de cout financier alors que l'on devrais parler de cout "légitime".
Bref, c'est une bulle qui risque de faire mal aux entreprises devenu trop accro et oubliant les bases d'une société: son savoir-faire.
votre avatar
Comme on se le dit avec mes collègues:
"Eux, ils savent..."
votre avatar
Le problème aussi, c'est qu'une entreprise (par exemple une ESN) qui oserai prendre la chose à contre-pied va se retrouver moins compétitive que les autres et va donc faire faillite, alors que c'est celle qui tiendrai sur le long terme...
votre avatar
Elle est là la question : depuis quand le long terme (ré)intéresse les entreprises ?