OpenAI et Anthropic envisageraient de casser les prix des tokens
3 min
IA et algorithmes
IA
Le secteur de l’IA se dirige-t-il vers une guerre des prix du token ? Les deux principaux labos IA dans le paysage, OpenAI et Anthropic, envisageraient en effet une baisse du tarif du jeton, au grand bénéfice des consommateurs – mais probablement moins de la marge de profit des deux entreprises. Selon l’analyste Ed Zitron, en l’état actuel, les « utilisateurs peuvent dépenser entre 8 et 13,50 dollars pour chaque dollar de leurs revenus d’abonnement ».
Les utilisateurs grand public voient surtout les modèles d’IA à travers le prix d’un abonnement mensuel, quitte à se heurter parfois à des limites d’usage. Pour les entreprises, l’angle est très différent. Derrière chaque requête adressée à GPT ou Claude se cache une consommation de tokens qui finit par apparaître sur les factures. Les organisations qui se servent des modèles d’Anthropic ont d’ailleurs pu s’en apercevoir ces dernières semaines avec Opus 4.7 et suivants. Et à mesure que les usages se multiplient, les dépenses s’alourdissent.
Les budgets ne sont pas extensibles à l’infini. Le directeur technique d’Uber s’était étonné d’avoir explosé son budget IA de l’année… en seulement quatre mois. À cela s’ajoute la pratique du tokenmaxxing, utilisée par les employés de certaines entreprises pour gonfler inutilement leur consommation de jetons et ainsi, se faire bien voir de leur direction. Amazon a récemment fait fermer un classement pour limiter les abus.
Pendant ce temps, OpenAI et Anthropic ramassent la mise, enfin, façon de parler : les deux entreprises sont encore loin d’être rentables. Chaque token facturé génère certes des revenus, mais ceux-ci peinent encore à compenser les coûts colossaux des centres de données, des puces et du développement de nouveaux modèles. Et pourtant, les deux labos rivaux envisageraient de baisser le prix du token.
Sam Altman a expliqué lors d’un événement relaté par le Wall Street Journal que le coût du token était un « gros problème » : « Je pense que nous trouverons de nombreuses façons de permettre à nos clients d’en faire plus tout en dépensant moins ». Le patron d’OpenAI anticiperait une baisse des prix du token chez Anthropic, dont les produits – notamment Claude Code – sont devenus des outils du quotidien dans de nombreuses entreprises. OpenAI a riposté avec Codex, mais elle a pris du retard.
Le hic, c’est qu’une éventuelle guerre tarifaire pourrait satisfaire les clients, mais elle retarderait encore davantage la perspective de bénéfices pour les deux sociétés qui s’apprêtent à entrer en Bourse. Et à force de se courir après, les services d’OpenAI et d’Anthropic courent le risque de devenir interchangeables, en se différenciant uniquement sur les tarifs.
Commentaires (32)
Abonnez-vous pour prendre part au débat
Déjà abonné ou lecteur ? Se connecter
Cet article est en accès libre, mais il est le produit d'une rédaction qui ne travaille que pour ses lecteurs, sur un média sans pub et sans tracker. Soutenez le journalisme tech de qualité en vous abonnant.
Accédez en illimité aux articles d'un média expert
Profitez d'au moins 1 To de stockage pour vos sauvegardes
Intégrez la communauté et prenez part aux débats
Partagez des articles premium à vos contacts
Abonnez-vousLe 12 juin à 08h48
Je me demande vraiment ce qui pourrait mal se passer... /sacarsme
Le 12 juin à 08h57
Oui, vraiment, qu'est-ce qui pourrait mal se passer ?
Le 12 juin à 09h04
Modifié le 13 juin à 08h21
Après j'ai l'impression qu'ils abandonnent un peu la course avec les autres sur les performances de leur modèle, pour se recycler vers la mise à disposition de puissance de calcul à leurs (anciens) concurrents, ceux qui justement veulent ici baisser leurs prix sans baisser leurs coûts. Ce qui les rapproche plus du vendeur de pioches avec des revenus stables et des investissements plus maîtrisés que de l'incertitude de celui qui cherche l'or. Et l'IA n'est qu'une partie de leur activité.
Le 12 juin à 09h05
Modifié le 12 juin à 09h32
C'est comme ça qu'Uber s'est développé, rien n'était rentable dans la quasi totalité des pays, mais ils voulaient créer le "réflexe Uber" à la sortie de l'avion n'importe où dans le monde. Aujourd'hui, c'est devenu quasiment une antonomase synonyme de "taxi" dans le langage courant. D'ailleurs, Uber a aussi grandit si vite que la législation sur le droit du travail ne l'a rattrapé que bien plus tard avec la notion d'uberisation.
On peut citer aussi Netflix, Spotify...
Le 12 juin à 10h00
Le 12 juin à 10h37
Après Amazon est un peu différent, car ils jouent sur plusieurs secteurs en même temps entre la logistique et le Cloud. Il me semble qu'AWS a permis d'assurer une grande partie du financement des activités Amazon "delivery" sans organiser autant de levées de fonds que ce qu'on constate aujourd'hui avec l'IA.
Modifié le 12 juin à 09h07
Au moins on savait à quoi s'attendre.
là je suis plus très sûr que les types sachent comment eux-mêmes pourront s'en sortir (sans parler de nous autres péquins moyens dont ils ont rien à carrer).
Le 12 juin à 10h11
Le 12 juin à 10h12
Le 12 juin à 10h16
Là, il y a de la concurrence. Forte même. Et vu les sommes en jeu, chercher à couler la concurrence ne peut se faire qu'en se ruinant soit même. Et ils continuent de trouver des investisseurs. Je me dis qu'il y a vraiment quelque chose qui ne tourne pas rond dans le monde actuel...
Le 12 juin à 10h35
Le 12 juin à 10h58
Netflix et Airbnb passe encore, ils sont arrivés en terrain vierge à peu près.
Booking a détruit les sites de réservation qui existaient (B&Bn Gîtes, etc...) et l'autonomie des hôtels.
Uber & co ont détruit le marché des petites entreprises de livraison
Amazon idem. C'est pas comme si on se faisait pas déjà livrer avant.
Chaque vendeur sur Etsy qui copie avec de l'IA un truc artisanal créé/inventé avec des vrais neurones et des vraies petites mains fait la même chose. Couper l'herbe sous le pied, raffler la clientelle, vendre du caca.
Modifié le 12 juin à 09h23
A mon avis, on va pas tarder à voir à se déployer fortement le on device pour déléguer une partie des tâches chez l'utilisateur via les NPU et des modèles légers. Cette partie du traitement ne coûtera rien à exploiter pour ceux qui semblent désormais s'appeler les MANGOS (Meta, Anthropic, nVidia, Google, OpenAI, SpaceX).
Ils pourront aussi optimiser via les modèles embarqués les requêtes complexes envoyées aux serveurs pour assurer les mêmes qualité de réponses pour beaucoup moins de consommation. Et là je pense que le coût réel du token va chuter drastiquement sans qu'ils aient à baisser beaucoup le prix.
C'est un peu l'approche de Google (Gemini Nano à 2,7 milliards de paramètres) et c'est la direction que prend aussi Apple Intelligence (AFM 3 Core Advanced annoncé avec 20 milliards de paramètres activables par lots de 1 à 4 milliards).
C'est pas innocent qu'on nous sorte des RTX Spark à 1 pétaflops comme la nouvelle norme...
Le 12 juin à 15h17
À moins éventuellement d'optimiser et de spécialiser très fort les modèles, mais ça ne semble pas être le cas actuellement.
Le 13 juin à 23h11
Le 12 juin à 10h13
Tout ça c'est du marketing bullshit, diviser les usages sur les abonnements par 5 pour ensuite dire qu'il vont diviser le prix par deux (au pif), ça ne s'appelle pas casser les prix, ça s'appelle prendre les gens pour des cons et faire passer des vessies pour des lanternes.
Le 19 juin à 22h41
Le 12 juin à 09h09
Le 12 juin à 09h17
Ici :
Le 12 juin à 11h30
Modifié le 12 juin à 10h01
Mais quand le marché sera bien verrouillé et que les gentils investisseurs vont exiger une marge plutôt que de la croissance, quand les services vont devenir moins bien et plus chers, les DSI vont tous se retrouver captifs d'une prison qu'ils auront construite eux-même sans rien anticiper.
On a vraiment un problème de niveau des soit-disant élites, c'est impressionnant.
Le 12 juin à 10h14
Le 12 juin à 10h20
Quand je parle de monter des modèles locaux sur des serveur stocker dans l'entreprise, de suite on me parle de cout financier alors que l'on devrais parler de cout "légitime".
Bref, c'est une bulle qui risque de faire mal aux entreprises devenu trop accro et oubliant les bases d'une société: son savoir-faire.
Le 12 juin à 10h24
"Eux, ils savent..."
Le 12 juin à 10h27
Modifié le 12 juin à 11h28
Le 12 juin à 13h09
Tout va bien se passer. L’humanité entre dans une nouvelle ère.
Et vous, vous avez peur, vous avez les jetons. Vous tremblez.
Alors qu’il suffit de se laisser porter.
En vérité je vous le dis : nous allons tous prospérer, l’être humain se transforme déjà en sa future vibrance. Tiens il se raconte qu’une deuxième queue va pousser entre les jambes des uns tandis qu’un deuxième vagin se creuse chez les autres. J’y crois.
Nous allons bientôt jouir doublement.
Et ça tombe bien, il n’y aura plus que ça à faire. Car tout le reste sera pris en charge par l’intelligence artificielle. Celle que nous avons créée. Celle qui va nous servir. Celle qui va nous libérer de toutes ces contingences.
Celle que nous devons plébisciter.
Le monde peut brûler.
Elle est désormais là pour le sauver.
Alors arrêtez de geindre.
Vivez cette métamorphose comme une bénédiction.
Car en vérité je vous le dis : vous serez tous délivrés du mal.
En attendant, pour accélérer votre voyage vers ce futur radieux, n’hésitez pas à créditer mon compte. Je vous le garantie : vous ne regretterez pas.
Le 12 juin à 14h14
C'est ma manière à moi de faire du tokenmaxxing.
Modifié le 12 juin à 14h13
Toutefois je ne vois aucune entreprise se lancer la dedans sans espoir de rafler la mise ou d'un gain. Et on voit tout un tas de DSI se jeter dedans. Ce que dit @imfromtatooine .
Du coup la bonne question est : Qu'est qui insuffle ce comportement de cassage de prix ? On est d'accord que ça n'a ni queue ni tête vu de loin.
On sait que l'état américain est derrière. Comme bien d'autres fois sur d'autres marchés... comme le PC... Mais cet état, aussi puissant soit il, ne peut pas le faire sans avoir un minimum de sécurité derrière (lui aussi). Ça c'est les assureurs.
Parce qu'on est certains d'un truc. L'IA n'est pas rentable et avec ceci, elle le sera moins. On dit ça à un entrepreneur/investisseur, il te dit d'aller jouer avec tes crottes de nez. Alors pourquoi ?
Il nous manque un gros morceau en fait. La farandole de redistribution entre les acteurs du jeu (AMD, NVIDA, etc.) n'est peut-être que le tout petit bout de l'iceberg.
Quand un truc beaucoup plus gros pète, ça donne quoi ? L'effet de vague pourrait bien sévèrement faire de la misère.
Si c'est seulement économique c'est vraiment chelou. Si c'est de séquestrer les savoirs-faire. Les dégâts sont déjà là. Chez les étudiants par exemple ou les gosses (2 et 2 ! -attend je demande à ChatGPT...) . Et là c'est pire. Dés-apprendre prend 10 fois moins de temps... Et ça nous emmène sur le plan géopolitique (Bourdieu mon amour).
Modifié le 13 juin à 12h50
L'investissement n'est pas déconnant pour avoir sa capacité IA on-premise, et sécuriser ainsi son "approvisionnement".
Encore faut-il savoir ce qu'on en fait et comment on l'insère de façon adéquate dans l'activité ; element critique qui déterminera le ROI. Et c'est plus souvent là que ça pêche.
Signaler un commentaire
Voulez-vous vraiment signaler ce commentaire ?