OpenAI et Anthropic envisageraient de casser les prix des tokens
3 min
IA et algorithmes
IA
Le secteur de l’IA se dirige-t-il vers une guerre des prix du token ? Les deux principaux labos IA dans le paysage, OpenAI et Anthropic, envisageraient en effet une baisse du tarif du jeton, au grand bénéfice des consommateurs – mais probablement moins de la marge de profit des deux entreprises. Selon l’analyse Ed Zitron, en l’état actuel, les « utilisateurs peuvent dépenser entre 8 et 13,50 dollars pour chaque dollar de leurs revenus d’abonnement ».
Les utilisateurs grand public voient surtout les modèles d’IA à travers le prix d’un abonnement mensuel, quitte à se heurter parfois à des limites d’usage. Pour les entreprises, l’angle est très différent. Derrière chaque requête adressée à GPT ou Claude se cache une consommation de tokens qui finit par apparaître sur les factures. Les organisations qui se servent des modèles d’Anthropic ont d’ailleurs pu s’en apercevoir ces dernières semaines avec Opus 4.7 et suivants. Et à mesure que les usages se multiplient, les dépenses s’alourdissent.
Les budgets ne sont pas extensibles à l’infini. Le directeur technique d’Uber s’était étonné d’avoir explosé son budget IA de l’année… en seulement quatre mois. À cela s’ajoute la pratique du tokenmaxxing, utilisée par les employés de certaines entreprises pour gonfler inutilement leur consommation de jetons et ainsi, se faire bien voir de leur direction. Amazon a récemment fait fermer un classement pour limiter les abus.
Pendant ce temps, OpenAI et Anthropic ramassent la mise, enfin, façon de parler : les deux entreprises sont encore loin d’être rentables. Chaque token facturé génère certes des revenus, mais ceux-ci peinent encore à compenser les coûts colossaux des centres de données, des puces et du développement de nouveaux modèles. Et pourtant, les deux labos rivaux envisageraient de baisser le prix du token.
Sam Altman a expliqué lors d’un événement relaté par le Wall Street Journal que le coût du token était un « gros problème » : « Je pense que nous trouverons de nombreuses façons de permettre à nos clients d’en faire plus tout en dépensant moins ». Le patron d’OpenAI anticiperait une baisse des prix du token chez Anthropic, dont les produits – notamment Claude Code – sont devenus des outils du quotidien dans de nombreuses entreprises. OpenAI a riposté avec Codex, mais elle a pris du retard.
Le hic, c’est qu’une éventuelle guerre tarifaire pourrait satisfaire les clients, mais elle retarderait encore davantage la perspective de bénéfices pour les deux sociétés qui s’apprêtent à entrer en Bourse. Et à force de se courir après, les services d’OpenAI et d’Anthropic courent le risque de devenir interchangeables, en se différenciant uniquement sur les tarifs.
Commentaires (24)
Abonnez-vous pour prendre part au débat
Déjà abonné ou lecteur ? Se connecter
Cet article est en accès libre, mais il est le produit d'une rédaction qui ne travaille que pour ses lecteurs, sur un média sans pub et sans tracker. Soutenez le journalisme tech de qualité en vous abonnant.
Accédez en illimité aux articles d'un média expert
Profitez d'au moins 1 To de stockage pour vos sauvegardes
Intégrez la communauté et prenez part aux débats
Partagez des articles premium à vos contacts
Abonnez-vousAujourd'hui à 08h48
Je me demande vraiment ce qui pourrait mal se passer... /sacarsme
Aujourd'hui à 08h57
Oui, vraiment, qu'est-ce qui pourrait mal se passer ?
Aujourd'hui à 09h04
Aujourd'hui à 09h05
Modifié aujourd'hui à 09h32
C'est comme ça qu'Uber s'est développé, rien n'était rentable dans la quasi totalité des pays, mais ils voulaient créer le "réflexe Uber" à la sortie de l'avion n'importe où dans le monde. Aujourd'hui, c'est devenu quasiment une antonomase synonyme de "taxi" dans le langage courant. D'ailleurs, Uber a aussi grandit si vite que la législation sur le droit du travail ne l'a rattrapé que bien plus tard avec la notion d'uberisation.
On peut citer aussi Netflix, Spotify...
Aujourd'hui à 10h00
Il y a 53 minutes
Après Amazon est un peu différent, car ils jouent sur plusieurs secteurs en même temps entre la logistique et le Cloud. Il me semble qu'AWS a permis d'assurer une grande partie du financement des activités Amazon "delivery" sans organiser autant de levées de fonds que ce qu'on constate aujourd'hui avec l'IA.
Modifié aujourd'hui à 09h07
Au moins on savait à quoi s'attendre.
là je suis plus très sûr que les types sachent comment eux-mêmes pourront s'en sortir (sans parler de nous autres péquins moyens dont ils ont rien à carrer).
Aujourd'hui à 10h11
Aujourd'hui à 10h12
Aujourd'hui à 10h16
Là, il y a de la concurrence. Forte même. Et vu les sommes en jeu, chercher à couler la concurrence ne peut se faire qu'en se ruinant soit même. Et ils continuent de trouver des investisseurs. Je me dis qu'il y a vraiment quelque chose qui ne tourne pas rond dans le monde actuel...
Il y a 55 minutes
Il y a 32 minutes
Netflix et Airbnb passe encore, ils sont arrivés en terrain vierge à peu près.
Booking a détruit les sites de réservation qui existaient (B&Bn Gîtes, etc...) et l'autonomie des hôtels.
Uber & co ont détruit le marché des petites entreprises de livraison
Amazon idem. C'est pas comme si on se faisait pas déjà livrer avant.
Chaque vendeur sur Etsy qui copie avec de l'IA un truc artisanal créé/inventé avec des vrais neurones et des vraies petites mains fait la même chose. Couper l'herbe sous le pied, raffler la clientelle, vendre du caca.
Modifié aujourd'hui à 09h23
A mon avis, on va pas tarder à voir à se déployer fortement le on device pour déléguer une partie des tâches chez l'utilisateur via les NPU et des modèles légers. Cette partie du traitement ne coûtera rien à exploiter pour ceux qui semblent désormais s'appeler les MANGOS (Meta, Anthropic, nVidia, Google, OpenAI, SpaceX).
Ils pourront aussi optimiser via les modèles embarqués les requêtes complexes envoyées aux serveurs pour assurer les mêmes qualité de réponses pour beaucoup moins de consommation. Et là je pense que le coût réel du token va chuter drastiquement sans qu'ils aient à baisser beaucoup le prix.
C'est un peu l'approche de Google (Gemini Nano à 2,7 milliards de paramètres) et c'est la direction que prend aussi Apple Intelligence (AFM 3 Core Advanced annoncé avec 20 milliards de paramètres activables par lots de 1 à 4 milliards).
C'est pas innocent qu'on nous sorte des RTX Spark à 1 pétaflops comme la nouvelle norme...
Aujourd'hui à 10h13
Tout ça c'est du marketing bullshit, diviser les usages sur les abonnements par 5 pour ensuite dire qu'il vont diviser le prix par deux (au pif), ça ne s'appelle pas casser les prix, ça s'appelle prendre les gens pour des cons et faire passer des vessies pour des lanternes.
Aujourd'hui à 09h09
Aujourd'hui à 09h17
Ici :
À l'instant
Modifié aujourd'hui à 10h01
Mais quand le marché sera bien verrouillé et que les gentils investisseurs vont exiger une marge plutôt que de la croissance, quand les services vont devenir moins bien et plus chers, les DSI vont tous se retrouver captifs d'une prison qu'ils auront construite eux-même sans rien anticiper.
On a vraiment un problème de niveau des soit-disant élites, c'est impressionnant.
Aujourd'hui à 10h14
Aujourd'hui à 10h20
Quand je parle de monter des modèles locaux sur des serveur stocker dans l'entreprise, de suite on me parle de cout financier alors que l'on devrais parler de cout "légitime".
Bref, c'est une bulle qui risque de faire mal aux entreprises devenu trop accro et oubliant les bases d'une société: son savoir-faire.
Aujourd'hui à 10h24
"Eux, ils savent..."
Aujourd'hui à 10h27
Modifié il y a 2 minutes
Signaler un commentaire
Voulez-vous vraiment signaler ce commentaire ?