Connexion Premium

#Nextquick : Pourquoi et comment Opus 4.7 crame ses tokens beaucoup plus vite qu’Opus 4.6

Bonjour, vous avez quelques tokens pour mon IA ?

#Nextquick : Pourquoi et comment Opus 4.7 crame ses tokens beaucoup plus vite qu’Opus 4.6

Illustration : Flock

Opus 4.7 est plus performant certes, mais consomme aussi bien plus vite les forfaits des utilisateurs. La faute à la tokenization et à une réflexion plus « intense », deux éléments qui engloutissent plus de tokens. Autre conséquence : même si Opus 4.6 et 4.7 coûtent le même prix par tokens via l’API, à usage identique Opus 4.7 reviendra généralement plus cher.

Depuis le lancement d’Opus 4.7, de nombreux utilisateurs se plaignent de cramer leur forfait bien plus vite qu’avec la version 4.6. Claude Code n’était pas épargné. Anthropic a depuis corrigé le tir, notamment en réduisant la taille des réponses, et donc en économisant des tokens en sortie.

Lors du lancement, Anthropic affirmait que les tarifs restaient les mêmes entre Opus 4.6 et 4.7 : 5 dollars par million de tokens (ou jetons) en entrée et 25 dollars par million de tokens en sortie. L’entreprise reconnaissait qu’une même entrée pouvait consommer plus de tokens avec Opus 4.7 car le modèle utilise un nouveau tokeniseur : « entre 1,0 et 1,35 fois de plus, selon le type de contenus ». Autre changement, « Opus 4.7 est plus performant lorsque l’effort requis est plus important […] Cela améliore sa fiabilité face aux problèmes complexes, mais génère davantage de jetons de sortie ».

Une même requête, 41 % de tokens en plus…

Mais qu’en est-il dans la pratique ? Nous avons comparé la consommation en jetons d’Opus 4.6 et 4.7 sur des prompts assez simples pour voir ce qu’il en est. Nous avons mis au point un script avec Claude Code pour utiliser l’API et mesurer les tokens (le script est en fin d’actualité, évidemment sans notre clé API : vibe coder ne veut pas dire faire n’importe quoi !).

Il reste 68% de l'article à découvrir.

Cadenas en colère - Contenu premium

Soutenez un journalisme indépendant,
libre de ton, sans pub et sans reproche.

Accédez en illimité aux articles

Profitez d'un média expert et unique

Intégrez la communauté et prenez part aux débats

Partagez des articles premium à vos contacts

Commentaires (20)

votre avatar
De là à penser que c'est une stratégie du modèle économique de pousser à consommer davantage de tokens...
Car mine de rien, suivant les scénarios ça semble être une augmentation des tarifs jusqu'à +35% qui se cache derrière une simple mise à jour.

En tout cas, la question sur la relativité générale, on voit quand même qu'il s'emballe sur l'explication demandée "en 3 lignes".
votre avatar
Je ne pense pas, parce que du côté d'Anthropic, générer un token de plus leur coûte aussi. C'est peut-être une manière de forcer leurs utilisateurs à consommer plus, mais pas une augmentation des tarifs cachée.
votre avatar
Ça monte quand même le chiffre d'affaires et les bénéfices qui en sont un %
votre avatar
je ne pense pas non plus. visiblement il perdent des sous avec pas mal de gens qui exploite a fond leurs abonnements (qui n'est pas facturé au token comme avec l'API).
A noter qu'il est trivial d'utiliser Opus 4.6 (qui reste très bon).
votre avatar
visiblement il perdent des sous avec pas mal de gens qui exploite a fond leurs abonnements (qui n'est pas facturé au token comme avec l'API).
Je pense que leur ambition est de passer à terme tous les clients au tarif de l'API.
votre avatar
Je pense que leur ambition est de passer à terme tous les clients au tarif de l'API.
Je pense que leur ambition est de passer à terme tous les clients au tarif de l'API.
C'est ce que je crains aussi, et là ça fera très très mal.
Perso ce sera sans moi, même si j'aime cette IA le coût économique ne serait plus adapté à mon activité.
votre avatar
Sinon : next.ink Next
votre avatar
S’ c’est rapport au 1er mai, t’inquiéte j’ai pas travaillé aujourd’hui, mais la publication en différée c’est bien pratique sur WP :D
votre avatar
Tu avais aussi programmé cette réponse ? Bravo belle anticipation :D
votre avatar
J’ai pas le droit de venir trainer sur Next pendant mon repos :o Qu’est-ce donc que cette dictature :o
votre avatar
Claude n'est pas le seul concerné, OpenAI fait exactement la même chose, ça a gueulé très fort sur Reddit, les modèles GPT 5.4 et 5.5 de chatGPT en xhigh font exactement la même chose et sont terriblement plus gourmands, alors que le modèle 5.3-codex xhigh à vue de nez, bouffe deux fois moins de tokens, sur l'abonnement codex. (Le 5.3-codex semble beaucoup plus propre et moins verbeux aussi)
L'idéal pour le moment, reste d'établir une feuille de route/plan avec la version 5.5, puis de la faire appliquer à la version 5.3. Le problème étant que lorsque l'on demande d'appliquer un plan, bien évidemment, on ne peut pas changer de modèle... Il faut passer outre, puis changer de modèle, puis demander de reprendre mot à mot le plan.

Et le plus beau ? OpenAi a annoncé que le modèle "-codex" serait le dernier, place désormais à l'usine à gaz qui sait tout faire, qui consomme beaucoup plus de token, parce que "l'agentique saybien" 🤔

Accessoirement, on est nombreux à avoir le sentiment qu'un nouveau modèle impressionnant au début est rapidement castré ensuite passé la "hype" (quantizé ?), et les anciens modèlent semble aussi finir par avoir des performances dégradées..
votre avatar
Super article ! Merci ! 👍
Ça serait intéressant de pouvoir mettre une appréciation sur les articles, je pense : ça pourrait vous permettre d'avoir une vision plus précise des articles appréciés ou non. (Il faudrait bien sûr rendre ça non ambigu entre "j'aime l'article mais pas son objet" et "je n'aime pas cet article mais j'aime son objet".)
votre avatar
Ce test permet de mettre en lumière une fois encore le côté statistique des IA génératives : elles n’apportent pas toujours la même réponse ; et des fois ça marche, des fois non. De l'Intelligence Aléatoire
votre avatar
Ce qui est drôle, c'est que c'est un trait humain.

Qui n'a jamais constaté 5 avis différents dans une discussion avec 3 personnes ?

Sans parler du discours politique qui arrive à sortir 3 contradictions en une phrase :D
votre avatar
Qui n'a jamais constaté 5 avis différents dans une discussion avec 3 personnes ?
C'est différent, il s'agit de personnes différentes, et si on parle d'avis, chacun a le sien.
Sans parler du discours politique qui arrive à sortir 3 contradictions en une phrase
Il a dit intelligence, tu es hors jeu :D
votre avatar
T'as loupé une subtilité sur le 1er cas, on dirait.

Cela dit, je ne compte plus ceux où j'ai 3 avis différents de la même personne lors des atelier métier pour expliquer le as-is.
votre avatar
T'as loupé une subtilité sur le 1er cas, on dirait.
J'ai pris ça pour une exagération. Je pense juste que les avis différents d'une seule et unique personne sont rarement diamétralement opposés (politiques exclus, mais les cascades qu'ils font sont professionnelles, n'essayez pas de les reproduire à la maison).

Ou alors, tu as des fréquentations bizarres :D
votre avatar
Bah je ne fais qu'exprimer mon vécu professionnel où au cours d'un même atelier métier, j'ai réussi à avoir 5 versions différentes d'un processus métier.

Qui étaient, pour finir, toutes erronées à divers degrés !

Les projets de transformation IT à l'échelle d'une entreprise sont toujours de grands moments de rigolade.
votre avatar
Les projets de transformation IT à l'échelle d'une entreprise sont toujours de grands moments de rigolade.
Jusqu'au moment où il faut passer à l'implémentation, ça fait moins rire :D
votre avatar
C'est la phase suivante du projet :


  • Suppositions X

  • Rêve X

  • Lettre au père noel X

  • Désillusion <=