#Nextquick : Pourquoi et comment Opus 4.7 crame ses tokens beaucoup plus vite qu’Opus 4.6

Bonjour, vous avez quelques tokens pour mon IA ?

Illustration : Flock

Sébastien Gavois

Le 01 mai à 09h09

Opus 4.7 est plus performant certes, mais consomme aussi bien plus vite les forfaits des utilisateurs. La faute à la tokenization et à une réflexion plus « intense », deux éléments qui engloutissent plus de tokens. Autre conséquence : même si Opus 4.6 et 4.7 coûtent le même prix par tokens via l’API, à usage identique Opus 4.7 reviendra généralement plus cher.

#Nextquick : Pourquoi et comment Opus 4.7 crame ses tokens beaucoup plus vite qu’Opus 4.6

Bonjour, vous avez quelques tokens pour mon IA ?

Illustration : Flock

Sébastien Gavois

Le 01 mai à 09h09

IA et algorithmes

7 min

Depuis le lancement d’Opus 4.7, de nombreux utilisateurs se plaignent de cramer leur forfait bien plus vite qu’avec la version 4.6. Claude Code n’était pas épargné. Anthropic a depuis corrigé le tir, notamment en réduisant la taille des réponses, et donc en économisant des tokens en sortie.

Lors du lancement, Anthropic affirmait que les tarifs restaient les mêmes entre Opus 4.6 et 4.7 : 5 dollars par million de tokens (ou jetons) en entrée et 25 dollars par million de tokens en sortie. L’entreprise reconnaissait qu’une même entrée pouvait consommer plus de tokens avec Opus 4.7 car le modèle utilise un nouveau tokeniseur : « entre 1,0 et 1,35 fois de plus, selon le type de contenus ». Autre changement, « Opus 4.7 est plus performant lorsque l’effort requis est plus important […] Cela améliore sa fiabilité face aux problèmes complexes, mais génère davantage de jetons de sortie ».

IA

Claude Code réfléchissait trop, puis plus assez : Anthropic corrige le coup de mou

IA

Lundi 27 avril 2026 à 08h52 27/04/2026 08h52

11

Une même requête, 41 % de tokens en plus…

Mais qu’en est-il dans la pratique ? Nous avons comparé la consommation en jetons d’Opus 4.6 et 4.7 sur des prompts assez simples pour voir ce qu’il en est. Nous avons mis au point un script avec Claude Code pour utiliser l’API et mesurer les tokens (le script est en fin d’actualité, évidemment sans notre clé API : vibe coder ne veut pas dire faire n’importe quoi !).

Il reste 68% de l'article à découvrir.

Soutenez un journalisme indépendant,
libre de ton, sans pub et sans reproche.

Accédez en illimité aux articles

Profitez d'un média expert et unique

Intégrez la communauté et prenez part aux débats

Partagez des articles premium à vos contacts

Abonnez-vous

La suite de cet article est réservée à nos abonnés

Soutenez un journalisme indépendant,
expert et sans pub.

Abonnez-vous sur next.ink/subs

Commentaires (20)

MisterDams Premium

Le 1er mai à 10h40

De là à penser que c'est une stratégie du modèle économique de pousser à consommer davantage de tokens...
Car mine de rien, suivant les scénarios ça semble être une augmentation des tarifs jusqu'à +35% qui se cache derrière une simple mise à jour.

En tout cas, la question sur la relativité générale, on voit quand même qu'il s'emballe sur l'explication demandée "en 3 lignes".

CharlesP. Premium

Modifié le 4 mai à 13h42

Je ne pense pas, parce que du côté d'Anthropic, générer un token de plus leur coûte aussi. C'est peut-être une manière de forcer leurs utilisateurs à consommer plus, mais pas une augmentation des tarifs cachée.

trytodosth Premium

Le 1er mai à 14h56

Ça monte quand même le chiffre d'affaires et les bénéfices qui en sont un %

gg40

Le 3 mai à 15h31

je ne pense pas non plus. visiblement il perdent des sous avec pas mal de gens qui exploite a fond leurs abonnements (qui n'est pas facturé au token comme avec l'API).
A noter qu'il est trivial d'utiliser Opus 4.6 (qui reste très bon).

deathscythe0666 Premium

Le 4 mai à 10h56

visiblement il perdent des sous avec pas mal de gens qui exploite a fond leurs abonnements (qui n'est pas facturé au token comme avec l'API).

Je pense que leur ambition est de passer à terme tous les clients au tarif de l'API.

gg40

Le 4 mai à 11h30

Je pense que leur ambition est de passer à terme tous les clients au tarif de l'API.

C'est ce que je crains aussi, et là ça fera très très mal.
Perso ce sera sans moi, même si j'aime cette IA le coût économique ne serait plus adapté à mon activité.

fred42 Premium

Le 1er mai à 10h56

Sinon :

Sébastien Gavois Équipe

Le 1er mai à 15h11

S’ c’est rapport au 1er mai, t’inquiéte j’ai pas travaillé aujourd’hui, mais la publication en différée c’est bien pratique sur WP

tipaul Premium

Le 4 mai à 13h52

Tu avais aussi programmé cette réponse ? Bravo belle anticipation

Sébastien Gavois Équipe

Le 4 mai à 17h43

J’ai pas le droit de venir trainer sur Next pendant mon repos :o Qu’est-ce donc que cette dictature :o

bingo.crepuscule Premium

Modifié le 1er mai à 16h53

Claude n'est pas le seul concerné, OpenAI fait exactement la même chose, ça a gueulé très fort sur Reddit, les modèles GPT 5.4 et 5.5 de chatGPT en xhigh font exactement la même chose et sont terriblement plus gourmands, alors que le modèle 5.3-codex xhigh à vue de nez, bouffe deux fois moins de tokens, sur l'abonnement codex. (Le 5.3-codex semble beaucoup plus propre et moins verbeux aussi)
L'idéal pour le moment, reste d'établir une feuille de route/plan avec la version 5.5, puis de la faire appliquer à la version 5.3. Le problème étant que lorsque l'on demande d'appliquer un plan, bien évidemment, on ne peut pas changer de modèle... Il faut passer outre, puis changer de modèle, puis demander de reprendre mot à mot le plan.

Et le plus beau ? OpenAi a annoncé que le modèle "-codex" serait le dernier, place désormais à l'usine à gaz qui sait tout faire, qui consomme beaucoup plus de token, parce que "l'agentique saybien" 🤔

Accessoirement, on est nombreux à avoir le sentiment qu'un nouveau modèle impressionnant au début est rapidement castré ensuite passé la "hype" (quantizé ?), et les anciens modèlent semble aussi finir par avoir des performances dégradées..

potn Premium

Le 4 mai à 11h32

Super article ! Merci ! 👍
Ça serait intéressant de pouvoir mettre une appréciation sur les articles, je pense : ça pourrait vous permettre d'avoir une vision plus précise des articles appréciés ou non. (Il faudrait bien sûr rendre ça non ambigu entre "j'aime l'article mais pas son objet" et "je n'aime pas cet article mais j'aime son objet".)

l'ange le virus Premium

Le 5 mai à 06h34

Ce test permet de mettre en lumière une fois encore le côté statistique des IA génératives : elles n’apportent pas toujours la même réponse ; et des fois ça marche, des fois non. De l'Intelligence Aléatoire

SebGF Premium

Le 5 mai à 08h30

Ce qui est drôle, c'est que c'est un trait humain.

Qui n'a jamais constaté 5 avis différents dans une discussion avec 3 personnes ?

Sans parler du discours politique qui arrive à sortir 3 contradictions en une phrase

deathscythe0666 Premium

Le 5 mai à 16h11

Qui n'a jamais constaté 5 avis différents dans une discussion avec 3 personnes ?

C'est différent, il s'agit de personnes différentes, et si on parle d'avis, chacun a le sien.

Sans parler du discours politique qui arrive à sortir 3 contradictions en une phrase

Il a dit intelligence, tu es hors jeu

SebGF Premium

Le 5 mai à 19h36

T'as loupé une subtilité sur le 1er cas, on dirait.

Cela dit, je ne compte plus ceux où j'ai 3 avis différents de la même personne lors des atelier métier pour expliquer le as-is.

deathscythe0666 Premium

Le 5 mai à 20h59

T'as loupé une subtilité sur le 1er cas, on dirait.

J'ai pris ça pour une exagération. Je pense juste que les avis différents d'une seule et unique personne sont rarement diamétralement opposés (politiques exclus, mais les cascades qu'ils font sont professionnelles, n'essayez pas de les reproduire à la maison).

Ou alors, tu as des fréquentations bizarres

SebGF Premium

Le 5 mai à 21h25

Bah je ne fais qu'exprimer mon vécu professionnel où au cours d'un même atelier métier, j'ai réussi à avoir 5 versions différentes d'un processus métier.

Qui étaient, pour finir, toutes erronées à divers degrés !

Les projets de transformation IT à l'échelle d'une entreprise sont toujours de grands moments de rigolade.

deathscythe0666 Premium

Le 6 mai à 11h06

Les projets de transformation IT à l'échelle d'une entreprise sont toujours de grands moments de rigolade.

Jusqu'au moment où il faut passer à l'implémentation, ça fait moins rire

SebGF Premium

Le 6 mai à 14h32

C'est la phase suivante du projet :

Suppositions X

Rêve X

Lettre au père noel X

Désillusion <=