#Nextquick : Pourquoi et comment Opus 4.7 crame ses tokens beaucoup plus vite qu’Opus 4.6
Bonjour, vous avez quelques tokens pour mon IA ?
Illustration : Flock
Le 01 mai à 09h09
Opus 4.7 est plus performant certes, mais consomme aussi bien plus vite les forfaits des utilisateurs. La faute à la tokenization et à une réflexion plus « intense », deux éléments qui engloutissent plus de tokens. Autre conséquence : même si Opus 4.6 et 4.7 coûtent le même prix par tokens via l’API, à usage identique Opus 4.7 reviendra généralement plus cher.
#Nextquick : Pourquoi et comment Opus 4.7 crame ses tokens beaucoup plus vite qu’Opus 4.6
Bonjour, vous avez quelques tokens pour mon IA ?
Illustration : Flock
Opus 4.7 est plus performant certes, mais consomme aussi bien plus vite les forfaits des utilisateurs. La faute à la tokenization et à une réflexion plus « intense », deux éléments qui engloutissent plus de tokens. Autre conséquence : même si Opus 4.6 et 4.7 coûtent le même prix par tokens via l’API, à usage identique Opus 4.7 reviendra généralement plus cher.
IA et algorithmes
IA
7 min
Depuis le lancement d’Opus 4.7, de nombreux utilisateurs se plaignent de cramer leur forfait bien plus vite qu’avec la version 4.6. Claude Code n’était pas épargné. Anthropic a depuis corrigé le tir, notamment en réduisant la taille des réponses, et donc en économisant des tokens en sortie.
Lors du lancement, Anthropic affirmait que les tarifs restaient les mêmes entre Opus 4.6 et 4.7 : 5 dollars par million de tokens (ou jetons) en entrée et 25 dollars par million de tokens en sortie. L’entreprise reconnaissait qu’une même entrée pouvait consommer plus de tokens avec Opus 4.7 car le modèle utilise un nouveau tokeniseur : « entre 1,0 et 1,35 fois de plus, selon le type de contenus ». Autre changement, « Opus 4.7 est plus performant lorsque l’effort requis est plus important […] Cela améliore sa fiabilité face aux problèmes complexes, mais génère davantage de jetons de sortie ».
Une même requête, 41 % de tokens en plus…
Mais qu’en est-il dans la pratique ? Nous avons comparé la consommation en jetons d’Opus 4.6 et 4.7 sur des prompts assez simples pour voir ce qu’il en est. Nous avons mis au point un script avec Claude Code pour utiliser l’API et mesurer les tokens (le script est en fin d’actualité, évidemment sans notre clé API : vibe coder ne veut pas dire faire n’importe quoi !).
Il reste 68% de l'article à découvrir.
Déjà abonné ou lecteur ? Se connecter
Soutenez un journalisme indépendant,
libre de ton, sans pub et sans reproche.
Accédez en illimité aux articles
Profitez d'un média expert et unique
Intégrez la communauté et prenez part aux débats
Partagez des articles premium à vos contacts
expert et sans pub.
Commentaires (20)
Le 1er mai à 10h40
Car mine de rien, suivant les scénarios ça semble être une augmentation des tarifs jusqu'à +35% qui se cache derrière une simple mise à jour.
En tout cas, la question sur la relativité générale, on voit quand même qu'il s'emballe sur l'explication demandée "en 3 lignes".
Modifié le 4 mai à 13h42
Le 1er mai à 14h56
Le 3 mai à 15h31
A noter qu'il est trivial d'utiliser Opus 4.6 (qui reste très bon).
Le 4 mai à 10h56
Le 4 mai à 11h30
Perso ce sera sans moi, même si j'aime cette IA le coût économique ne serait plus adapté à mon activité.
Le 1er mai à 10h56
Le 1er mai à 15h11
Le 4 mai à 13h52
Le 4 mai à 17h43
Modifié le 1er mai à 16h53
L'idéal pour le moment, reste d'établir une feuille de route/plan avec la version 5.5, puis de la faire appliquer à la version 5.3. Le problème étant que lorsque l'on demande d'appliquer un plan, bien évidemment, on ne peut pas changer de modèle... Il faut passer outre, puis changer de modèle, puis demander de reprendre mot à mot le plan.
Et le plus beau ? OpenAi a annoncé que le modèle "-codex" serait le dernier, place désormais à l'usine à gaz qui sait tout faire, qui consomme beaucoup plus de token, parce que "l'agentique saybien" 🤔
Accessoirement, on est nombreux à avoir le sentiment qu'un nouveau modèle impressionnant au début est rapidement castré ensuite passé la "hype" (quantizé ?), et les anciens modèlent semble aussi finir par avoir des performances dégradées..
Le 4 mai à 11h32
Ça serait intéressant de pouvoir mettre une appréciation sur les articles, je pense : ça pourrait vous permettre d'avoir une vision plus précise des articles appréciés ou non. (Il faudrait bien sûr rendre ça non ambigu entre "j'aime l'article mais pas son objet" et "je n'aime pas cet article mais j'aime son objet".)
Le 5 mai à 06h34
Le 5 mai à 08h30
Qui n'a jamais constaté 5 avis différents dans une discussion avec 3 personnes ?
Sans parler du discours politique qui arrive à sortir 3 contradictions en une phrase
Le 5 mai à 16h11
Il a dit intelligence, tu es hors jeu
Le 5 mai à 19h36
Cela dit, je ne compte plus ceux où j'ai 3 avis différents de la même personne lors des atelier métier pour expliquer le as-is.
Le 5 mai à 20h59
Ou alors, tu as des fréquentations bizarres
Le 5 mai à 21h25
Qui étaient, pour finir, toutes erronées à divers degrés !
Les projets de transformation IT à l'échelle d'une entreprise sont toujours de grands moments de rigolade.
Le 6 mai à 11h06
Le 6 mai à 14h32
Signaler un commentaire
Voulez-vous vraiment signaler ce commentaire ?