Connexion Premium

Claude Sonnet 5 : plus agentique, plus malin et bientôt plus cher

Un Sonnet, pas une Fable

Claude Sonnet 5 : plus agentique, plus malin et bientôt plus cher

Illustration : Flock

Anthropic a dévoilé une mise à jour importante pour son modèle « milieu de gamme » Sonnet, désormais proposé en version 5. Il gagne en capacités agentiques et il est proposé avec un rabais jusqu’à la fin de l’été.

Anthropic décline ses différents modèles en trois familles principales : Haiku, le plus rapide et le plus économique ; Sonnet, le polyvalent qui vise le meilleur compromis prix/vitesse/intelligence ; et Opus, le haut de gamme et donc, le plus cher. Le labo IA a également lancé Mythos, son modèle expérimental le plus avancé, dont la version « grand public », Fable, a été temporairement bloquée par l’administration Trump jusqu’au 30 juin (on y reviendra dans un autre article).

En attendant que Fable puisse faire l’objet d’un déploiement commercial à plus grande échelle, Anthropic a entrepris d’améliorer Sonnet qui passe de la version 4.6 à la 5 directement, probablement pour se caler sur la nomenclature des nouveaux modèles. Sonnet 5 est censé mieux gérer les tâches dites « agentiques » : planifier une suite d’actions, utiliser un navigateur, manipuler un terminal, écrire ou corriger du code, vérifier son propre travail, poursuivre une tâche sans s’arrêter trop tôt.

L’entreprise affirme que cette nouvelle version de Sonnet réduit l’écart avec Opus 4.8, le modèle supérieur actuel. Ce dernier se montre toujours plus performant que son petit frère comme le montrent les benchmarks d’Anthropic, que ce soit sur le code agentique (63,2 % sur SWE-bench Pro, contre 69,2 % pour Opus 4.8 par exemple). Cela n’en reste pas moins un gain substantiel par rapport à Sonnet 4.6, sur tous les plans.

Un rabais estival avant la douloureuse

Anthropic insiste beaucoup sur la partie prix : Sonnet 5 revient à 3 dollars par million de tokens en entrée et 15 $/M en sortie. C’est le même tarif que Sonnet 4.6, mais il y a un mais. Le modèle reprend le tokenizer inauguré par Opus 4.7 qui fait consommer davantage de tokens au modèle. Anthropic admet que Sonnet 5 peut brûler jusqu’à 35 % de tokens supplémentaires pour un même texte.

Résultat : utiliser le nouveau modèle Sonnet va coûter plus cher. Pour faire passer la pilule, Anthropic offre généreusement un rabais sur le token (2 $/M en entrée, 10 $/M en sortie), mais… jusqu’au 31 août. Opus 4.8 est toujours le plus onéreux, à 5 $/M en entrée, et 25 $/M en sortie.

Sur le plan de la sécurité, Anthropic affirme que les hallucinations de Sonnet 5 sont moins fréquentes. Le modèle est aussi présenté comme plus résistant que Sonnet 4.6 aux injections de prompts et à certaines requêtes malveillantes. La société reconnait néanmoins que sur certains tests de comportement indésirable, Opus 4.8 lui reste supérieur, tout comme (évidemment, pourrait-on dire) Mythos Preview.

Puisqu’on parle du champion toutes catégories de la cybersécurité, restons encore un peu sur le sujet. Sonnet 5 n’a pas été entraîné pour ce genre de tâches, il est donc beaucoup moins capable qu’Opus 4.8 ou Mythos 5. Anthropic l’a doté de garde-fous activés par défaut, mais qui restent moins stricts que ceux de Fable 5. « [Sonnet 5] peut effectuer certaines tâches de cybersécurité courantes et non nuisibles », explique l’entreprise, mais ses performances en matière de développement d’outils exploitant des vulnérabilités sont « largement inférieures » à celles des deux modèles hauts de gamme.

Sonnet 5 devient le modèle par défaut pour les utilisateurs gratuits et les abonnés Pro. Il est aussi disponible pour les clients Max, Team et Enterprise, ainsi que dans Claude Code et pour l’API.

Commentaires (3)

votre avatar
Est-ce qu'on est vraiment obligés de faire leur pub à chaque fois ?
(Déso hein, mais j'ai un peu l'impression de lire un communiqué du vendeur, comme de plus en plus, et trop souvent - "plus agentique, plus malin". Ça fait complètement le jeu des OpenIA, Anthropic & co., qui ne cherchent qu'à cultiver la hype et occuper le terrain, amha).
Vivement que cette foutue bulle explose...
votre avatar
Bah, t'en fais pas, avec les performances du dernier GLM, il y a désormais des modèles open source dispo sur des services hors USA qui font suffisamment bien le taff pour pouvoir se passer d'Anthropic.
Donc, leur augmentation tarifaire va en faire fuir plus d'un.
votre avatar
Quand je vois que cette "foutue bulle" fait tant dans mon quotidien perso que pro (it & plateformes engineering)...

Perso, je pense que "la bulle" n'est pas encore prête d'exploser.

On tient là une de ces grandes accélérations de l'informatique pour une génération entière.

Ça arrive une fois tous les 20 ans. Les précédentes par ordre retro: 2000 - internet & mobile ; 1980 - ordinateur personnel ; 1960 - languages de prog plus haut niveau & compilos ; 1940 - transistor & informatique tout court).