Connexion Abonnez-vous

Face à Gemini 3 Pro, Anthropic dégaine son Claude Opus 4.5

Le 25 novembre à 08h57

Anthropic était manifestement prête : une semaine après le lancement en grande pompe de Gemini 3 Pro par Google, la startup réplique avec la version 4.5 de son plus gros modèle, Opus.

Dans son billet d'annonce, Anthropic est très satisfaite de présenter des scores supérieurs à ceux de Google dans pratiquement tous les tests, y compris dans ARC-AGI-2, réputé difficile : 37,6 % pour Opus 4.5, contre 31,1 % pour Gemini 3 Pro et 17,6 % pour GPT-5.1. Anthropic met surtout en avant ses performances dans le développement, où son modèle reprend la couronne, en étant notamment le premier à dépasser la barre des 80 % sur le test SWE-Bench Verified.

Anthropic en profite pour s'intégrer davantage dans certaines applications. Ses extensions pour Chrome et Excel sortent ainsi de leur phase de test, avec un Claude pour Chrome prochainement disponible pour les abonnés Claude Max, et un Claude pour Excel bientôt disponible pour les abonnés Max, Team et Enterprise.

Les abonnés Max reçoivent d'ailleurs d'autres capacités, dont un travail de fond sur la mémoire censé permettre une utilisation prolongée des requêtes dans un même contexte, même quand ce dernier atteint la limite de jetons. À TechCrunch, Anthropic explique que la mémoire de contexte sera compressée de manière transparente, ce qui devrait être particulièrement visible dans le cas où un gros modèle est utilisé pour en piloter plusieurs petits (avec Claude Haiku), dans un cadre de développement agentique.

Signalons tout de même que même si Anthropic récupère la couronne dans presque tous les tests, c'est à travers un modèle accessible uniquement par les comptes payants. Les utilisateurs gratuits ne peuvent utiliser que Haiku et Sonnet, là où Gemini 3 Pro a été diffusé dans tous les produits et pour l'ensemble des utilisateurs (avec des limites bien sûr).

Le 25 novembre à 08h57

Commentaires (6)

votre avatar
Qui c'est qui a la plus grosse ?
votre avatar
Il y a un an, la course à l'échalotte de l'IA tournait autour d'OpenAI et des versions de ChatGPT.

xAI avait, comme d'hab, lâché une version minable de leur modèle grok, inutilisable et dont tout le monde se fout¹, la veille de l'annonce de Gemini3.

OpenAI sortait une correction de ChatGPT-5, modèle qui ne cesse de décevoir. D’ailleurs à l’utiliser, on a du mal à voir le rapport entre les benchmarks, la communication de Sam Altman et une réalité très décevante.

Anthropic a donc aussi réagit aussi à la sortie de Gemini3 en sortant enfin la version Opus de son modèle. Elle devait être en besace depuis le début cette version.

Y’a pas un an, Google n’existait pas dans la rat-race de l’IA. Aujourd’hui ils sont les meneurs de cette course de la reine rouge.

Passionnant. Comme des courses hippiques² 🍿

¹ oui, je sais, j'en parle. Mais c'est pour le plaisir de bitcher
² vous pouvez m'appeler Omar Sharif
votre avatar
y'a quand meme une evolution, EM veut attendre une AGI avec un POC de joueur de LOL. Un peu la même vibe que pour les échecs au début 90, cela a bouleversé le monde actuel. Alors oui c'est une course de qui aura la plus grosse mais on rigole bien avec leur discours marketing sans lien avec la réalité :)
votre avatar
Derrière cette course à l'échalotte, il y a de réels progrès. Comme lu récemment:
Three years ago, we were impressed that a machine could write a poem about otters. Less than 1,000 days later, I am debating statistical methodology with an agent that built its own research environment.
votre avatar
Il faudrait qu'on puisse juger la course à l'échalotte avec des critères plus pertinents que leurs benchmark à moitié pipés.
votre avatar
Le problème de la course à la bêtise c'est comme un gros wagon rempli de gens hype, de gens 'in' et tout ça; lancé à pleine vitesse sur les rails de la 'vibe'. Problème : la prochaine station s'appelle 'realité'.

Face à Gemini 3 Pro, Anthropic dégaine son Claude Opus 4.5

Fermer