Connexion Premium

Depuis son retour, Claude Fable 5 fait beaucoup moins rêver

Toxicité politique

Depuis son retour, Claude Fable 5 fait beaucoup moins rêver

Anthropic

Depuis son retour, Fable 5 est la cible de critiques virulentes sur ses performances. Le modèle ne semble pas présenter les mêmes capacités qu’avant son blocage, suite à la directive de la Maison-Blanche. Même Mythos 5 semble perdre de sa superbe.

Rappelons rapidement quelques éléments chronologiques. Le 9 juin 2026, Anthropic lance Claude Fable 5, une version de Mythos 5 disposant de garde-fous et présenté alors comme le modèle le plus « capables » de l’histoire de l’entreprise. Trois jours plus tard, une directive de contrôle des exportations, signée par la Maison-Blanche et juridiquement contraignante, force Anthropic à suspendre l’accès aux deux modèles pour tout ressortissant étranger, y compris ses propres employés non-américains. Le décret conduit l’entreprise à un arrêt mondial pour tous les clients, Anthropic ayant jugé impossible de filtrer les utilisateurs par nationalité en temps réel.

Le déclencheur invoqué était un rapport de chercheurs d’Amazon selon lequel Fable 5 aurait pu être manipulé (jailbreaké) pour livrer des informations exploitables dans des cyberattaques. En toile de fond, des soupçons qu’un groupe lié à la Chine ait pu accéder à Mythos, ce qui faisait craindre une rétro-ingénierie ou une distillation par un adversaire étranger.

Fin juin, le Department of Commerce lève ces contrôles. L’accès à Fable 5 est restauré le 1ᵉʳ juillet sur Claude Platform, Claude.ai, Claude Code et Claude Cowork. Mythos 5, lui, reste réservé aux partenaires vérifiés du programme Glasswing, comme on l’a vu avec Mozilla.

Au-delà du temps perdu par Anthropic (environ trois semaines), le retour de Fable 5 ne s’est pas fait sous les cotillons. Ses performances, selon les cas d’utilisation, semblent en fort retrait. Pendant ce temps, l’utilisation des modèles chinois grimpe rapidement.

Kaboum !

Dans la plupart des résultats obtenus avant le retrait de Fable 5, de nombreux sites ont relevé les excellentes performances du modèle, notant souvent un saut générationnel significatif. Parmi les notes obtenues : 80,3 % sur SWE-Bench Pro (contre 69,2 % pour Opus 4.8), 64,5 % sur Humanity’s Last Exam avec outils (contre 57,9 % pour Opus 4.8 et 52,2 % pour GPT-5.5), et ainsi de suite pour tous les benchmarks majeurs (FrontierCode Diamond, OSWorld-Verified, GDPval-AA, Terminal-Bench 2.1), comme relevé notamment par Datacamp.

Pour Every, le résultat était encore plus tranché : Fable 5 était tout simplement « le meilleur modèle de programmation ». La société en tenait pour preuve le score de 91/100 obtenu sur leur propre benchmark « Senior Engineer », contre 63 pour Opus 4.8 et 62 pour GPT-5.5. Même son de cloche chez BenchLM.

C’est là que le tableau se complique singulièrement depuis le 1ᵉʳ juillet. Le retour de Fable 5 s’est accompagné d’un nouveau classificateur de cybersécurité, et selon des données publiées le 2 juillet par la plateforme de test BridgeMind, les scores de débogage TypeScript de Fable 5 se sont effondrés de 70 %, comme relevé par Tech Times.

Pourquoi une telle chute ? A priori, pas parce que le modèle en lui-même est devenu moins performant. La faute semble bien incomber au nouveau classificateur, qui redirige une part des requêtes liées à la programmation vers Opus 4.8, sans que les utilisateurs en soient toujours informés.

Il reste 67% de l'article à découvrir.

Cadenas en colère - Contenu premium

Soutenez un journalisme indépendant,
libre de ton, sans pub et sans reproche.

Accédez en illimité aux articles

Profitez d'un média expert et unique

Intégrez la communauté et prenez part aux débats

Partagez des articles premium à vos contacts

Commentaires (1)

votre avatar
C'est plutôt fréquent de voir l'effet "waouh" passer sur la sortie de nouveaux modèles pour constater ensuite une dégradation. La question de coût de fonctionnement est la première hypothèse qui me vient en tête.

Comme le Cloud à son époque, les modèles d'IA commerciaux en SaaS ne sont pas assez chers. Sauf que, contrairement au Cloud, le dumping commercial risque de moins bien marcher vu la puissance colossale requise par les modèles américains.

Et si le protectionnisme du gouvernement américain vient fourrer son nez pour bloquer l'usage, autant dire qu'ils jouent à la roulette russe avec un automatique.