Connexion Premium

Mythos : l’Europe tenue à l’écart du modèle IA le plus ambitieux du moment

Mythos toujours mytho en Europe

Mythos : l’Europe tenue à l’écart du modèle IA le plus ambitieux du moment

Anthropic

En distribuant avec parcimonie les accès pour Mythos, Anthropic a mis les régulateurs européens à l’écart. Sur le Vieux continent, seul le Royaume-Uni a obtenu un sésame. L’analyse qui en découle souligne les performances du nouveau grand modèle d’Anthropic, mais elle en pondère aussi le potentiel dévastateur utilisé par l’entreprise dans sa communication.

Mythos est le nouveau grand modèle de langage d’Anthropic, un LLM soi-disant si puissant que l’entreprise a décidé de le contraindre à un domaine spécifique, celui de la cybersécurité. Et histoire d’entretenir un sentiment d’exclusivité au motif de ne pas tenter des hackers mal intentionnés, la distribution de Mythos est limitée à une quarantaine d’organisations et une dizaine d’entreprises, toutes américaines.

Les participants au projet Glasswing sont censés laisser le LLM examiner le code de leurs logiciels afin de détecter et de corriger les bugs, et de boucher les vulnérabilités. Les autorités et les gouvernements, dont les infrastructures informatiques auraient elles aussi bien besoin d’un sérieux ménage, n’ont pas été conviés à la fête.

La courte liste des invités d’Anthropic

Lors de l’annonce du projet, Anthropic indiquait avoir engagé des discussions avec des responsables du gouvernement américain : « la sécurisation des infrastructures critiques constitue une priorité majeure de sécurité nationale pour les pays démocratiques ». Depuis, on a appris que l’entreprise avait présenté Mythos à l’administration Trump ; à tel point que les banques US ont été encouragées à utiliser Mythos pour sécuriser leurs systèmes informatiques. JPMorgan Chase est le seul établissement partenaire du projet, pour le moment.

La situation aux États-Unis est un peu particulière. Le gouvernement a en effet désigné Anthropic « fournisseur à risque pour la sécurité nationale », suite au refus de l’entreprise d’accorder une licence pour certains usages militaires. Depuis, les deux parties bataillent devant les prétoires.

Malgré les tensions, il existe au moins une sorte de dialogue soutenu entre Anthropic et les autorités américaines. En Europe, c’est le flou le plus total. Sur les 8 agences de cybersécurité européennes interrogées par Politico, seule la représentante allemande (BSI) a indiqué avoir entamé des discussions avec la start-up IA au sujet de Mythos. Mais l’agence fédérale n’a pas pu tester le modèle.

Le NCSC-NL, l’agence nationale de cybersécurité des Pays-Bas, a indiqué de son côté que l’impact réel des vulnérabilités identifiées était difficile à vérifier en l’absence de détails techniques. Une manière de dire que l’agence ne sait pas grand chose de Mythos… Plusieurs institutions gouvernementales européennes ont cependant laissé entendre qu’elles avaient un accès au LLM, mais fragmentaire. 

« Mythos nous donne un avant-goût de l’importance que va prendre l’accès aux capacités d’IA de pointe dans les années à venir », explique à nos confrères Daniel Privitera, de l’ONG allemande KIRA qui promeut une IA éthique, ouverte et bénéfique pour la société. « L’Europe ne dispose actuellement d’aucun plan pour garantir cet accès. »

Malgré l’arsenal réglementaire européen, en particulier l’AI Act, l’Union reste manifestement dépendante du bon vouloir des acteurs américains pour accéder aux technologies les plus sensibles.

Le Royaume-Uni limite la portée des promesses associées à Mythos

Contrairement aux voisins européens, le Royaume-Uni a lui obtenu un sauf-conduit pour Mythos. L’AISI, organisme britannique dédié à la sécurité de l’IA, a publié lundi 13 avril une première évaluation indépendante des capacités cyber offensives du modèle. Il y a une progression nette par rapport aux générations précédentes de LLM : Mythos est ainsi capable de mener des attaques en plusieurs étapes sur des réseaux vulnérables, affirme l’institut.

© AISI

Mythos atteint ainsi 73 % de réussite sur des tâches « capture-the-flag » niveau expert. Avant 2025, aucun modèle ne pouvait compléter ces tâches. L’étude va plus loin avec une attaque en 32 étapes (« The Last Ones »), qui représente environ 20 heures de travail humain. Mythos est le premier modèle à réussir l’attaque de bout en bout. Certes, il n’a réussi que 3 tentatives sur 10, mais tout de même. En moyenne, le LLM réalise 22 étapes sur 32. Claude Opus 4.6, le précédent modèle le plus performant, complète une moyenne de 16 étapes.

© AISI

Du côté du verre à moitié vide, l’AISI relève que Mythos échoue dans certains environnements, notamment industriels, et il peut rester bloqué sur des étapes techniques. Les chercheurs rappellent aussi que les environnements de test sont simplifiés par rapport à la réalité. Ils ne prennent pas en compte les systèmes de défense actifs, les outils de détection ni les réactions humaines en temps réel (les humains peuvent encore servir à quelque chose, ouf !).

En revanche, Mythos est bien en mesure de compromettre des systèmes mal protégés de manière autonome, en sachant que les capacités du modèle devraient logiquement continuer à progresser.

C’est la raison pour laquelle Anthropic insiste sur la nécessité de travailler avec les pouvoirs publics, et plaide pour une coopération plus large entre industriels et institutions, pour mieux encadrer les usages de ces outils. L’entreprise évoque même la création d’un organisme indépendant capable de superviser ces travaux. Un point de vue que l’on pourrait trouver paradoxal, compte tenu de la façon dont les acteurs de la tech luttent contre les tentatives d’encadrement réglementaire du développement de l’IA, notamment en Europe. La même ambigüité se retrouve d’ailleurs dans les dernières communications d’OpenAI et de Sam Altman sur le sujet, comme s’il fallait à la fois impressionner et rassurer quant à l’avenir de l’IA générative…

Commentaires (15)

votre avatar
Ils vont réussir à tuer Internet ou à nous créer un SkyNet...

Mais avant cela, quelle banque ou institution sensible confierait entièrement la sécurité de ses codes à une IA autonome ? Qu'est ce qui pourrait mal se passer ?
votre avatar
Mais avant cela, quelle banque ou institution sensible confierait entièrement la sécurité de ses codes à une IA autonome ? Qu'est ce qui pourrait mal se passer ?
De ce que je comprends de Mythos, c'est un outil d'analyse qui commence à mettre à mal le système de bug bounty en recréant des attaques complexes. Il doit des suggestions de code, mais ce n'est pas lui valide l'intégration du patch.

Donc toute la sécurité n'est pas confié à une IA autonome.
votre avatar
Questions:

1- Quand on confie l'entièreté d'un code pour analyse à une IA autonome, confie-t'on la sécurité de celui-ci en même temps. Même si l'IA ne peut pas modifier le code, il est exposé

2- A quel point est-il compliqué de modifier une IA faisant du bug bounty vers du gray voire du black hat ?
votre avatar
Quelles que soient les performances du modèle, choisir comme nom "Mythos" ça incite pas à la confiance!
Même en anglais (mythomania) ça m'étonne qu'ils aient gardé ce nom.
votre avatar
"Mythos" ça veut simplement dire "mythe" ; l'adjectif "mythique" en dérive et est très loin d'être négatif.
votre avatar
Bien sûr, j’entends bien l'intention du marketing . Mais reconnais que quand on cherche à promouvoir une technologie qui a tendance à inventer des réponses quand elle ne sait pas, l’appeler Mytho c'est maladroit!
votre avatar
l’appeler Mytho
Ti oublies le 's' à la fin.
Et en anglais, cette lettre se prononce. Donc en français, c'est plus 'Mythoce' que 'myro'
votre avatar
Ben quand tu dois nommer quelque chose, tu ne te préoccupes pas nécessairement de ce que ça veut dire dans toutes les langues du monde. Exemples :

Audi e-tron
https://www.ducon.com/
en.wikipedia.org Wikipedia (PROUT)
votre avatar
votre avatar
oui il y a clairement une emphase démesurée et un discours abusivement superlatif autour de Mythos, mais ça veut pas dire que le modèle est complètement du flan, cf les analyses chiffrées indépendantes qu'on présente justement dans cette actu
votre avatar
Si Mythos est si balèze qu'ils le disent, comment n'a-t-il pas détecté la faille qui a permis au code de Claude de se retrouver dans la nature ?

Vous avez quatre heures. Interdiction d'utiliser ChatGPT.
votre avatar
Déjà les appétences du gouvernement américain pour acquérir des produits de cette boite est louche. Ça leur fait de la pub.

Et avec ce sujet. J'ai l'impression que cela ressemble à une technique de vente. Nan toi t'as pas le droit t'es pas beau. Et puis après une négociation ou le prix va monter par rapport aux autres clients on obtient le précieux... qui ne sert pas à grand chose en comparaison du prix et du produit concurrent qui sort 1 mois après.

C'est moi ça a l'odeur d'un piège ?

Je ne sais pas si le produit fonctionne en local (en tout cas cloisonné dans un datacenter). Mais si c'est uniquement online (donc infra outre atlantique)...

Laisser un dispositif analyser ton code doit pouvoir se fait en local et pas Online. Les yankees je m'en fout. Mais pour des instances européennes qui commencent à voir que les USA n'ont fait que des coups de pùt3 ces 10 dernières années. Acheter en aveugle ce serait mettre la chevalière sur le gros doigt qui va venir chatouiller la muqueuse.
votre avatar
très bien vu +12
votre avatar
Claude Mynthos : il trouve facilement des snametr dans le péter chier