Avec le modèle GLM-5.2, la Chine pourrait rebattre les cartes de la cybersécurité

De grandes responsabilités

Illustration : Flock

Vincent Hermann

Le 30 juin à 10h58

La stratégie américaine d’embargo pour contrer le secteur technologique chinois serait-elle contreproductive ? La question se pose, alors qu’une société chinoise pourrait bouleverser la cybersécurité en diffusant un modèle capable de rivaliser avec les LLM d’OpenAI et Anthropic.

Avec le modèle GLM-5.2, la Chine pourrait rebattre les cartes de la cybersécurité

De grandes responsabilités

Illustration : Flock

Vincent Hermann

Le 30 juin à 10h58

IA et algorithmes

12 min

La Chine parvient à égaler les performances du modèle Mythos d’Anthropic dans certains scénarios de cybersécurité. Une affirmation du Wall Street Journal ce 27 juin, qui se demande dans quelle mesure les décisions de la Maison-Blanche ont pu jouer dans une telle remontée. Depuis DeepSeek et la vaporisation temporaire de 600 milliards de dollars de capitalisation pour NVIDIA, on pouvait cependant s’attendre à ce que la Chine égalise de nouveau le score. Ou en tout cas vienne flirter une nouvelle fois avec les performances des grands modèles de frontière américains.

Le nouveau modèle chinois qui attire les regards se nomme GLM-5.2, lancé le 13 juin par l’entreprise Zhipu AI, renommée Z.ai. Plusieurs benchmarks lui attribuent de très bons résultats, particulièrement en cybersécurité. Au point de rebattre les cartes d’une situation déjà fébrile dans ce domaine, avec un modèle disponible gratuitement depuis HuggingFace.

GLM-5.2, le trublion

GLM-5.2 est un modèle conséquent de 753 milliards de paramètres. Son architecture est de type MoE (Mixture of Experts) avec environ 40 milliards de paramètres actifs à la fois par token (jeton). Un ratio d’activation de 5,4 % qui peut le rendre beaucoup moins onéreux à exécuter qu’un modèle dense (non-MoE) de taille équivalente. La fenêtre contextuelle est d’un million de tokens.

Si l’on parle de ce modèle, c’est qu’au-delà de ses performances, il est également open source (licence MIT) et à poids ouverts. Traduction : en plus d’un accès commercial par l’API de l’entreprise (1,40 dollar par million de jetons en entrée, 4,40 dollars en sortie), n’importe qui peut récupérer le modèle et le modifier à volonté avant de l’utiliser. À condition bien sûr d’avoir le matériel nécessaire.

Quelles performances ?

Dans sa communication, Z.ai met en avant les très bons résultats généraux de GLM-5.2 de manière générale. S’agissant initialement d’un modèle pensé pour la programmation, les benchmarks utilisés sont classiques : 62,1 % pour SWE-bench Pro (résolution de problèmes sur GitHub), 81 sur Terminal-Bench 2.1 (tâches d’agents), ou encore 99,2 sur AIME 2026 (problèmes mathématiques).

Sur les travaux de longue durée, les résultats obtenus sont proches de ceux d’Opus 4.8 d’Anthropic. Par exemple, sur FrontierSWE, GLM-5.2 obtient 74,4 %, contre 75,1 % pour Opus. Sur PostTrainBench, le score est de 34,3 contre 37,2. Sur SWE-Marathon en revanche, le modèle chinois accuse un retard : 13 %, se faisant largement distancer par les 26 % d’Opus 4.8.

L’entreprise chinoise met en avant certains choix architecturaux, dont l’utilisation d’une technique baptisée IndexShare (publication arXiv), permettant d’optimiser le coût de fonctionnement. Cela permet, selon Z.ai, de diviser par trois le coût en calculs par token quand on grimpe jusqu’au maximum de la fenêtre de contexte (un million). Elle affirme qu’au sein du modèle, 75 % des couches sautent entièrement l’étape d’indexation coûteuse, tout en maintenant la qualité des schémas d’attention adaptative.

L’ensemble fait dire à certains observateurs, comme Flowtivity, que GLM-5.2 est en fait meilleur que la grande majorité des grands modèles de frontières américains, car son fonctionnement est nettement moins onéreux (six fois moins cher que GPT-5.5 selon Z.ai). L’ajout d’IndexShare permettrait au modèle de fonctionner sur du matériel « accessible » (mais pas un MacBook Pro avec 16 Go de RAM, tel que celui utilisé pour nos tests de RAG).

IA

IA générative : le RAG par l’exemple, avec 15 000 actus Next et Mistral 7B

IA

Lundi 29 juin 2026 à 15h27 29/06/2026 15h27

42

Et dans la cybersécurité ?

C’est ici que les choses sérieuses commencent, peut-on dire. Dans une évaluation comparative réalisée par Semgrep, GLM-5.2 a obtenu un score F1 de 39 % sur la détection IDOR, battant Claude Code (32 %) pour environ 0,17 dollar par vulnérabilité trouvée, tout en restant inférieur au pipeline multimodal de Semgrep (53 - 61 % F1).

Même son de cloche chez Graphistry le 23 juin : avec un taux de résolution de 28 sur 59 sur les benchmarks CTF (Capture The Flag) de cybersécurité, GLM-5.2 est le « top modèle » à poids ouverts et rivalise directement avec les modèles propriétaires. Dans les tests, on peut voir par exemple que Claude Code avec Opus 4.7 est 19 % plus rapide, mais il est aussi 2,2 fois plus cher à l’utilisation.

C’est ce qui fait dire à Graphistry que GLM-5.2 est le premier modèle à poids ouverts testé par leurs soins pouvant être recommandé pour une « expérience de cybersécurité de qualité frontière ».

Comment de tels résultats ont-ils été obtenus si rapidement ?

C’est l’une des grandes questions autour de GLM-5.2. Les soupçons n’ont d’ailleurs pas tardé, dans les jours qui ont suivi la publication du modèle : Z.ai a-t-elle distillé agressivement les grands modèles de frontière américains ? Pour rappel, la distillation est initialement une technique légitime d’apprentissage machine : un modèle étudiant apprend à imiter les sorties d’un modèle enseignant. Cependant, il y a problème quand elle est faite en violation des conditions d’utilisation des API, via des comptes proxy et à l’échelle industrielle. Une technique formellement interdite dans les conditions pour toutes les API commerciales. Pour les « copieurs », le résultat obtenu est un transfert de capacités sans garde-fous.

Il reste 55% de l'article à découvrir.

Soutenez un journalisme indépendant,
libre de ton, sans pub et sans reproche.

Accédez en illimité aux articles

Profitez d'un média expert et unique

Intégrez la communauté et prenez part aux débats

Partagez des articles premium à vos contacts

Abonnez-vous

La suite de cet article est réservée à nos abonnés

Soutenez un journalisme indépendant,
expert et sans pub.

Abonnez-vous sur next.ink/subs

Commentaires (3)

dvr-x Premium

Le 30 juin à 11h21

Et nous on va se retrouver au milieu, tranquille, la nouille à l'air.
On ne fait pas de même parce qu'on est bien sage et on dépend du bon vouloir de l'administration Trump pour utiliser des modèles US, le tout en investissant bien peu dans notre propre système.

Dimitri Goimbault Premium

Le 30 juin à 11h44

L’administration US va devoir bien malgré elle ouvrir les meilleurs modèles frontier, à minima sur son territoire…

bingo.crepuscule Premium

Modifié le 30 juin à 11h47

Ces accusations de distillation me font doucement rigoler quand on sait que Anthropic et OpenAI ont pompé comme des gorets la littérature sur le dev, et tout ce qui traînait sur le web...
On appelle ça l'arroseur arrosé.

je dirais même mieux, GLM est libéré et téléchargeable. Alors certes, pas grand monde n'a les moyens de le faire tourner chez soi, mais sur le principe, une entreprise qui pour X ou Y raison veut s'affranchir d'une entreprise américaine, peut se débrouiller, et probablement à terme, un jour ou l'autre, les particuliers.
Et le tout, sans dépendre d'aucune connexion à internet, tout en local.

La rupture est nette, Anthropic et OpenAI ne se rendront désormais plus forcément indispensable pour les profils qui veulent tirer partie des LLM, on peut relocaliser l'outil ici. J'ai un copain qui bave à l'idée d'exploiter ses XX panneaux solaires qu'il a su récupérer pour peanut, s'en servant déjà pour miner, sans être raccordé au réseau ENEDIS/EDF.