Connexion Premium

L’IA générative, « instrument de précision » pour la censure et la répression en Chine

La grande murAI

L’IA générative, « instrument de précision » pour la censure et la répression en Chine

Getty Images & Unsplash+

Un rapport de l’Australian Strategic Policy Institute montre comment la Chine utilise l’IA générative pour transformer son système de contrôle de la population en un instrument encore plus précis pour renforcer la désinformation et la surveillance biométrique. Le marché de l’innovation créé par le pouvoir « permet aux entreprises de se conformer plus facilement et à moindre coût aux obligations de censure ».

L’utilisation de l’IA en Chine pour la surveillance de la population n’est pas nouvelle. Concernant l’IA générative, dès la sortie de DeepSeek-R1, on pouvait constater une censure au sujet de Taïwan, de la répression de la place de Tian’Anmen en 1989 ou de Xi Jinping, notamment.

Mais, selon l’Australian Strategic Policy Institute (ASPI, un think tank australien financé essentiellement par son gouvernement), la Chine s’appuie maintenant grandement sur les LLM pour automatiser la censure, renforcer la surveillance et réprimer préventivement la dissidence. Ainsi, elle peut transformer son système de contrôle étatique « en un instrument de précision permettant de gérer la population et de cibler des groupes à l’intérieur et à l’extérieur du pays ».

Dans l’introduction de son rapport [PDF], l’ASPI signale déjà l’importance du jeu sémantique des autorités chinoises qui utilisent le terme de « sureté de l’IA » (AI safety en anglais) non pas comme un concept de protection des utilisateurs contre les dangers ou les biais, mais pour s’assurer que l’IA serve les valeurs fondamentales censées être défendues par le régime et la stabilité politique de l’État.

Il ajoute que « depuis le plan de développement de l’intelligence artificielle de nouvelle génération (2017) du Conseil d’État, la politique chinoise insiste sur le fait que l’IA doit être « sûre, fiable et contrôlable ». Cette formulation place le développement de l’IA au cœur des priorités de l’État en matière de sécurité et de stabilité. La réglementation exige des fournisseurs qu’ils se conforment aux « valeurs socialistes fondamentales » et interdit les productions qui « incitent à la subversion du pouvoir de l’État » ou « nuisent à l’image nationale » ». Ainsi, tout le thème de la sécurité et de la sureté de l’IA est perçu, en Chine, comme l’obligation de protéger le régime.

Une censure par le silence la plupart du temps

C’est dans ce sens que s’inscrit la censure mise en place dans les modèles de langage développés en Chine. L’ASPI a poussé un peu plus loin les tests sur cette censure en interrogeant les différents modèles non pas sur des textes mais sur l’analyse d’images. Ainsi, le think tank a testé le modèle Qwen d’Alibaba et GLM de Z.ia, via le service en ligne de chacune des entreprises chinoises en tant que fournisseur d’inférence. L’ASPI explique que la forme la plus directe de censure est le refus de réponse.

Qwen n’a répondu qu’à moins de 30 % des prompts contenant ce que le think tank appelle des « images politiquement sensibles », qui vont d’une photo d’Henri Cartier-Bresson d’une délégation de travailleurs défilant dans la province du Gansu pendant le Grand Bond en avant utilisée par le New Yorker à celle d’une banderole de Black Lives Matter, en passant par l’illustration des mesures anti-covid en 2022 en Chine.

L’ASPI remarque notamment la différence du taux de réponses en comparant ces résultats avec les réponses de Qwen hébergé chez Novita, un fournisseur états-unien. On peut aussi voir que le modèle a tendance à moins répondre lorsqu’il est interrogé en chinois qu’en anglais.

Lorsque les modèles chinois répondent, leur description des images a tendance à mettre en sourdine certains éléments. Ainsi, pour décrire l’imagerie du massacre de la place Tian’Anmen, Qwen, GLM ou Ernie évoquent très peu la censure, la répression, les demandes de plus de démocratie et les détails factuels par rapport à ChatGPT et Gemini. Par contre, les modèles chinois vont avoir tendance à générer des justifications de la répression :

Les chercheurs de l’ASPI ont aussi constaté des différences parfois importantes dans les réponses données par les chatbots chinois entre les réponses faites lorsqu’ils sont utilisés en chinois ou en anglais : « Qwen a présenté la plus grande divergence interlinguistique, en particulier pour les images liées au génocide ouïghour, au Falun Gong [mouvement spirituel réprimé en Chine, ndlr] et à l’indépendance du Tibet ».

La censure dans les modèles est, selon eux, un mélange entre toutes ces techniques. L’ASPI résume dans un tableau les différents problèmes pour chaque modèle (un ✔ représente l’existence de censure dans les réponses du modèle) :

« La menace réside moins dans la propagande ouverte que dans l’effacement silencieux, lorsque la machine qui décrit la réalité commence à décider quelles parties de la réalité peuvent être vues », pointe l’ASPI.

Un marché concurrentiel de la censure

Cette censure est visible à travers les contenus en ligne, explique le think tank : « en Chine, l’IA effectue désormais une grande partie du travail de censure en ligne, analysant d’énormes volumes de contenu numérique, signalant les violations potentielles et supprimant les contenus interdits en quelques secondes. Cependant, le système dépend toujours des modérateurs de contenu pour fournir le jugement culturel et politique qui fait défaut aux algorithmes ».

Après avoir analysé la façon dont les « modérateurs de contenus » (ByteDance, Tencent et Baidu) utilisent l’IA générative pour effectuer cette tâche, le think tank explique que « grâce aux progrès réalisés dans le domaine de l’IA, le système chinois de censure en ligne a évolué vers un mécanisme de contrôle plus sophistiqué sur le plan technologique, mieux intégré sur le plan commercial et plus adaptable sur le plan politique ». L’ASPI affirme que l’IA n’a pas remplacé les censeurs humains, mais qu’elle a permis « un modèle hybride à la fois évolutif et capable de s’adapter à l’évolution des priorités ».

« Ce qui était au départ un régime réglementaire dirigé par le Parti et l’État s’est transformé en un marché concurrentiel, dans lequel les entreprises privées innovent et réalisent des profits en alignant leurs technologies sur les objectifs du Parti communiste chinois », explique le think tank :

« Dans le même temps, la main-d’œuvre humaine peu rémunérée qui entraine, supervise et perfectionne ces systèmes améliorés par l’IA reste indispensable, garantissant que les limites de la liberté d’expression évoluent en fonction des changements politiques ».

Dans son rapport, le think tank décrit aussi un système judiciaire chinois envahi par l’IA depuis l’arrivée des modèles de langage. « Un accusé appréhendé grâce à la surveillance basée sur l’IA et jugé dans une salle d’audience assistée par l’IA peut alors être condamné, sur recommandation d’un système d’IA, à une peine dans une « prison intelligente » (智慧监狱) dotée de nombreuses technologies intelligentes », explique le rapport.

Commentaires (16)

votre avatar
ça fait peur...
votre avatar
Et dans quelques temps (Décennie ? Années ?), on va se faire dégommer par toute une armée et une population qui aura été formatté selon la "bonne" pensée du Parti et n'aura aucun mal à utiliser un prétexte fallacieux pour lancer les hostilités. Un peu comme si à l'heure d'aujourd'hui un pays justifiait une invasion pour un supposé nazisme au sein des dirigeants..... #OhWait :fumer:
votre avatar
Et dans quelques temps (Décennie ? Années ?), on va se faire dégommer par toute une armée et une population qui aura été formatté selon la "bonne" pensée du Parti
C'est déjà le cas, il te suffit de 3 minutes sur Quora pour voir les hordes de comptes chinois qui lancent des fausses questions sur une possible participation du Japon à la défense de Taiwan tout en bavant d'anticipation de pouvoir se venger de la WWII (en oubliant que toute grande et puissante que soit la Chine, on n'est jamais à l'abri des surprises et des déconvenues quand on se lance dans la guerre, n'est-ce pas Vlad !).

Absolument tous les cours d'histoire en Chine tournent autour de qui a lésé la Chine au cours de l'histoire (l'Europe avec les guerres de l'opium, la Russie/l'URSS avec les captures de territoires chinois sous la menace nucléaire, les Japonais pour la seconde guerre mondiale) avec le narratif toujours immuable des gentils petits Chinois bons moutons sur lesquels tout le monde tape parce que c'est facile. Ce n'est fait que dans un seul but : cultiver un esprit de haine vis-à-vis de tous ceux qui empêchent le PCC (parce qu'en vrai, les Chinois ils s'en tapent un peu, ils galèrent assez pour se faire une vie et une famille décentes) d'écraser toute l'Asie du Sud-Est.
votre avatar
Tous les pays ayant un dictateur au pouvoir ont le même narratif avec un ennemi qui voudrait les envahir. Pour la corée du nord c'est les USA, pour la russie c'est à la fois l'Ukraine, la Finlande, le Japon, la Norvège (Svalbard)
votre avatar
Pour la corée du nord c'est les USA
Et la Corée du Sud quand même (ils sont encore en guerre depuis les années 50, ce qui explique la vigueur et l'excellence de la BITD sud-coréenne).
votre avatar
post de @aesthr@wandering.shop
Last week in a seminar we discussed a text that was largely about sexual violence, including mass rape during war. Heavy stuff.
One student admitted they had not read the text but worked off a ChatGPT summary.
They had no idea the text was about sexual violence. ChatGPT withheld that information.
This wasn’t just a minor error nor a typical LLM hallucination.
About a third of the text, arguably its most important part, went completely ignored because it didn’t match OpenAI’s content policies
votre avatar
Quel futur merveilleux on nous prépare !
votre avatar
Encore un sous-titre aux petits oignons :yes:
votre avatar
Pouvoir réécrire la réalité c'était de la science-fiction.
Maintenant c'est le quotidien.
votre avatar
Pouvoir réécrire la réalité c'était de la science-fiction.
C'est loin d'être de la SF. Les États totalitaires s'en servaient (les photos avec des personnalités effacées chez Staline) et encore aujourd'hui la Russie réécrit ses livres d'Histoire vis à vis de l'Ukraine en disant que ce n'est pas un vrai pays et ses cartes mentionnent que les territoires attaqués sont russes.
votre avatar
la Russie réécrit ses livres d'Histoire vis à vis de l'Ukraine en disant que ce n'est pas un vrai pays et ses cartes mentionnent que les territoires attaqués sont russes.
J'ai corrigé :D
votre avatar
Yep, ça n'a rien de nouveau et c'est même une habitude plus plusieurs pays.

C'est comme lorsqu'on cite 1984 à tout va : ce n'est pas de l'anticipation, mais basé en grande partie sur l'URSS de Staline et le Reich d'Hilter. L'humain n'a aucune mémoire, hélas.
votre avatar
et le Reich d'Hilter. L'humain n'a aucune mémoire, hélas.
Effectivement :-P

C'est en train d'arriver (très fort) aux USA aussi.
votre avatar
Ils sont réécrit l'histoire depuis la naissance de la russie à aujourd'hui, par exemple pour les russes la seconde guerre mondiale c'est de 1941 à 1945 on leur a répété ça depuis leur enfance et de 1939 à 1941 c'est totalement occulté
votre avatar
A cette allure, ils vont bientot pouvoir "ouvrir" les sites de news extérieurs et réécrire en IA-in-the-middle les articles qui ne leur plaisent pas.

Scenario qui peut en inspirer certains et faire froid dans le dos de beaucoup de lambdas.
BRRRR
votre avatar
Ça serait bien de jouer le jeu aussi avec d'autres IA... Peut-être aussi que l'IP d'origine peut donner des résultats différents d'ailleurs, même en questionnant une même IA. Enfin, chaque personne possède sa propre réalité basé sur son point de vue, et ses expériences. Donc quoi qu'il en soit vouloir mettre tout le monde d'accord via une IA magique qui dirait la stricte "vérité" pour tout le monde tel un prophète n'a selon moi pas de sens, surtout concernant l'histoire et la géopolitique (on va dire, hors sciences exactes).