Connexion Premium

Les contenus générés par IA devront être tatoués, sauf s’ils sont vérifiés par un humain

It's not a bug, it's AI feature

Les contenus générés par IA devront être tatoués, sauf s’ils sont vérifiés par un humain

Illustration : Flock

L’article 50 de l’AI Act oblige les fournisseurs et exploitants de contenus (textes, images, sons, vidéos) synthétiques générés par IA à les marquer comme tels, de façon indélébile et « de manière claire et identifiable » au premier coup d’œil, afin de lutter contre la désinformation. Dans une consultation, ouverte jusqu’au 3 juin, la Commission européenne propose cela dit que les contenus générés par IA ayant « fait l’objet d’une vérification humaine ou d’un contrôle éditorial » soient exemptés de cette obligation de transparence.

La Commission européenne vient de lancer une consultation sur son projet de lignes directrices concernant les obligations en matière de transparence du règlement sur l’IA (AI Act), ouverte jusqu’au 3 juin.

Entré en vigueur en août 2024, un certain nombre de ses modalités ne sont pas, en effet, encore appliquées, et restent à négocier, comme nous le rappelons dans notre dossier à ce sujet.

« Nous souhaitons réduire les risques d’usurpation d’identité et de tromperie », résume sur LinkedIn Lucilla Sioli, directrice du bureau IA de la direction générale des réseaux de communication, du contenu et des technologies (DG Connect) de la Commission :

« Le projet de lignes directrices clarifiera la portée des obligations de transparence prévues à l’article 50 de la loi sur l’IA et sera complété par un code de bonnes pratiques. Ce code est rédigé par des experts indépendants et devrait être finalisé début juin. »

L’objectif est de permettre aux personnes physiques de distinguer les contenus (audio et donc aussi musicaux, images, textes et vidéos, y compris en réalité virtuelle ou « augmentée ») générés ou modifiés par IA (y compris agentique) des autres contenus (« par exemple, ceux créés par des humains ») et d’en vérifier l’origine.

Sont également concernés les contenus mixés avec du contenu généré par des humains, les jumeaux numériques, les contenus générés par IA (GenAI) « tels que ceux qui génèrent ou manipulent des images médicales ou qui produisent des évaluations des résultats d’apprentissage aboutissant à des décisions ou des recommandations sous forme de texte », ainsi que les systèmes d’IA agentique interagissant avec des environnements physiques ou virtuels, « pour autant qu’ils génèrent des contenus audio, visuels, vidéo ou textuels synthétiques ».

Les fournisseurs et déployeurs d’IA devront dès lors informer les utilisateurs lorsqu’ils interagissent avec des « systèmes interactifs synthétiques » ou consultent des contenus générés ou manipulés par l’IA, « à moins que cette utilisation ne soit liée à une activité purement personnelle et non professionnelle ».

L’interprétation de cette exception exclut cela dit explicitement les personnes qui agiraient à des fins criminelles, ainsi que les deepfakes et contenus « politiques » générés par IA afin d’ « influencer le débat public sur des questions d’intérêt général » :

« Cette exclusion ne devrait donc pas s’étendre aux activités criminelles, car celles-ci ne peuvent être considérées comme purement personnelles, même si aucun avantage économique n’est recherché ou obtenu. De même, un « deepfake » généré par l’IA ou manipulé, rendu public par une personne et susceptible d’influencer le débat public sur des questions d’intérêt général (par exemple en raison de son contenu politique ou économique), ne devrait pas non plus être considéré comme une activité purement personnelle et non professionnelle. »

Un individu recourant à l’IA pour faire des deepfakes des membres de sa famille pour en faire des cartes de vœux à Noël qu’il envoie à ses proches ne serait dès lors pas concerné. A contrario, les deepfakes générés pour critiquer publiquement des décisions de responsables politiques devront être labellisés comme synthétiques et/ou générés par IA.

Dans les deux cas, le générateur de contenu IA devra de toute façon les avoir tatoués de façon à ce que les détecteurs automatisés de contenus générés par IA puissent les identifier comme tels.

L’AI Act valide in fine l’extension GenAI que Next a développé

Cette obligation de transparence vise, in fine, à lutter contre « les risques de désinformation et de manipulation à grande échelle, de fraude, d’usurpation d’identité et de tromperie des consommateurs », « contribuant ainsi à renforcer l’intégrité et la confiance dans l’écosystème de l’information ».

Les contenus devront ainsi être tatoués au moment de leur création, de façon « indélébile », nous explique Patrick Bas, afin de pouvoir être identifiables comme étant synthétiques, quand bien même leurs métadonnées auraient été altérées. Directeur de recherche et une des deux médailles d’argent du CNRS 2026, ce spécialiste des tatouages numériques invisibles fait partie des quelques chercheurs français membres des deux groupes de travail ayant contribué à la rédaction du document.

Il évoque les deux principales techniques qui devraient coexister : la signature numérique dans les métadonnées (mais qui peuvent être effacées, altérées ou modifiées) et le watermarking/filigrane, qu’il qualifie donc de « tatouage », quand bien même il serait « invisible », parce qu’il ne peut pas être enlevé, même via une capture d’écran ou si le contenu est imprimé puis rescanné.

Les éditeurs et exploitants devront de leur côté informer les utilisateurs lorsqu’ils sont exposés à des deepfakes, ainsi qu’à des publications générées par l’IA « portant sur des questions d’intérêt public », sous réserve de quelques exceptions.

Le considérant 14 du document valide par ailleurs l’extension GenAI que Next a développée afin d’alerter ses utilisateurs lorsqu’ils consultent un des 13 500 sites d’infos dont les articles, d’après nos constatations, sont « en tout ou partie générés par IA » :

« Étant donné que la préservation de la confiance et de l’intégrité de l’écosystème de l’information relève d’une responsabilité partagée, les autres acteurs, agissant dans le cadre de leurs activités professionnelles et diffusant des contenus tout au long de la chaîne de valeur (même s’ils ne sont pas directement concernés par l’article 50 de la loi sur l’IA), sont également encouragés à prendre les mesures appropriées afin que les personnes physiques exposées à ces contenus soient effectivement informées de leur origine artificielle ou manipulée. »

Le message d’alerte que l’extension GenAI de Next affiche sur les sites GenAI

Des contenus tatoués « dans un format lisible par une machine »

Il reste 61% de l'article à découvrir.

Cadenas en colère - Contenu premium

Soutenez un journalisme indépendant,
libre de ton, sans pub et sans reproche.

Accédez en illimité aux articles

Profitez d'un média expert et unique

Intégrez la communauté et prenez part aux débats

Partagez des articles premium à vos contacts

Commentaires (18)

votre avatar
C’est agréable de voir que le sujet ne semble pas avoir été baclé par la commission (vu toutes les précisions données, cas particuliers etc.)
Mais je me pose une question quand même :
Est-ce que subitement toutes les articles/documents générés par IA à partir du 2 décembre 2026 vont être datés du 1er décembre 2026 ?
votre avatar
Non, car ils ont besoin de générer du contenu "frais" pour les algorithmes de Google, qui doivent certainement détecter et pénaliser l'anti-datage.

D'ailleurs, en cherchant des infos sur un truc "à venir", j'ai déjà repéré des fermes de contenus qui inventent des articles et les modifient de façon très régulière pour les faire remonter sur Google Actualités. Du coup, ils répondent comme s'il se passait quelque chose en ce moment sur le sujet et attirer le clic.
votre avatar
Elles m'intéressent, ces fermes de contenus (je suis aussi joignable par mail & Cie si besoin) : leurs sites sont d'ores et déjà flaggués par l'extension ?
votre avatar
Le sujet que je cherchais était "HyperOS 3.1" et de mémoire quand je vois les résultats à date, les sites c'était Menow (flagué), fr.xiaomi-miui.gr (pas flagué) et VOI.id (flagué).

J'ai fait la même recherche avec quelques jours d'écarts pour essayer de comprendre "pourquoi eux ils avaient des news alors que pas les autres médias". J'ai remarqué alors que les actus avaient à chaque fois moins de 24h... mais ils ont l'air de s'être calmés depuis.

A noter que ça a l'air d'être aussi un sport sur YouTube, la chaîne Blintech a publié plein de vidéos en peu de temps sur ce même sujet d'HyperOS 3.1 : 2 vidéos dans les dernières 24h, une il y a 3j, une autre il y a 5j, une semaine, deux semaines, 1 mois...
votre avatar
À l’inverse il me semble qu’il y a (a eu ?) des sites qui antidataient leur contenu pour paraître venir d’un age anté-IA et donner une "humanité" à leur contenu
votre avatar
De nombreux sites GenAI reposant sur des noms de domaine expirés rachetés aux enchères remettent en ligne les anciens articles récupérés sur archive.org afin de profiter de leur ancienne réputation sur Google, ceci pouvant aussi expliquer cela.
votre avatar
Je vois passer aussi des sites parlant de sujets qui n'ont rien à voir avec l'objectif initial du site. Pour illustrer, c'est un site qui s'appelle genre jardinage-facile.tld qui parle d'actualité automobile.
votre avatar
Lorsque le risque de consanguinité des modèles de langage pointe le bout de son nez, on fait du lobbying pour faire voter une obligation de marquage du contenu généré par IA, et on fait passer ça pour une lutte contre la désinformation.
votre avatar
L'article 50 existe depuis l'adoption de l'AI Act en mars 2024, mais un certain nombre de ses modalités d'application restent à négocier, comme nous le rappelions dans notre dossier à ce sujet.
votre avatar
L’article 50(4) prévoit cela dit une exception lorsque le contenu généré par l’IA « a fait l’objet d’une vérification humaine ou d’un contrôle éditorial, et qu’une personne physique ou morale assume la responsabilité éditoriale de la publication de ce contenu » :
« On entend par « examen humain » l’examen minutieux du fond d’un contenu par une ou plusieurs personnes physiques possédant les compétences et le jugement professionnel requis en rapport avec le sujet examiné. Le contrôle éditorial désigne le contrôle exercé dans la pratique par une entité éditoriale responsable (par exemple, un rédacteur en chef) sur le contenu, cette entité ayant le pouvoir d’approuver, de modifier ou de rejeter le fond du texte pour des motifs de fond (notamment la vérification des faits et la garantie de la fiabilité des sources). »
Donc, les sites générés par IA juste pour avoir du trafic web, au prétexte qu'un humain est derrière tout ça et qu'il a tout vérifié en 30 secondes, les médias qui seront générées pourront ne pas être tatouées.

J'avoue ne pas trop comprendre la logique derrière ça. Ça pose un problème d'assumer qu'on utilise du contenu générée artificiellement ?
votre avatar
Le problème, c'est que la frontière entre "AI-assisted" et "AI-generated" va devenir extrêmement floue.

Les appareils photos intègrent déjà des options d'IA qui peuvent faire fluctuer fortement le taux d''intervention de l'IA (effacer un objet, étendre le cadre, lisser la peau...) , les rédacteurs s'aident de l'IA pour écrire/réécrire avec des pourcentages d'implication variables, les communiqués de Presse vont eux-même intégrer des rendus optimisés à l'IA...

Et on voit même l'IA agentique qui commence à cliquer directement sur l'écran, avec un Claude qui serait capable de demander une image à ChatGPT pour l'intégrer dans un Word qui va être envoyé par Gmail, à un destinataire qui va le recevoir via Copilot pour en faire un article publié sur le site. Alors comment garantir une vérification humaine sur tout les maillons de la chaîne ?
votre avatar
L’objectif est de permettre aux personnes physiques de distinguer les contenus (audio et donc aussi musicaux, images, textes et vidéos, y compris en réalité virtuelle ou « augmentée ») générés ou modifiés par IA (y compris agentique) des autres contenus (« par exemple, ceux créés par des humains ») et d’en vérifier l’origine.
Sont également concernés les contenus mixés avec du contenu généré par des humains, les jumeaux numériques, les contenus générés par IA (GenAI) « tels que ceux qui génèrent ou manipulent des images médicales ou qui produisent des évaluations des résultats d’apprentissage aboutissant à des décisions ou des recommandations sous forme de texte », ainsi que les systèmes d’IA agentique interagissant avec des environnements physiques ou virtuels, « pour autant qu’ils génèrent des contenus audio, visuels, vidéo ou textuels synthétiques ».
dans la même veine floutage de visages/plaques et parole synthétique mais je suppose entraîné sur des voix humaines sont concernés par le texte si j'ai bien compris, le premier étant modifié par IA et l'autre généré par IA
votre avatar
à la lecture de mes dernières recherches sur le web, avec DDD, je me dis que ce n'est pas l'IA qu'il faut tatouer ou signaler, mais l'absence d'IA, ça ferait moins de signalement et serait plus efficace…
Les recherches en question, sur des sujet très basiques, jardin, randonnée, cuisine ne donnent comme résultats, en tous cas les 20 ou 30 premiers, que des sites générés par ou ayant un fort recourt à l'IA (enfin 80% des réponses).
Sinon le filigrane ou autre qui serait mis en place, il sera détectable par les moteurs de recherche ? De façon à ne plus voir ces réponses emmerdantes ? J'en ai un peu ras le bol de mettre ces sites dans ma liste uBlacklist…
votre avatar
Alors je te rassure, dans 5 ans il n'y aura plus de moteur de recherche mais que des réponses IA sourcées sur les articles non tagués IA. 🤣
votre avatar
Et ce tatouage, ça sera sur la fesse gauche ou la droite ? :bocul:
votre avatar
Ca serait vraiment un soulagement de pouvoir directement identifier les contenus IA, mais je me demande comment on peut ajouter un filigranne à du texte.
votre avatar
Il existe plusieurs méthodes plus ou moins faillibles :


  • Usage statistique de mots ou de tournures

  • Modifications subtiles de tournures

  • Usage de caractères invisibles (il y a plein de sites "character remover" pour le watermark de ChatGPT)



Et d'autres que j'oublie.

Le problème du jeu statistique et des tournures, c'est qu'il influence le langage. Un article y'a une paire d'années mettait en lumière qu'une partie des "accusations" d'utilisation de LLM était aussi causée par une déformation de la langue et qu'à force d'utiliser les chat bots basés LLM, on en prenait les tics de langages.