Connexion Premium

Google pénalise les publicités générées par IA (mais pas les médias générés par IA)

IAdvertising

Google pénalise les publicités générées par IA (mais pas les médias générés par IA)

Illustration : Flock

L’an passé, Google a fait face à une crue de publicités reposant sur l’usurpation d’identité, générée par IA, de personnalités, afin de promouvoir des escroqueries. La régie publicitaire de Google a « rapidement constitué une équipe de plus de 100 experts », et suspendu « plus de 700 000 comptes d’annonceurs ». Une célérité qui contraste fortement avec le laxisme de Google et de son algorithme de recommandation de contenus Discover pour ce qui est des médias générés par IA.

Le rapport 2024 de Google consacré à la sécurité de ses publicités, et aux efforts de ses équipes pour lutter contre l’utilisation malveillante de ses plateformes publicitaires, n’est pas bien long : 6 pages. S’il comporte de nombreux chiffres, il ne fournit pas d’informations détaillées sur les modus operandi des acteurs malveillants, contrairement à ses rapports orientés cybersécurité.

Il souligne cela dit que « l’une des tendances qui s’est dégagée dans l’ensemble du secteur est l’augmentation des publicités reposant sur l’usurpation d’identité de personnalités publiques » par des acteurs malveillants utilisant des images ou des sons générés par l’intelligence artificielle pour suggérer une affiliation avec une célébrité afin de promouvoir une escroquerie.

« Pour riposter », Google explique avoir alors « rapidement constitué une équipe de plus de 100 experts », dont des membres de la division Trust and Safety de Google, et des chercheurs de DeepMind, sa filiale spécialisée dans l’IA, précise TechCrunch.

Ils avaient été chargés d’analyser ces escroqueries afin de mettre au point des contre-mesures techniques, « telles que la mise à jour de notre politique en matière de fausses déclarations » en mars 2024 « afin de suspendre les annonceurs qui font la promotion de ces escroqueries » :

« Nous avons ainsi pu suspendre de façon permanente plus de 700 000 comptes d’annonceurs en infraction. Cela a entraîné une baisse de 90 % des signalements de ce type d’annonces frauduleuses l’année dernière. […] En 2024, nous avons bloqué ou supprimé 415 millions de publicités et suspendu plus de 5 millions de comptes pour avoir enfreint nos politiques en matière de publicités les plus étroitement associées à des escroqueries. »

Une célérité et une efficacité qui contrastent fortement avec le laxisme que nous avons pu documenter pour ce qui est du moteur de recherche de ce même Google. Celle-ci n’arrive pas à appliquer ses propres règles pour ce qui est des contenus non publicitaires indexés par son moteur de recherche.

Une quarantaine (au moins) de sites d’information générés par IA (GenAI) polluent en effet depuis des mois l’algorithme de recommandation Discover de Google, et les résultats de Google Actualités sont truffés d’articles GenAI reposant sur du plagiat.

Seuls les publicitaires doivent mentionner les contenus générés par IA

Le rapport 2023 avait déjà expliqué que la « principale tendance » avait cette année-là été « l’impact de l’IA générative ». Google y rappelait avoir lui-même recours à l’IA depuis des années, afin de « détecter et bloquer des milliards de mauvaises publicités avant que quiconque ne les voie ». Il soulignait également que les modèles d’apprentissage automatique « ont toujours besoin d’un entraînement intensif », et qu’ils s’appuient « sur des centaines de milliers, voire des millions d’exemples de contenus illicites ».

Or, si les modèles traditionnels sont « entrainés pour détecter ces violations », il est « parfois difficile de différencier deux faux services et d’adapter rapidement nos systèmes d’application automatisés pour lutter contre les escroqueries » :

« Les LLM, quant à eux, sont capables d’examiner et d’interpréter rapidement le contenu à un volume élevé, tout en saisissant les nuances importantes de ce contenu. Ces capacités de raisonnement avancées ont déjà permis de prendre des décisions d’application plus précises et à plus grande échelle pour certaines de nos politiques les plus complexes […] en identifiant les modèles d’acteurs malveillants qui abusent de ces tendances et en distinguant une entreprise légitime d’une escroquerie visant à s’enrichir rapidement. Cela a aidé nos équipes à devenir encore plus agiles face aux menaces émergentes de toutes sortes. »

Le rapport soulignait d’ailleurs que fin 2023 et début 2024, Google avait déjà été confronté à « une campagne ciblée de publicités utilisant l’image de personnalités publiques pour escroquer les utilisateurs, souvent à l’aide de deepfakes », et avoir déjà « créé une équipe spécialisée pour y répondre immédiatement ».

Google avait ainsi mis à jour, en septembre 2023, ses règles en matière de contenu politique pour y préciser que « les annonces dans lesquelles du contenu synthétique dépeint de manière non authentique des personnes ou des événements réels ou d’apparence réaliste, devront le mentionner dans un communiqué visible » :

« Ce communiqué devra être clair et apparent, et figurer à un emplacement où les utilisateurs pourront facilement le remarquer. Ce règlement s’appliquera aux contenus de type image, vidéo et audio. »

Google Ads a par ailleurs mis à jour ses politiques « plus de 30 fois » l’an passé (contre 80 fois en 2023, et 57 en 2022). Google Search, de son côté, a procédé à près de 90 mises à jour, mais sans réclamer aux auteurs de contenus non-publicitaires qu’ils mentionnent, eux aussi, les contenus synthétiques qu’ils publient.

En mars 2024, le moteur de recherche avait pourtant annoncé trois nouvelles règles concernant le spam et ciblant notamment les éditeurs rachetant des noms de domaines expirés afin d’y publier, de façon massive des contenus générés par IA : utilisation abusive d’un domaine expiré, utilisation abusive de contenus à grande échelle et utilisation abusive de la réputation d’un site.

L’IA a contribué à identifier 97 % des pages problématiques

Le rapport 2024 précise aussi que l’IA améliore les capacités de la régie publicitaire de Google à « empêcher les fraudeurs d’entrer dans son écosystème ». Son programme de validation des annonceurs les oblige en effet à effectuer un grand nombre de tâches (valider son n° de téléphone, prendre un selfie vidéo, répondre à des questions, valider l’e-mail de son organisation, envoyer une pièce d’identité, etc.).

Pour certains secteurs (jeux d’argent et de hasard, santé, élections, documents officiels, cryptomonnaies, etc), les annonceurs doivent en outre respecter des critères supplémentaires, voire être certifiés. Le programme, qui couvre désormais plus de 200 pays et territoires, permet à la régie publicitaire d’avancer que « plus de 90 % des publicités vues par les internautes sur Google » émanent d’annonceurs « vérifiés ».

Le rapport ne précise pas si c’est aussi le cas pour les publicités qu’elle affiche sur d’autres sites que ceux de Google, mais loue l’efficacité des contrôles automatisés par l’IA :

« nos modèles s’appuyant sur l’IA ont contribué à la détection de 97 % des pages sur lesquelles nous avons pris des mesures l’année dernière. En utilisant ces modèles, nous avons considérablement accéléré l’examen des sites, ce qui a permis une monétisation plus rapide tout en empêchant les publicités d’apparaître sur les pages en infraction. »

Une accélération somme toute relative, le rapport 2023 ayant déjà souligné que, « pour mettre en perspective l’impact de l’IA sur ce travail : l’an passé, plus de 90 % de l’application au niveau des pages de nos éditeurs a commencé par l’utilisation de modèles d’apprentissage automatique, y compris nos derniers LLM ».

9 milliards de publicités « restreintes », 5 milliards « prohibées »

Toutes catégories confondues, les équipes sûreté de la régie publicitaire de Google ont ainsi bloqué ou restreint l’affichage de publicités sur 220 000 sites et 1,3 milliard de pages web du fait des restrictions applicables aux éditeurs afin d’éviter l’affichage de contenus problématiques.

L’écrasante majorité (1,2 milliard, soit 92 %) l’ont été en raison de contenus à caractère sexuel, 25 millions pour des contenus dangereux ou désobligeants, 19 millions parce qu’elles promouvaient des logiciels malveillants, 13,6 millions à cause de contenus choquants, 13 millions pour avoir promu ou vendu des armes, 9 millions des jeux d’argent et de hasard en ligne, 5 millions du tabac, 3,6 millions de l’alcool, 2,7 millions pour des abus en matière de propriété intellectuelle, et 1,1 million pour des « contenus sexuels explicites ».

La régie publicitaire a également restreint l’accès à 9,1 milliards de publicités « sensibles » d’un point de vue juridique ou culturel. Ce pourquoi Google s’efforce d’éviter de diffuser des publicités « à des moments et dans des lieux où elles pourraient être inappropriées ».

429 millions l’ont été du fait d’exigences légales, 268 millions parce qu’il s’agissait de services financiers, 109 millions de jeux d’argent ou de hasard en ligne, 96 millions de contenus pour adultes, 107 millions de médicaments ou produits de santé, 34 millions de l’alcool, et 115 millions en raison de problèmes de copyright.

Sur les 5,1 milliards de publicités bloquées ou retirées l’an passé parce que « prohibées » car susceptibles de heurter les utilisateurs, 793 millions l’ont été pour avoir abusé du réseau publicitaire, 503 millions pour violation de marque déposée, 280 millions du fait d’exigences légales, 147 millions pour des fausses déclarations, 71 millions pour violation de copyright, 42 millions de contenus inappropriés, 9 millions pour avoir permis ou promu des comportements malhonnêtes, 7 millions de produits et services « dangereux », et 890 000 pour contrefaçons.

39 millions de comptes d’annonceurs suspendus

Le rapport rappelle que 2024 fut par ailleurs une « année majeure pour les élections », à mesure que la moitié de la population mondiale a été convié à se rendre aux urnes. La régie publicitaire n’a, pour autant, été amené à vérifier qu’un peu plus de 8 900 nouveaux annonceurs électoraux, et « supprimé 10,7 millions d’annonces électorales de comptes non vérifiés ».

Au total, elle a également suspendu plus de 39,2 millions de comptes d’annonceurs (dont une « vaste majorité » avant même qu’ils ne publient d’annonces), soit plus de trois fois plus qu’en 2023, relève TechCrunch.

L’an passé, la régie publicitaire précisait en effet avoir « bloqué ou supprimé plus de 5,5 milliards de publicités, soit une légère augmentation par rapport à l’année précédente, et suspendu 12,7 millions de comptes d’annonceurs, soit près du double par rapport à l’année précédente » :

« Nous avons bloqué ou restreint la diffusion de publicités sur plus de 2,1 milliards de pages d’éditeurs, soit une légère augmentation par rapport à 2022. […] Nous avons pris des mesures d’application plus larges au niveau des sites sur plus de 395 000 sites d’éditeurs, ce qui représente une nette augmentation par rapport à 2022. »

Un chiffre qui, cela dit, reste sujet à caution : le mini rapport consacré aux publicités bloquées aux États-Unis y mentionne là aussi 39,2 millions de comptes d’annonceurs suspendus. À quoi il convient de rajouter 2,9 millions de comptes en Inde, 1,4 au Japon, 1,3 au Brésil, 1,1 au Royaume-Uni et 841 000 en Australie (Google ne détaille pas de chiffres pour les autres pays).

Le rapport de la régie publicitaire de Google ne précise pas si son « équipe de plus de 100 experts » de l’IA aurait également été conviée à améliorer la détection des sites entièrement générés par IA – et ne respectant donc pas les règles de Google en matière d’utilisation d’outils d’IA générative –, ainsi qu’à empêcher leurs éditeurs d’engranger des revenus publicitaires – notamment sur Discover – qui auraient normalement dû être perçus par de vrais médias reposant sur le travail de journalistes.

Commentaires (7)

votre avatar
La soit disante "IA' est en train de tuer le WEB, tout en détruisant notre planète ...
votre avatar
Que de nombres !
votre avatar
J'avoue que les médias IA commence à devenir compliqués à gérer chez Google, je vois notamment passer des news dans Discover où le sujet et le nom du site n'ont absolument rien à voir (pour imager : un article Tesla sur un site d'architecture). Vu ce que je consulte les pubs, j'ai pas encore constaté ce phénomène, on va dire que c'est bien filtré.

Mais on voit bien que Google se retrouve en posture difficile, où l'IA qu'il promeut est en train de le couler en même temps...
votre avatar
Mon instance FreshRSS n'est pas polluée par ce genre de contenu :D
votre avatar
Idem pour moi en utilisant la PWA InfoRoom.

Et pour tester avec Next : https://inforoom.fr/?add=https://next.ink/feed/free
votre avatar
Votre livret A menacé de fermeture sous conditions ? Gare à cette intox
Un article alarmiste sur le livret préféré des Français, qui plus est probablement généré par intelligence artificielle, s’est retrouvé en bonne position dans Google News puis a été repris sur TikTok - tout cela alors que l’article est une intox
votre avatar
Traduction : bannir Google news et Tik tok de ses sources d'information et se référer à des sites plus fiables.

La mise en avant de contenu par popularité est une connerie sans nom.