Connexion
Abonnez-vous

Éditeur de sites générés par IA, il spamme tellement Google que ses confrères se plaignent

Ce n’est pas personnel, c’est uniquement les affaires.

Éditeur de sites générés par IA, il spamme tellement Google que ses confrères se plaignent

À lui seul, le plus prolifique des éditeurs de sites francophones générés par IA a réussi à faire promouvoir plusieurs milliers d'articles, dont de très nombreuses fake news, par l'algorithme de recommandation de contenus Discover de Google. Au point que d'autres pros du SEO (pourtant eux-mêmes éditeurs de sites GenAI), en arrivent à se plaindre publiquement de cette surenchère et pollution.

Le 11 juillet à 15h50

Notre enquête sur les sites d'information générés par IA (GenAI) vient de prendre une tournure croquignolette. Au moment de son lancement, en février, nous avions dénombré un peu plus de 1 000 sites GenAI, et certains de leurs éditeurs nous accusaient alors de vouloir « bousiller le[ur] business » :

« Les gens veulent manger de la merde ? Donnez-en leur à la pelle plutôt que d'essayer de buzzer en cherchant à bousiller le business de milliers de sites. »

En ce mois de juillet, notre base de données en répertorie désormais plus de 5 000, rien qu'en français. Les mêmes accusent désormais l'un d'entre eux de « défonce[r] le business » à force de spammer Google avec des centaines de « conneries de fakenews massive (320 articles hier sur un seul site) pour s'en foutre plein les poches ».

En mars dernier, Next révélait, dans le cadre de notre enquête sur les sites d'information générés par IA (GenAI), que des infox « hallucinées » par ces derniers avaient déjà entraîné de nombreux médias de la presse quotidienne régionale à leur consacrer des fact-checks, après que ces rumeurs ont fait le buzz sur les réseaux sociaux.

Début mai, le service de fact-checking CheckNews de Libération publiait de son côté une enquête intitulée « Fausses annonces de fermetures de magasins : enquête sur ces sites générés par IA qui inondent Google de fake news », reposant en partie sur notre base de données de sites GenAI.

À l'époque, CheckNews avait identifié plusieurs sites, dont franchementbien.fr, LaPlasturgie.fr, atelier-de-france.fr ou encore mididelices.fr, ayant annoncé, à tort, la fermeture de boutiques Decathlon, NOZ, La Halle ou Darty.

Depuis, Le Parisien, La Voix du Nord, L'Indépendant, France 3, Ouest France ont, eux aussi, publié plusieurs autres fact-checks à ce sujet, après que des articles générés par IA ont, eux aussi, annoncé, à tort, la fermeture de magasins Promod ou Auchan, notamment.

À l'instar de ce qui s'était passé avec l'infox, « hallucinée » par des sites générés par IA, concernant les contrôles techniques annuels, des sites GenAI ont, eux aussi, publié des « fact-checks » à ce sujet, paraphrasant les articles suscités.

C'est d'ailleurs précisément pour aider les internautes à ne pas se faire avoir par des sites GenAI que nous avons développé notre extension (gratuite) pour Firefox et Chrome, comme le montrent ces captures d'écran.

Évoquant un préjudice en termes d'image de marque, mais également vis-à-vis de leurs propres employés et clients, plusieurs responsables des magasins en question hésitaient à porter plainte, faute d'avoir identifié le ou les responsables de ces articles mensongers, publiés sur des sites aux mentions légales mensongères ou inexistantes.

Un « maître de la désinformation via une diffusion industrielle de fake news »

D'après CheckNews, cette salve d'articles GenAI mensongers aurait été initiée par une figure bien connue des professionnels du référencement (SEO, pour Search Engine Optimization), Julien Jimenez, qualifié par l'un de ses concurrents de « maître de la désinformation via une diffusion industrielle de fake news sur ses propres réseaux de sites ».

Il reste 70% de l'article à découvrir.

Déjà abonné ? Se connecter

Cadenas en colère - Contenu premium

Soutenez un journalisme indépendant,
libre de ton, sans pub et sans reproche.

Accédez en illimité aux articles

Profitez d'un média expert et unique

Intégrez la communauté et prenez part aux débats

Partagez des articles premium à vos contacts

Abonnez-vous

Commentaires (22)

votre avatar
C'est assez étrange que Google ne trouve pas de solution contre ça, car il doit bien y avoir des choses similaire aux USA.
J'ai hâte que certains trouvent un moyen de porter plainte.
votre avatar
Ce n'est pas dans l'intérêt de Google de trouver une solution, qui touche, lui aussi, le pactole avec ça.
votre avatar
Niveau image de marque c’est quand même pas super non ?
votre avatar
Quand tu possèdes le droit de vie ou de mort sur les 3/4 du Web, l'image de marque j'ai envie de dire...

Les entreprises de la tech US passent leur temps à chier sur la tronche des gens.
votre avatar
Je pense pas que les gens fassent le lien entre discover et google. Déjà la plupart ne nomment même pas discover "Discover" mais s'en servent régulièrement
votre avatar
Très bon article. C'est une saga qui semble sans fin !!
votre avatar
C'est triste de se dire qu'en Chine, il aurait déjà disparu depuis des mois et aurait subitement réapparu en interview pour dire combien il s'était détourné du droit chemin...

Je suis quand même très étonné de la passivité de la Police/Justice sur Internet où au final vous pouvez mentir/tromper/voler/tricher autant que vous voulez sans AUCUNES conséquences de qui que ce soit, même si vous êtes parfaitement identifié et qu'une simple flagrance suffit à voir que c'est parfaitement illégale.

Cela rejoint d'ailleurs le harcèlement en ligne, où au final la Police/Justice ne fait strictement rien (voire classe l'affaire) tant bien même on vous menace de mort/de tuer vos enfants/de vous torturer/vous violer, et qu'ils le font souvent à des dizaines de personnes différentes (ie : pas un cas isolé), et qu'ils sont aussi parfaitement connus/identifié et se font de l'argent dessus...
votre avatar
La réponse pénale n'est pas évidente ici. Contrairement à l'affaire News.DayFR, où il y avait un plagiat manifeste d'articles de presse, l'éditeur dont il est question ici génère des contenus par centaines, mais sans forcément plagier une source précise. Sur quel fondement serait-il poursuivi ?
votre avatar
votre avatar
Je dirais l'article 27 de la loi du 29 juillet 1881 sur la liberté de la presse.

(et ouais, c'est pas un phénomène nouveau)
votre avatar
ça se tente, mais y'aura pas une coalition de 40 médias pour porter la charge en justice !
votre avatar
Y'a pas un syndicat dans ce domaine qui peut se porter partie civile et attaquer au nom de ses adhérents ?
votre avatar
C'est ce genre de chose qui me conforte dans ma position d'ignorer le web algorithmique.
votre avatar
J'adore quand même la réaction qui vient dénoncer votre mise en lumière "bousillant le business des autres", tout en dénonçant ceux qui en abusent encore plus.

Un peu le concept du bon et du mauvais chasseur, sauce IA.
votre avatar
Pour moi c'est aussi savoureux que les types qui produisent des torrents de contenus piratés et hurlent au scandale et au manque de respect parce que tu retires leur nom dans la release.
votre avatar
.
votre avatar
On voit bien la moralité du personnage…

Sur sa fiche LinkedIn Julien Jimenez :

« Passionné par le SEO et déterminé à atteindre mes objectifs » : du genre à faire un max de pognon, quoi qu’il en coûte à polluer et à spammer à mort et à outrance ?

Ou encore :

« Si l’un d’entre vous est capable de faire valider un site AdSense (un seul) de manière 100 % sûre en moins de 24h, je lui verse 3000 euros à la validation. »

ou bien encore :

"Obtenez votre backlink sur un site qui génère entre 1 et 2 millions de visiteurs par jour.
Prix : 400 € HT. Facture incluse.
L’objectif est que je rédige l’article moi-même, pour maximiser ses chances d’apparaître dans Google Discover.
Contactez-moi en privé."

J'adore le "facture incluse"... :mdr2:

Et il y a même apparemment un concours officiel à celui qui arrive à produire la plus grosse quantité de merd... automatisée :

"Alan et moi-même avons décroché la troisième place au concours SEO 2012 plus connu sous le nom de "Sentimancho" en réussissant à décrocher un PR7 en 45 jours pour notre nom de domaine: Necliquepasici.com."
votre avatar
Ce pseudo "jimenez", je l'ai déjà vu sévir sur HFR et peut-être ici (pas sûr pour Next). En tout cas, je l'ai déjà vu auparavant, avant de lire cet article.
votre avatar
Sous forme de questio pratique, puisqu'il existe une extention qui indique et permet d'indiquer les sites qui puent, n'y aurait-il pas quelque chose (script, exetension, moteur de recherche…) qui permetrait de ne plus afficher ces sites de merde dans un résultat de recherche ?
Ça s'est agravé depuis peu, mais plus moyen de cherché sur le net, sauf si vous connaissiez déjà le nom d'un site donné en réponse, mais en général ça apparait à la 3 ou 4e page…
votre avatar
Le web va devenir inévitablement une décharge... Que sa aille plus ou moins vite ca ne change pas grand chose.
Quoique si, si la puanteur arrive au nasaux de tous ptet bien que la génération qui vivra sans arrivera plus rapidement...
votre avatar
je n'aurais pas dit mieux.
votre avatar
Le web est déjà une décharge. Les médias sociaux abreuvent des consommateurs passifs de contenus faux depuis des années. Tout comme les sites optimisés SEO se contentaient auparavant de piquer des billets de blogs, des flux RSS ou repomper Wikipedia.

Le fond du problème ici, c'est le web algorithmique vendu par Google. Le plus dur, c'est de se sevrer de la dépendance à l'algo et apprendre à réfléchir par soi-même et non attendre qu'il nous vomisse ses contenus dans la bouche.

Éditeur de sites générés par IA, il spamme tellement Google que ses confrères se plaignent

  • Un « maître de la désinformation via une diffusion industrielle de fake news »

  • « Contrairement à certaines pratiques courantes du journalisme en ligne... »

  • 800 articles en un seul jour, troisième média le plus recommandé par Discover

  • À lui tout seul, il aurait lancé près de 140 sites GenAI (au moins)

  • Reporters sans frontières appelle Google à remanier Discover

Fermer