40 médias demandent le blocage de News.dayFR, le site GenAI qui plagie 6 000 articles/jour
Serial plagieur
40 médias français demandent à la Justice d'ordonner aux FAI le blocage du site news.dayfr.com. Ce dernier, le plus bourrin du millier de sites d'informations générés par IA que nous avons identifiés, plagie de 5 à 15 articles... par minute, et jusqu'à plus de 6 000 par jour.
Le 07 février à 11h32
19 min
IA et algorithmes
IA
Au printemps dernier, l'auteur de ces lignes animait une formation consacrée au fact-checking auprès de journalistes professionnels. L'un d'entre eux s'était excusé de devoir, en urgence, finaliser et mettre en ligne un article. Ce qu'il fit, tout en tentant de garder une oreille (plus ou moins) attentive pour suivre la formation, jetant un œil de temps à autre aux sites et pages web présentés.
Afin d'illustrer pourquoi et comment il convenait d'apprendre à identifier les articles et sites d'information générés par des IA (GenAI), je prenais comme exemple la page d'accueil de News.dayFR. Je l'avais déjà identifié comme le principal plagieur GenAI en français. Mais je ne m'attendais pas à ce que le journaliste découvre, stupéfait, que ce site venait de publier un copier-coller de son article, mis en ligne une demi-heure plus tôt seulement.


Le site, qui existe depuis (au moins) décembre 2021, et qui a utilisé également le nom de domaine france.dayfr.com entre 2022 et 2023, est probablement le plus productif de la centaine de sites reposant sur du plagiat et faisant partie du millier de sites d'info GenAI que nous avons identifiés. Jusqu'à mentionner, dans le corps voire le titre des articles qu'il plagie, le nom du média qu'il copie-colle, comme le montrent ces captures d'écran.


Il republie depuis, en très léger différé, des dizaines de milliers d'articles émanant tout autant de la presse quotidienne régionale (PQR) que de la presse nationale française. Il s'agit généralement de simples copier-coller d'articles qui viennent d'être indexés sur Google Actualités, parfois (très) légèrement modifiés, notamment dans le titre.
Libération a ainsi constaté que le site passait les articles plagiés dans un traducteur automatisé, au point, par exemple, de renommer le nom de son service de fact-checking « CheckNews » en « VérifierActualités ».
Ironie de l'histoire, l'article de Libération titré « Quarante médias saisissent la justice pour bloquer “News Dayfr”, un des multiples “sites parasites” générés par IA » a lui-même été copié-collé sur News.dayFR, qui va jusqu'à rajouter « – Libération » dans le titre de l'article plagié.

L'AFP, qui précise que « la procédure entamée contre News.DayFr.com est la conséquence d’une enquête journalistique réalisée par Libération et le média spécialisé Next », a en outre remarqué que le plagiat de l'article du Monde consacré à cette plainte est quant à lui émaillé d'erreurs provenant de mauvaises traductions : « le média Next y était ainsi renommé "Suivant" (la traduction française de son nom) » :
« La plainte fait suite à une enquête Libération et les médias en ligne spécialisés Suivant. [...] Nom des nouvelles. Jour. EN apparaît dans une enquête en plusieurs composants publiée depuis jeudi Libération et à Suivant qui note l’existence d’au moins un millier de ces sites d’information automatisés ou dopés par l’IA générative. »
Une demande de blocage, d'ici 15 jours
D'après Libé, qui fait partie des plaignants, les groupes de presse La Dépêche du Midi, Sud Ouest, PubliHebdos, La Montagne, le Télégramme et la Nouvelle République du Centre, représentant une quarantaine de titres de presse, viennent en effet de saisir la Justice pour qu'elle oblige les FAI à bloquer l'accès à News.dayFR.
Il reste 84% de l'article à découvrir.
Déjà abonné ? Se connecter
Soutenez un journalisme indépendant,
libre de ton, sans pub et sans reproche.
Accédez en illimité aux articles
Profitez d'un média expert et unique
Intégrez la communauté et prenez part aux débats
Partagez des articles premium à vos contacts
40 médias demandent le blocage de News.dayFR, le site GenAI qui plagie 6 000 articles/jour
-
Une demande de blocage, d'ici 15 jours
-
De 6 000 à 7 000 articles plagiés toutes les 24 heures
-
Un bouton pour rapporter les articles « copiés de mon site »
-
Une nébuleuse de sites, ciblant de nombreux pays
-
« 404 خطأ » (erreur, en arabe) & pictogrammes clonés
-
Vous voulez entrer sur Google News sans payer de journalistes ?
-
Un CMS égyptien utilisé dans une guerre de l'information en Libye
-
614ᵉ au classement des éditeurs d'actualités et médias en France
-
Des demandes de « nudes » et un chauffeur routier
-
4 300 articles en 24 h (un dimanche), soit 3 par minute
Commentaires (37)
Abonnez-vous pour prendre part au débat
Déjà abonné ? Se connecter
Cet article est en accès libre, mais il est le fruit du travail d'une rédaction qui ne travaille que pour ses lecteurs, sur un média sans pub et sans tracker. Soutenez le journalisme tech de qualité en vous abonnant.
Accédez en illimité aux articles
Profitez d’un média expert et unique
Intégrez la communauté et prenez part aux débats
Partagez des articles premium à vos contacts
Abonnez-vousLe 07/02/2025 à 12h05
Google ne se bouge quand même pas beaucoup...
Le 07/02/2025 à 12h38
Modifié le 07/02/2025 à 12h53
régisrégiE publicitaire...Le 07/02/2025 à 12h53
Le 07/02/2025 à 12h53
Le 07/02/2025 à 14h40
Le 07/02/2025 à 13h26
Le 07/02/2025 à 13h06
Le 07/02/2025 à 13h34
Sinon ta proposition marche aussi
Le 07/02/2025 à 13h17
Je note que l'automatisation est assez impressionnante et je me pose la question : comment font-ils pour pomper un article sur un site comme Libération où la majorité des articles sont payants ?
Ou alors ils ne pompent que ceux en accès libre ?
Ou bien ils utilisent un compte (moyen éventuel de les repérer donc peut probable) ?
Le 07/02/2025 à 13h29
Le 07/02/2025 à 13h33
Le 07/02/2025 à 14h01
Le 07/02/2025 à 14h09
Le 07/02/2025 à 14h08
Modifié le 07/02/2025 à 14h23
Le 07/02/2025 à 14h55
Le 07/02/2025 à 14h57
Le 07/02/2025 à 22h46
Modifié le 08/02/2025 à 09h15
C'est fou comment la capacité de notre espèce à créer des solutions à des problèmes qu'elle s'invente qui engendre de nouveaux problèmes me surprendra toujours.
Le 07/02/2025 à 14h19
Le 07/02/2025 à 15h49
Sinon si l'article a été passé dans une IA pour produire ça, cette IA est une grosse daube, c'est plein de fautes de grammaire et d'orthographe (qui ne sont pas dans l'article d'origine).
Le 07/02/2025 à 15h54
Vous êtes cités par lemonde :
https://www.lemonde.fr/pixels/
Le 07/02/2025 à 16h32
Ah et Next vous devenez Suivant !
Le 07/02/2025 à 16h37
Le 08/02/2025 à 10h47
Le 08/02/2025 à 11h23
Le 08/02/2025 à 13h52
Le 08/02/2025 à 15h08
Le 10/02/2025 à 17h45
Le 10/02/2025 à 20h19
Le 11/02/2025 à 12h14
Le 07/02/2025 à 15h56
Si les paiements des domaines / Cloudflare / hébergements n'a pas été fait depuis un paradis fiscal.
Le 07/02/2025 à 17h54
Je pense donc qu'ils ont un compte étant donné les giga octets d'images qu'ils doivent avoir. Et là il est sans doute envisageable de faire jouer les droits autour des images, ils n'en n'ont pas la propriété et sur une demande à WordPress, il est peut être possible d'obtenir qui est derrière où à minima de faire supprimer les images ou faire fermer le compte.
Le 07/02/2025 à 16h53
Le 07/02/2025 à 19h58
Je trouve que cela éclaire bien votre travail sur l'IA que j'ai parfois jaugé déséquilibré, alarmiste et surfant sur une sorte de conservatisme sceptique défensif face au changement.
Félicitations et merci.
Le 11/02/2025 à 13h20
Signaler un commentaire
Voulez-vous vraiment signaler ce commentaire ?