Connexion
Abonnez-vous

La presse régionale est, elle aussi, cannibalisée par des sites d’infos générés par IA

PQAIR guitar

La presse régionale est, elle aussi, cannibalisée par des sites d’infos générés par IA

Les sites d'information de la presse quotidienne régionale (PQR) sont de plus en plus victimes de pure players qui les concurrencent, voire les plagient, tout en étant générés par des IA. Si certains se positionnent comme des « médias indépendants », d'autres ne cherchent qu'à faire du clic. Au point que des journalistes de la PQR se retrouvent à devoir fact-checker des infos erronées car « hallucinées » par les IA qui les publient.

Le 06 mars à 11h17

Si la majeure partie des plus de 2 000 sites d'information générés par IA (GenAI) que nous avons identifiés tirent « tous azimuts », cherchant à concurrencer (voire plagier) les médias généralistes ou spécialisés, plusieurs cherchent tout particulièrement à concurrencer les sites d'informations de la presse quotidienne régionale (PQR).

Au point, pour certains, de les plagier, à l'instar de Breizh-Info, un site d'extrême-droite identitaire et conspirationniste dont les actualités régionales ne sont souvent, par ailleurs, que des « plagiats » d'articles préalablement publiés sur d'autres sites de la PQR (cf notre enquête).

Jusqu'à sa fermeture, mi-novembre, Gilles Charles, directeur de la publication « par interim » (sic) de GILLESCHARLES.INFO (GC!), le présentait comme « un site d’information nationale » (sic). Les articles de GC! montraient cela dit un focus tout particulier sur le département de la Loire et la métropole de Saint-Étienne, par ailleurs préfecture du département.

Sa chaîne YouTube contient plusieurs anciennes vidéos qualifiant Gilles Charles du sobriquet de « Stéphanois à la casquette », du nom du site web éponyme qu'il avait alors créé (archive) pour promouvoir les commerces et initiatives de sa ville de prédilection.

L'un de ces reportages, émanant de France 3 Loire, le présentait comme une « figure des réseaux sociaux » locaux, mais également comme un « accidenté de la vie, divorcé, handicapé et chômeur de longue durée », devenu présentateur sur une radio associative. « Demain, micros éteints, il retrouvera son quotidien : la précarité », concluait le journaliste.

Jusqu'à il y a quelques mois, GC! comportait un script bloquant le copier-coller, affichant un pop-up d'alerte expliquant que « Le contenu est protégé par le droit d'ateur » (sic). Sa rédaction avait publié plus de 1 700 « articles exclusifs » depuis décembre 2023, soit une moyenne de 5 articles par jour, avec des pointes à 9, week-ends et jours fériés compris.

Copier-paraphraser-coller en moins de 20 minutes

S'il citait fréquemment ses sources, il lui arrivait aussi de les paraphraser, sans pour autant les nommer. Le 20 octobre dernier à 10h27, GC! publiait par exemple un article consacré à l'arrestation d'un chauffard paraphrasant, mais sans le préciser, un article publié à 10h06 sur LyonMag.

Près de Lyon : il avait réussi à semer la BAC et les gendarmes à quatre reprises, le chauffard enfin appréhendé Près de Lyon : le chauffard insaisissable enfin arrêté après avoir échappé à la BAC à quatre reprises
Identifié et localisé à Dardilly où il vit, le jeune de 24 ans a été interpellé là où il ne risquait pas de prendre le volant : dans son lit.
Les gendarmes ont découvert qu'il roulait sans permis et sans assurance. Dans l'attente de son jugement, il a été écroué.
Quant à la fameuse Clio rouge, elle a été saisie.
Après avoir identifié et localisé le chauffard dans la commune de Dardilly, les gendarmes ont finalement procédé à son arrestation à un moment où il ne pouvait plus fuir : dans son lit.
Lors de l’interpellation, il a été découvert que le jeune homme roulait sans permis et sans assurance.
La fameuse Clio rouge, qui avait tant donné de fil à retordre aux forces de l’ordre, a été saisie. Le chauffard a été placé en détention provisoire dans l’attente de son jugement.
À gauche, l'article de LyonMag, à droite celui de GillesCharles.info publié dans la foulée

Il est a priori impossible qu'un journaliste de GC! ait pu prendre connaissance, lire, paraphraser l'article de LyonMag et publier le sien en 21 minutes seulement, ce que, a contrario, une IA pourrait avoir effectué, de façon automatisée. Un soupçon renforcé par le fait que nous avons identifié un autre plagiat dont l'IA semble avoir en outre « halluciné » l'attribution d'une citation.

Le 13 octobre à 13h24, le site stéphanois consacrait en effet un article à l'hommage rendu au professeur de lettres Dominique Bernard, un an après son assassinat par un ancien élève. Or, il ne précisait pas que les citations mentionnées avaient en réalité été recueillies par l' « envoyé spécial à Arras » du Parisien, dont l'article, lui aussi relativement long, venait d'être publié à 13h04.

Depuis la tribune baignée par le soleil et la musique, le maire d’Arras a été le seul à prendre la parole. « Un an plus tard, nous sommes toujours debout, toujours dans l’incompréhension et toujours ensemble », a clamé Frédéric Leturque lors d’une cérémonie placée sous le signe des arts avec des performances musicales et poétiques et un passage dansé.
« La vie est notre combat, la culture l’arme la plus forte et l’école le lien sacré qu’on doit protéger », a rappelé l’édile de la ville.
« Je suis admiratif des mots et du courage exceptionnel de Mme Bernard », salue ce dimanche matin Michel Dollet, le maire Boiry-Becquerelle, une commune voisine. « Sa réponse à la barbarie est une leçon pour tout le monde », conclut Agathe, une mère de famille arrageoise en quittant la place…
Depuis une tribune baignée par le soleil, le maire d’Arras, Frédéric Leturque, a été le seul à s’adresser à la foule : « Un an plus tard, nous sommes toujours debout, toujours dans l’incompréhension, et toujours ensemble. »
Pour Frédéric Leturque, « la vie est notre combat, la culture l’arme la plus forte et l’école le lien sacré qu’on doit protéger ».
Son courage et ses mots ont été salués par Michel Dollet, maire de Boiry-Becquerelle, commune voisine : « Sa réponse à la barbarie est une leçon pour tout le monde. »
À gauche, l'article du Parisien, à droite celui de GillesCharles.info

Là encore, il est improbable que l'article de GC! ait été découvert, lu, paraphrasé et publié en 20 minutes seulement, d'autant plus qu'il était également agrémenté de l'embed de trois tweets afférents. A contrario, il est plus probable qu'il ait été paraphrasé à partir de celui du Parisien par une IA qui, dans son processus de réécriture automatisé, a faussement réattribué la citation d'une mère de famille au maire d'une commune voisine d'Arras de 469 habitants.

Mi novembre, GC! publiait en « Une » un article intitulé « Harcèlement des Médias Indépendants : En France, ils fonts main basse sur la Liberté d’Informer ». Il y déplorait que « les médias indépendants, déjà fragilisés par une économie précaire, sont désormais confrontés à une pression nouvelle » :

« celle de cabinets d’avocats qui leur réclament des sommes considérables pour l’utilisation de photos sous prétexte de droits d’auteur. Le modèle ? Des menaces répétées par courriel et courrier, sans toutefois engager de poursuites. Derrière cette pratique, certains dénoncent une forme de harcèlement visant à extorquer des petits médias. »

Dessin de Claire Robert

Ironie de l'histoire, GC! précisait dans ses mentions légales (vraisemblablement copiées-collées) que « Toute reproduction ou distribution non autorisée des informations, textes, vidéos et images disponibles sur GILLESCHARLES.INFO est interdite ». Alors même qu'il n'hésitait pas, lui-même, à reproduire et plagier des contenus copyrightés, sans autorisation, et qu'il avait été jusqu'à protéger sa page par le JavaScript anticopie.

« Je ne savais pas que ce dessin avait été utilisé et je ne connais pas ce site », nous a par ailleurs confirmé Claire Robert, la dessinatrice dont il avait aussi reproduit le dessin, sans son autorisation. Elle précise :

« Pour moi, c'est très important qu’on me demande l’autorisation, car contrairement à ce qui est dit dans cet article que vous m’envoyez, le droit d’auteur n’est jamais un prétexte, mais toujours un droit comme son nom l’indique. De plus j’aime savoir qui utilise mes dessins et où, car le contexte de publication peut changer le sens d’un dessin. »

« Arrêtons d’être ces copies qu’on forme »

Créé en 2022, varactu.fr se vante d'être « devenu un média de référence dans la région pour les nouvelles locales et régionales », en seulement deux ans. Il précise aussi être composé d' « une équipe de journalistes expérimentés et passionnés qui travaillent dur pour fournir des informations fiables, impartiales et à jour ».

À ceci près que les articles ne sont signés que par les deux seuls co-fondateurs du site, Luc et Mylène. Et que les trois quarts de la quarantaine d'articles publiés chaque jour sont signés de la seule Mylène, capable de mettre en ligne trois articles en 10 minutes seulement, et jusqu'à 10 articles en moins d'une heure.

Sa citation préférée ? « arrêtons d’être ces copies qu’on forme » (sic)... Or, et là encore, il est possible de retrouver la trace des articles que varactu.fr plagie, comme on peut le voir avec cet article de Var Matin, paraphrasé sur Var Actu, mais sans pour autant être cité comme source de l'information relayée :

Chorizo, coke et cannabis... Dans l’ouest-Var, un camion à pizzas servait aussi de point de deal

La fouille du véhicule a permis de mettre au jour 100 g d’herbe de cannabis, 85 g de résine de cannabis, 57 g de cocaïne et près de 4,5 g d’ecstasy. Les policiers ont aussi saisi trois téléphones et 2.180 euros en numéraire.
A Bandol, derrière son camion à pizza, un trafic de drogue bien rodé dévoilé

La fouille du camion n’a laissé aucun doute quant à l’ampleur du trafic. Les policiers ont saisi 185 grammes d’herbe et de résine de cannabis, 57 grammes de cocaïne et près de 5 grammes d’ecstasy. En plus des stupéfiants, ils ont découvert plusieurs téléphones portables, témoins d’une organisation probablement bien rodée, ainsi qu’une somme de 2.200 euros en liquide, vraisemblablement liée aux transactions illicites.
À gauche, l'article de Var Matin, à droite, celui de Var Actu, publié le lendemain

Cette façon de procéder semble avoir été industrialisée, à tout le moins automatisée. Le 16 novembre, à 15h30, Presse agence, la lettre économique et politique de PACA, publie une dépêche indiquant que trois personnes étaient sorties indemnes de l'incendie d'une maison. À 18h11, Luc, l'autre animateur de Var Actu, publiait lui aussi un article à ce sujet, là encore sans mentionner sa source :

Une intervention des sapeurs-pompiers est en cours pour un incendie, depuis 15h25, sur la commune du Castellet, au niveau du chemin de l’aire.Un incendie s’est déclaré ce samedi 16 novembre 2024, vers 15h25, dans une maison de plain-pied située chemin de l’Aire, au Castellet.
Les sapeurs-pompiers du Var interviennent pour un feu d’habitation qui concerne une maison de plain-pied. Un important dispositif à été engagé afin de procéder à l’extinction, tout en évitant la propagation à la maison mitoyenne.

Pour l’heure, 3 personnes sont sorties indemnes avant l’arrivée des secours mais ont tout même été prises en charge pour un bilan qui sera sans nécessité de transport sur un centre hospitalier.

Le dispositif de secours comprend :
➡️ 2 véhicules de lutte contre les incendies
➡️ 1 grande echelle
➡️ 1 véhicule porteur d’eau
➡️ 1 ambulance
➡️ 1 véhicule de commandement

Soit 19 sapeurs-pompiers.
Les sapeurs-pompiers du Var sont rapidement intervenus pour maîtriser le sinistre et empêcher sa propagation à la maison mitoyenne.

Intervention rapide des secours
Dès l’alerte donnée, un important dispositif a été déployé sur les lieux. Au total, 19 sapeurs-pompiers ont été mobilisés, accompagnés de :
Deux véhicules de lutte contre les incendies
Une grande échelle
Un véhicule porteur d’eau
Une ambulance
Un véhicule de commandement


Avant l’arrivée des secours, trois personnes présentes dans l’habitation ont pu évacuer les lieux sans blessure apparente. Elles ont néanmoins été prises en charge sur place pour un bilan de santé, ne nécessitant pas de transport vers un centre hospitalier.
À gauche, la dépêche de Presse Agence, à droite, l'article de Var Actu, publié dans la foulée

Ce recours potentiel à l'IA semble avéré du fait que les citations de propos rapportés dans des articles paraphrasés sur varactu.fr sont elles-mêmes paraphrasées, et donc dénaturées, les IA ne faisant pas de différence entre un « texte » à paraphraser et une « citation ».

Le 23 octobre 2024, l'AFP publiait, par exemple, une dépêche au sujet d'un entretien accordé par Martin Fourcade à L’Équipe officialisant sa candidature à la présidence du futur comité d’organisation des Jeux olympiques dans les Alpes françaises en 2030. Or, les citations publiées dans varactu.fr le 24 octobre sont elles-mêmes des paraphrases (en orange) de celles publiées dans L'Équipe telles que rapportées par l'AFP, et donc potentiellement GenAI.

« C’est un peu théâtral de le dire ainsi, mais on est à un tournant des Jeux d’hiver et à un moment important de l’histoire de la montagne française et de ses enjeux. Je me sens cette responsabilité de porter ce projet pour donner du sens et du concret à cet engagement »« Nous sommes à un tournant des Jeux d’hiver et à un moment important de l’histoire de la montagne française. Je me sens responsable de porter ce projet pour lui donner du sens. »
« Le grand public attend de nous au minimum ce qu’a fait Paris 2024. »« Le grand public attend de nous au moins autant que ce qu’a réalisé Paris 2024 »
« Tous les jours on me dit : Martin, quand est-ce que l’on revit ce que l’on a vécu à Paris 2024 ? Cet engouement, cette pédagogie qu’a fait Paris 2024, c’est un vrai atout pour les Alpes 2030. »« Tous les jours, on me demande quand on pourra revivre ce que l’on a vécu à Paris 2024. Cet engouement, cette pédagogie sont des atouts pour les Alpes 2030 »
« Quand tout le monde trouve le stade de la Tour Eiffel incroyable et que j’ouvre ma fenêtre le matin en regardant les montagnes, je me dis que ce n’est aucunement moins incroyable.  »« Lorsque j’ouvre ma fenêtre et que je vois les montagnes, je sais que ce paysage n’est pas moins incroyable que la Tour Eiffel »
À gauche, les citations rapportées par l'AFP, à droite leurs paraphrases sur varactu.fr

Contacté, Luc, le créateur de varactu.fr nous répond que « l'IA sert à accélérer l'écriture des articles, mais en aucun cas à générer du contenu seule » :

« Nous allons chercher les informations sur le terrain. L'IA permet de mettre en forme plus rapidement les prises de notes avant la relecture des articles par les journalistes. Nous sommes une association et non une société ; nous avons plusieurs bénévoles sur le terrain pour la collecte d'informations, ainsi que des sources locales qui nous remontent leurs informations. Nous nous chargeons ensuite de la rédaction. »

Concernant l'hyperproductivité de Mylène, il nous répond qu' « elle prépare des articles tout au long de la journée, articles que nous publions plus souvent le matin » : « Comme évoqué, l'IA permet de gagner du temps sur la rédaction uniquement, mais pas sur le contenu des informations, ce qui permet d'écrire et de programmer à l'avance plus rapidement des articles en matinée. Les lecteurs sont traditionnellement plus actifs le matin sur nos réseaux sociaux ou notre application sur smartphone ».

Il précise qu'« à l'avenir, nous serons beaucoup plus vigilants sur les citations des sources primaires », mais il n'a, par contre, pas répondu à nos questions sur les citations déformées et donc probablement « hallucinées ».

Un site GenAI classé 177e des médias les plus visités en France

Le site News of Marseille se targue de son côté d'engranger « 1M de visiteurs mensuels (moyenne basse) », et se présente comme « agréé Google Actualités » (ce qui ne veut rien dire, le référencement étant automatisé depuis que, en 2019, Google a modifié la procédure de sorte qu'il n'y a plus besoin de demander à y figurer).

Le site figurait en janvier à la 177e position du classement Similarweb des sites et médias d'information en France, et donc devant lamanchelibre.fr (179e), le monde-diplomatique.fr (180e), le washingtonpost.com (186e), legorafi.fr (251e), alternatives-economiques.fr (260e) et même afp.com (261e).

Une popularité probablement due au fait qu'il apparaît régulièrement sur Google Discover, avec des articles consacrés à des villages et paysages de France, illustrés par des images bucoliques.

TTU.fr se targue pour sa part de « 4.2 millions de visiteurs sur les 3 derniers mois », avec « des pics à 75.000 clics par articles », et parvient lui aussi à placer de tels articles « bucoliques » sur Google Discover.

Un rapide coup d'œil sur leurs images d'illustrations, presque trop belles pour être vraies, suffit cela dit à identifier qu'elles ont été générées par IA, tout comme le sont leurs articles, signés pour certains par une certaine Eglantine Parrot (perroquet, en français), dont la photo de profil semble, elle aussi, avoir été générée par une IA.

« C'est une supercherie : il y a clairement tromperie »

News of Marseille et TTU font partie de la cinquantaine de sites GenAI que nous avons identifiés comme été opérés par une entreprise nantaise d'édition et de gestion de sites et de médias, EXP4. CheckNews a récemment consacré un article à son sujet dans le cadre de notre enquête sur les sites d'infos GenAI.

Les valeurs d'EXP4 : « l'humain », et « la confiance »... Sauf que ses articles ont induit tellement de gens en erreur que la presse quotidienne régionale se retrouve de plus en plus à lui consacrer des articles de fact-checking.

Début mars 2024, un écrivain et photographe albigeois, Philippe Pratx, partageait en effet un message sur Facebook après avoir découvert « avec effarement un site internet qui diffuse des images totalement fantaisistes sur divers lieux ariégeois (mais pas seulement) » :

« Ces images ont très probablement été créées par intelligence artificielle, et celle-ci a probablement aussi été mise à contribution pour la rédaction des textes. Je vais signaler la situation au département, dans la mesure où il y a clairement tromperie. »

En commentaires, des internautes lui faisaient remarquer que le site avait déjà induit en erreur La Charente Libre, qui avait publié, en janvier, un article intitulé « Une "rédactrice voyage" amoureuse de Villebois-Lavalette… mais ce n’est pas la commune sur la photo ». Le journal local a bien identifié qu'il y avait un problème mais n'a pas relevé que l'image était générée par une IA et qu'il n'y avait pas de rédactrice voyage derrière le site internet en question, lui aussi GenAI.

Un autre commentaire le renvoyait à un article de fact-checking paru, lui aussi en janvier, dans La Nouvelle République : « Indre-et-Loire : l’article plein d’erreurs généré par une intelligence artificielle sur Beaulieu-lès-Loches », une commune de 1 750 habitants.

Le journaliste y déplorait un article généré par IA et « truffé d'erreurs » : des cloîtres d'abbaye qui n'existent plus, des événements « comme la fête de la citrouille et les concerts des Douves en voix, qui ne sont pas Bellilociens non plus » (du nom des habitants de Beaulieu-lès-Loches), « pas plus que la fête médiévale » :

« Et que dire des "vignobles aux alentours de Beaulieu-lès-Loches [qui] produisent des vins réputés pour leur finesse et leur diversité" et des caves troglodytiques qui offriraient "une rencontre intime avec le vin de Loire", alors même que les caves bellilociennes sont privées ou fermées au public. »

Réagissant au fait que le site est à « 100 % IA, texte et images », Philippe Pratx appelait les « personnes compétentes » à « porter plainte », déplorant que « dans les mois et années à venir, il va y avoir des milliers de situations comparables… », alors qu' « ils ne mentionnent pas que ce sont des images générées par IA. C'est une supercherie » :

« Je ne sais pas s'il y a matière à porter plainte, mais ces images relèvent de la fausse information, dans le fond. Et il peut donc y avoir préjudice. Bref, il faudrait au minimum que les images, sur leur site d'origine, soient accompagnées d'une légende expliquant clairement que ce qui est représenté est généré par IA et ne correspond absolument pas à la réalité des lieux évoqués. »

« Un site généré par l'intelligence artificielle recrée les sites touristiques de l'Ariège à sa manière », rebondissait La Dépêche, précisant que « contacté, le directeur de la publication du site n'a pas répondu à nos questions ».

De fausses infos qui génèrent de vrais profits

« Attention, des images fantaisistes circulent sur des lieux touristiques dans les Pyrénées », renchérissait Actu.fr dans la foulée, soulignant que sur son site web, News of Marseille explique avoir pour ambition de « fournir des articles de qualité à ses lecteurs afin de les informer au mieux, de les guider et les conseiller au quotidien », concluant ironiquement que « Manifestement, le choix des illustrations n’est pas prérequis ».

Des problèmes similaires pointés du doigt dans d'autres titres de la PQR. « Non, cette image qui tourne sur les réseaux sociaux ne représente pas le Roc la Tour », titrait ainsi L'Ardennais en octobre. « Le lac du Der vu de Marseille, c’est les gorges du Verdon ! », déplorait L'Union mi-décembre :

« Des photos magnifiques et des titres qui vendent du rêve… Le site d’informations "News of Marseille" n’a pas son pareil pour promouvoir une destination touristique et donner aux lecteurs des envies de visites. Sauf qu’articles et illustrations sont bidons. »

« Encensé par un article pondu par l’IA sur le site internet News of Marseille, le lac du Der pourrait décevoir certains visiteurs venus chercher ce qu’ils ne peuvent y trouver », relevait de son côté L'Est éclair début janvier, en fact-checkant les nombreuses erreurs de l'article généré par IA.

Plus récemment, Le Dauphiné Libéré déplorait que « ces fausses infos génèrent de vrais profits », évoquant un article publié sur le site ladromemontagne.fr, lui aussi géré par EXP4 et titré « Thonon-les-Bains : les quartiers sensibles à éviter lors de votre séjour » qui, en outre, ternissait l'image et la réputation de la ville.

Pendant ce temps-là, le créateur d'EXP4, qui a par ailleurs lancé deux générateurs d'articles automatisés par IA (nous y reviendrons), se vantait sur son profil LinkedIn des millions de pages vues que ses articles générés par IA permettaient d'engranger.

Commentaires (5)

votre avatar
Outch!... merci pour ce travail d'enquête
votre avatar
/mode troll on
Et voilà !! Encore un article de Next.ink pour faire du buzz et casser le business des gentils experts SEO
/mode troll off

Super boulot. Merci
:pciwin:
votre avatar
Merci pour l'article.

Sinon, par rapport à votre enquête et tous les articles GenIA, je galérais à retrouver un des articles. (c'est peut-être moi qui m'y prends mal)
Il y a bien la catégorie IA en haut, mais je n'ai pas trouvé cela pratique.
Serait-il possible de créer un "dossier" listant tous les articles de votre enquête, ou une catégorie ?
votre avatar
Arf... on y travaille, ça devrait arriver sous peu ; en attendant, vous pouvez aller regarder la liste des articles que j'ai écrit en cliquant sur le lien de mon profil.
MàJ : [Récap] Nous avons découvert des milliers de sites d’info générés par IA : tous nos articles
votre avatar
Suffit d'aller dans quelques conf tech SEO pour voir à quel point certains (beaucoup) sont la lie d'internet. Quand on t'explique comment configurer des fermes de WordPress qui génèrent du contenu pipeau (ce que j'avais vu à l'époque n'était même pas de l'AI et c'était déjà à gerber). Le but n'est pas forcément de faire du clic pour de la pub mais faire des liens vers les sites de leurs clients.

La presse régionale est, elle aussi, cannibalisée par des sites d’infos générés par IA

  • Copier-paraphraser-coller en moins de 20 minutes

  • « Arrêtons d’être ces copies qu’on forme »

  • Un site GenAI classé 177e des médias les plus visités en France

  • « C'est une supercherie : il y a clairement tromperie »

  • De fausses infos qui génèrent de vrais profits

Fermer