ChatGPT produit de faux liens vers les médias partenaires d’OpenAI, dont Le Monde et Politico

From Benalla to #summerbody

Flock

Si le robot conversationnel d’OpenAI s’appuie bien sur les travaux de ses partenaires médias, il renvoie souvent l’internaute vers des liens faux, non vérifiés ou des sources externes.

Mathilde Saliou

Le 04 juillet 2024 à 11h08

9 min

IA et algorithmes

Mise à jour du 8 juillet : précision du modèle utilisé.

Au fil des mois, plusieurs médias occidentaux ont signé des accords avec OpenAI, le constructeur de ChatGPT. Dans la plupart des cas, ces partenariats permettent à l’entreprise d’utiliser tout ou partie des productions journalistiques pour entraîner son modèle génératif, en échange de la production de résumés des articles originaux, avec des liens permettant d’aller les lire dans leur intégralité.

Or, d’après des tests réalisés par Nieman Lab, la machine produit (« hallucine ») de fausses URLs pour au moins dix des publications partenaires, parmi lesquelles El País, The Associated Press, The Financial Times et The Atlantic. Next a reproduit l’expérience pour les deux médias couvrant les affaires françaises et européennes, Le Monde et Politico Europe, et relève une réelle tendance de ChatGPT-4o à produire de fausses URL qui, dans le cas du Monde, inclue de faux identifiants.

Avec ce résultat cocasse : un internaute qui chercherait à se renseigner sur l’affaire Benalla peut se retrouver renvoyé sur une chronique au sujet du « Summer Body ».

OpenAI a signé des contrats avec Le Monde et Prisa Media

Articles de blogs et liens imaginaires

En mars, Le Monde annonçait la signature d'un accord pluriannuel avec le constructeur de ChatGPT. Selon le Président de son directoire Louis Dreyfus et son directeur Jérôme Fenoglio, l’opération apporte au média « une source significative de revenus supplémentaires », et se traduit aussi par la possibilité, pour ses équipes, de « s’appuyer sur les technologies d’OpenAI pour développer des projets ou des fonctionnalités utilisant l’IA ».

Côté start-up, il permet « de s’appuyer sur le corpus du Monde comme une des références majeures pour établir et fiabiliser ses réponses, selon les dirigeants du journal. Il prévoit que les références aux articles du Monde soient mises en exergue et qu’elles se fassent systématiquement avec un logo, un lien hypertexte et le titre du ou des articles utilisés comme références. »

Nous avons donc commencé par soumettre à ChatGPT une requête très large, lui demandant de produire des résumés de travaux « récents » du quotidien. La machine a renvoyé vers de nombreux articles de blog, hébergés par Le Monde, donc, mais non supervisés par sa rédaction et dont les auteurs ne sont pas toujours journalistes.

Contrairement à ce qu’écrit le système génératif, certaines de ces redirections datent de plus d’une décennie, il ne s'agit pas non plus d' « enquêtes », et uniquement des billets de blogs, aucun article validé par la rédaction.

Next a poursuivi ses expérimentations en précisant ses requêtes. Première tentative : cibler le travail d’une journaliste en particulier (en l’occurrence Ariane Chemin), qui a enquêté sur les raisons pour lesquelles le président de la République a choisi de dissoudre l’Assemblée Nationale.

Nous reformulons la question, sans mention d'auteur. La machine produit du texte mieux ciblé sur la dissolution, mais n’est jamais capable de fournir un article original. À la place, elle renvoie vers des articles de blogs datés de 2017 ou 2022, ou vers le podcast "L'heure du Monde".

Deuxième tentative : voir ce que ChatGPT « connaît » du travail collectif du Monde sur les polluants éternels. Sur une requête simple (« enquête Le Monde PFAS »), la machine crée un texte cohérent, mais ne source que vers deux pages du site du quotidien. La première renvoie vers l’édition « Les PFAS, ces polluants éternels qui ont contaminé l’Europe » du podcast « L’Heure du Monde », la seconde renvoie vers la page de re-diffusion de ce même podcast qui, tous les matins reçoit un journaliste de la rédaction du "Monde" pour bien comprendre les enjeux de l'actualité.

Désirant obtenir les articles originaux, nous y ajoutons les noms de deux journalistes de l’équipe autrice de cette enquête consacrée aux « polluants éternels » que sont les PFAS. La machine fournit alors des sources externes au média : celle d’un communiqué (en anglais) publié par Le Monde à la sortie de l’enquête, et celle d’une interview (elle aussi en anglais) de la journaliste Stéphane Horel auprès de la Society of Environmental Journalists. De l’enquête originale, toujours aucune trace.

Même expérience avec les travaux du quotidien sur le « Projet Pegasus », une enquête collaborative initiée par les organisations Forbidden Stories et Amnesty International. Une nouvelle fois, la machine se concentre sur la page podcasts du Monde.

Calcul probabiliste d’URL ?

Quand on demande explicitement à ChatGPT de donner le lien original de l’enquête, celui-ci ne fonctionne pas.

Quand on précise les auteurs, la machine plante.

Quand on réalise le même test en revenant à l’enquête sur les PFAS, ChatGPT hallucine une URL… et mélange les deux requêtes précédentes (celles relatives aux PFAS et celles relatives à Pegasus) dans ses réponses.

Pour boucler la boucle, nous revenons à des travaux d’Ariane Chemin, plus anciens cette fois : ceux qui ont déclenché, à l’été 2021, l’ « affaire » Benalla. Au terme de son résumé des faits, le robot propose deux liens apparemment cliquables, que son texte présente comme les articles originaux.   Les liens ne fonctionnent pas, mais les copier permet d’en obtenir le détail :

[Affaire Benalla : comment l’Assemblée s’est retrouvée paralysée](https://www.lemonde.fr/les-cuisines-de-l-assemblee/article/2018/07/25/affaire-benalla-comment-l-assemblee-s-est-retrouvee-paralysee_5335820_5286653.html)
[Affaire Benalla : place à la motion de censure](https://www.lemonde.fr/les-cuisines-de-l-assemblee/article/2018/07/27/affaire-benalla-place-a-la-motion-de-censure_5336281_5286653.html)

Lorsqu’on les teste en ligne, le premier renvoie une erreur 404, le second… une chronique de 2018 sur le #summerbody. Une recherche sur leurs titres respectifs renvoie, là encore, à deux billets d'un blog certes hébergé par Le Monde, mais rédigés par des collaborateurs parlementaires, pas par la journaliste Ariane Chemin.

Après vérification, il s’avère que l’identifiant « 5336281 » produit par calcul probabiliste de ChatGPT correspond à l’un des identifiants de la chronique estivale. À force de tests, il semble par ailleurs que ChatGPT ne renvoie que vers des liens de pages du Monde accessibles gratuitement, et à aucun article « réservé aux abonnés ».

Chez Politico, nécessaire explication du terrain géographique

Du côté de Politico, la machine fait face à une subtilité : il existe deux publications sœurs, l’une spécialisée dans les affaires américaines (politico.com), la seconde, dans les affaires européennes (politico.eu). La première a été rachetée par le groupe Axel Springer en 2021, date à laquelle ce dernier a aussi pris une participation majoritaire dans la seconde.

En décembre, le groupe média a déclaré avoir conclu un accord avec OpenAI qui offrirait aux usagers de ChatGPT l’accès à des résumés d’articles de Politico, Business Insider et de médias allemands détenus par Springer. « Les liens vers les articles seront fournis dans les réponses de ChatGPT », indiquait l’annonce.

Nous décidons donc de le tester sur le sujet des ingérences russes au Parlement européen. ChatGPT a besoin que nous précisions notre demande : à défaut, la machine considère que nous nous intéressons à l’élection de Donald Trump en 2016, et cherche ses informations du côté de Politico.com. Une fois précisé que nous nous intéressons à l’Europe, le robot résume correctement l’affaire.

À la fin de son texte, en revanche, il propose une sélection de liens qui s’avèrent étrangement non cliquables.

Leurs titres, pourtant, sont évocateurs… Après vérification, ChatGPT fournit les titres d’articles existants (comme ça avait été le cas pour les billets de blog du Monde), mais crée des URLs de toutes pièces.

Nouveau test avec le Brexit :

Nouvelles URL non fonctionnelles, mais que, par copier-coller, ChatGPT permet néanmoins de récupérer.

Dans le détail, ChatGPT a notamment produit les URL suivantes :

[Brexit Britain at 1: Here’s what we’ve learned](https://www.politico.eu/article/brexit-britain-at-1-heres-what-weve-learned/)
[The UK needs truth and reconciliation to move past Brexit](https://www.politico.eu/article/the-uk-needs-truth-and-reconciliation-to-move-past-brexit/)

Or, pour chacun des articles concernés, l'URL réelle est :

https://www.politico.eu/article/brexit-britain-european-union-eu-learned/
https://www.politico.eu/article/the-uk-rishi-sunak-brexit-needs-truth-and-reconciliation-to-move-past/

La machine semble donc générer l'URL la plus « probable », selon ses calculs, sans qu'aucune vérification de la réalité ne soit proposée à ce stade de ses productions. Un résultat d'autant plus étonnant que plus haut, lorsqu'elle mentionne les « sites » (les pages) qui lui ont servi de source, elle cite correctement chaque article.

Sans partenariat, ChatGPT redirige vers des URL plus simples

Quelle différence avec d’autres médias ? Il fut un temps où Ouest-France avait été pressenti comme partenaire français potentiel d’OpenAI. Ce projet n’ayant pas abouti, le système propose beaucoup plus explicitement d’aller « visiter directement le site Ouest-France », ou « visiter directement leur page » dédiée au sujet demandé.

Sur les quelques tests réalisés, toutes les URL proposées étaient réelles. Elles étaient aussi, peut-être, plus simples à calculer, renvoyant soit vers la home du site web (par exemple : ouest-france.fr), soit vers une rubrique clairement identifiée (ouest-france.fr/environnement/algues-vertes/).

Si on lui demande de résumer des travaux précis, ChatGPT précise par ailleurs : « Je ne suis pas en mesure d’accéder directement aux articles d’Ouest-France pour les résumer ». Cela ne l’empêche pas de produire une réponse, « basée sur les informations disponibles publiquement » sur le sujet.

Contactés, ni Le Monde, ni Politico, ni OpenAI n’avaient répondu à l’heure de la publication. L’article sera mis à jour en cas de réponse.

Commentaires (7)

SebGF Abonné

Le 04/07/2024 à 11h48

ChatGPT ne peut pas sortir sur Internet de lui-même. Pour trouver des sources en ligne, il utilise Bing et synthétise les résultats en annotant ceux-ci pour les sourcer de la même façon qu'on peut le voir sur Wikipedia. Utilisez Copilot dans BIng et vous aurez la même implémentation.

Il est donc évident qu'il synthétise des URL. Je l'avais constaté l'année dernière en expérimentant de lui demander de résumer un article de mon blog : il avait tout extrapolé en se basant sur l'URL.

Les essais réalisés n'utilisent que les données d'entraînement du modèle. Donc du passé et de l'invention (le "générative" dans "IA générative" n'est pas anodin), ce n'est pas une base de données ni un index.
J'ai des doutes que dans l'immédiat, ChatGPT fasse du RAG avec ces sites, sinon il produirait de véritables URL et contenus à jour, mais probablement invérifiables car derrière le paywall du site (le partenariat financier avec OpenAI devant surement compenser cet usage des données). Et j'ai des doutes qu'ils proposent ceci sur l'offre gratuite.

fred42 Abonné

Le 04/07/2024 à 14h02

Quelle version de ChatGPT avez-vous utilisée ?

Gilbert_Gosseyn Abonné

Le 05/07/2024 à 10h24

Je suppose que cela doit être la dernière en date, soit la 4.

fred42 Abonné

Le 05/07/2024 à 17h14

Dans ces cas là, je ne suppose pas. Je demande.

La 4 est sortie en mars 2023 avant les accords avec la presse cités.
Par contre, la version 4o est sortie en mai 2024 mais je ne sais pas de quand datent les données d’entraînement.

Si c'est la version 4 qui est utilisée, il est normal d'avoir ce genre de résultats.

En l'absence de précisions sur les conditions de tests et en lisant le test fait par SebGF ci-dessous, je n'accorde aucun intérêt à l'article. Décrire les conditions de tests, c'est quand même la base !

Mathilde Saliou Équipe

Le 08/07/2024 à 08h18

Avec le 4o.

fred42 Abonné

Le 08/07/2024 à 13h19

Merci. Je conseille vraiment d'indiquer les conditions de vos tests.
En particulier les prompts (ils ne sont pas tous présents).

Remarque, il y a des cas où il vaut mieux utiliser un moteur de recherche que ChatGPT, par exemple ""lien vers enquete pegasus signée martin untersinger et damien leloup dans le monde" donne le bon lien par google dans la première page de résultats. Chaque outil a ses avantages et ses inconvénients, il faut choisir le bon. En plus, dans ce cas, ça consomme moins de ressources. Un moteur de recherche est fait pour donner des liens, pas un chatbot dopé à l'IA.

SebGF Abonné

Modifié le 05/07/2024 à 12h21

Je viens de faire l'essai pour voir avec l'exemple du Brexit. Trois URL retournées par Bing Search, toutes fonctionnelles et renvoyant vers Politico.

Le modèle utilisé était GPT-4o disponible en usage limité sur l'instance gratuite. Je n'avais pas utilisé ChatGPT depuis un bail (y'a mieux depuis, y'a du français, donc fuck them) et n'avais pas suivi que le mode web était désormais dispo en natif.

Voici le résultat : (même prompt que l'article)

Politico's coverage of Brexit provides comprehensive insights into its political, economic, and social ramifications. Key themes include:

1. Economic and Political Turmoil: Brexit has led to significant changes in the UK's economic landscape, including potential impacts on growth, trade, and financial services. The departure from the EU has created uncertainty, influencing both the UK and the EU's economic policies and international relationships. Politico discusses the challenges of severance, such as capital flight and job losses in the financial sector, and the long-term economic prospects for both Britain and the EU【5†source】【6†source】.

2. Shifts in Political Dynamics: The political fallout from Brexit is substantial, affecting the UK's internal politics and its relationship with Europe. Politico examines the strategic maneuvers by British leaders like Boris Johnson and Rishi Sunak to navigate post-Brexit challenges and their efforts to stabilize the economy and secure political support【5†source】【6†source】.

3. Global Implications: Brexit's impact extends beyond Europe, influencing global political orders and alliances. The coverage highlights how Brexit has altered Britain's global role, potentially diminishing its influence while also affecting institutions like NATO and the IMF. The geopolitical consequences, including shifts in defense policies and international trade relations, are significant topics in Politico's reporting【7†source】.

4. Continued Uncertainty: Despite the formal completion of Brexit, ongoing negotiations and unresolved issues persist. Politico details the complex and evolving nature of Brexit, including the need for further agreements on trade and regulatory standards, and the political ramifications within the UK, such as the potential for Scottish independence and the stability of Northern Ireland【6†source】.

Overall, Politico's extensive coverage provides a nuanced view of Brexit's multifaceted impacts, offering readers detailed analysis and diverse perspectives on this landmark geopolitical event.

https://www.politico.com/tag/brexit
https://www.politico.com/newsletters/global-insider/2023/03/01/brexits-finally-done-not-yet-00084941
https://www.politico.com/magazine/story/2016/06/brexit-change-europe-britain-us-politics-213990/

----

Test avec la question sur le lien vers l'enquête pegasus. (j'avais bien reproduit le précédent cas où il redirigeait sur un autre site, mais en même temps il se base sur Bing, GPT n'a rien à voir là dedans)

You can find the investigation on the Pegasus spyware by Martin Untersinger and Damien Leloup on Le Monde's website through this link: Pegasus: au cœur d’une enquête mondiale sur l’espionnage de téléphones【15†source】.

This comprehensive investigation reveals how the Pegasus software has been used to spy on a wide range of individuals, including journalists, human rights activists, lawyers, and political figures around the world, often on behalf of various states. The inquiry is a collaborative effort involving Le Monde and sixteen other media organizations.

Lien valide vers un podcast.

----

J'avoue ne pas comprendre. L'outil va bien chercher en ligne et synthétise en fournissant les liens donnés. Il n'a pas inventé de liens en ce qui me concerne avec les mêmes prompts.

J'ai testé le cas d'un accès interdit au robot, mon blog personnel. Je lui ai demandé de synthétiser un article du mois de mai 2024.

---

It seems that the pages from the .... blog are restricted and cannot be accessed directly due to the website's robots.txt settings. Therefore, I cannot fetch or synthesize the content of their May 2024 writing activities update.

You can visit the .... blog directly to view the latest posts and updates on their writing activities. If you have any specific questions or need help with another topic, feel free to ask!

---

J'ai ensuite tenté avec un ebook que j'ai publié sur les plateformes en demandant de résumer l'accroche.

"quel est le résumé du livre .... écrit par .... ?"

La première fois, il n'a pas eu le "réflexe" d'aller sur Web et a inventé la quatrième de couverture en extrapolant depuis le titre. Je lui ai dit de s'appuyer sur une source web en allant chercher sur le site de l'auteur, il n'a trouvé et a produit un résumé cohérent en citant même l'un des noms de personnages qui figurait dessus.
(ça m'a d'ailleurs amusé de voir qu'il a catégorie un roman de SF en "thriller psychologique" juste à la lecture du résumé en ligne)

lien vers le chat