Connexion Abonnez-vous

Face au New York Times, OpenAI doit présenter 20 millions de logs anonymisés d’ici demain

Le 13 novembre à 09h51

Dans le procès qui oppose le New York Times à OpenAI, le journal a demandé cet été de pouvoir analyser les logs de l'utilisation de ChatGPT afin de trouver d'éventuelles preuves de violation de copyright.

Ce vendredi 7 novembre, la juge Ona Wang a informé [PDF] les deux parties qu' « OpenAI est tenu de fournir les 20 millions de logs de ChatGPT anonymisés aux plaignants avant le 14 novembre 2025 ou dans les 7 jours suivant la fin du processus d'anonymisation ».

Façade du bâtiment du New York Times
Photo de Jakayla Toney sur Unsplash

Comme le raconte Reuters, l'entreprise de Sam Altman a répondu [PDF] ce mercredi en se plaignant que « pour être clair : toute personne dans le monde ayant utilisé ChatGPT au cours des trois dernières années doit désormais faire face à la possibilité que ses conversations personnelles soient transmises au Times afin que celui-ci puisse les passer au crible à sa guise dans le cadre d'une enquête spéculative ».

De leur côté, les avocats du journal ont expliqué [PDF] qu'OpenAI a eu trois mois pour anonymiser les données, que l'un des représentants d'OpenAI a reconnu que le processus permettra « d'effacer du contenu les catégories d'informations personnelles identifiables et autres informations (par exemple, les mots de passe ou autres informations sensibles) comme les données utilisateur ». Le journal fait aussi remarquer qu'il doit respecter une ordonnance spéciale protégeant ces données lors de l'inspection de ces logs.

L'entreprise de Sam Altman fait aussi une comparaison avec des affaires ayant impliqué Google en affirmant que « les tribunaux n'autorisent pas les plaignants qui poursuivent Google à fouiller dans les emails privés de dizaines de millions d'utilisateurs Gmail, quelle que soit leur pertinence. Et ce n'est pas non plus ainsi que devrait fonctionner la divulgation dans le cas des outils d'IA générative »

Mais la juge a expliqué qu' « OpenAI n'a pas expliqué pourquoi les droits à la vie privée de ses consommateurs ne sont pas suffisamment protégés par : (1) l'ordonnance de protection existante dans ce litige multidistrict ou (2) la dépersonnalisation exhaustive par OpenAI de l'ensemble des 20 millions de logs ChatGPT des consommateurs ». Elle semble estimer que les conversations des utilisateurs avec un chatbot ne peuvent pas être considérées comme des conversations privées au même titre que des échanges de courriers ou d'e-mails entre deux personnes réelles.

Le 13 novembre à 09h51

Commentaires (7)

votre avatar
Ah la procédure de discovery aux USA... Franchement ça me fait sourire ^^
votre avatar
« [...] avant le 14 novembre 2025 ou dans les 7 jours suivant la fin du processus d'anonymisation »
Avec cette deuxième partie de phrase, techniquement OpenAI a délai illimité pour le faire. Il faut juste qu'il justifie d'un temps extrêmement long pour anonymiser les données.
votre avatar
Heureusement que le New York Times va pouvoir envoyer ces millions de log dans une IA pour qu'elle face une analyse rapide et personnalisée en un temps record :mdr:
votre avatar
Ils ont un contrat avec OpenAI pour ça ^^
votre avatar
Ce qui me fait le plus marrer c’est l’aveu que les conversations avec ChatGPT sont conservées 3 ans
votre avatar
Je me pose quand même la question de comment, en 2025, avec des multinationales qui ne craignent absolument les conséquences de leurs actes, on peut avoir la moindre confiance dans le fait que les logs qui seront fournis n’auront pas été altérés ?

Les logs ça peut être intéressant quand ils sont fournis par un tiers non impliqué dans l’affaire, mais je ne vois pas bien comment l’on fait pour forcer une boîte comme OpenAI à fournir des fichiers texte non altérés. Plus encore si l’on leur laisse 3 mois pour faire le ménage anonymiser.
votre avatar
on peut avoir la moindre confiance dans le fait que les logs qui seront fournis n’auront pas été altérés ?
Ou générées par GPT :D

Face au New York Times, OpenAI doit présenter 20 millions de logs anonymisés d’ici demain

Fermer