Connexion
Abonnez-vous

Copyright : les entreprises d’IA gagnent plusieurs manches judiciaires, mais pas toutes

Copyright : les entreprises d’IA gagnent plusieurs manches judiciaires, mais pas toutes

Dans leurs procès respectifs, Meta et Anthropic ont vu leurs arguments validés sur plusieurs points importants contre des auteurs de livres qui les accusaient d'avoir enfreint leurs droits en utilisant leurs œuvres pour entrainer leurs modèles. Mais ces décisions ne figent pas de jurisprudence globale : dans les deux cas, les juges ont laissé des angles d'attaque possibles, dont notamment l'utilisation des bibliothèques clandestines pour accéder aux œuvres.

Le 26 juin à 13h31

Coup sur coup, deux juges étasuniens ont rendu leur décision dans deux affaires opposant des entreprises d'IA génératives et des auteurs de livres sur des enjeux de violation de Copyright. Et coup sur coup, ils ont tranché en grande partie en faveur de ces entreprises.

Le droit d'entrainer sur des livres achetés et scannés

Lundi 23 juin, le juge du district nord de Californie William Alsup a rendu sa décision [PDF] sur le cas opposant Anthropic à l'autrice Andrea Bartz et les auteurs Charles Graeber et Kirk Wallace Johnson. Dans celle-ci, il affirme notamment qu'Anthropic avait le droit d'entrainer ses modèles sur les livres de ces auteurs qu'elle avait achetés en version papier puis scannés, considérant que « l'utilisation pour l'entrainement est incluse dans le fair use [usage raisonnable accepté par le droit étasunien] ». C'était l'argument principal de l'entreprise. Celle-ci considérait que l'entrainement permet de « transformer » l'œuvre sans s'y substituer. La jurisprudence du fair use prévoit notamment que dans ce cas, l'usage de l'œuvre est licite. Comme le souligne Wired, le juge a même commenté cette décision en affirmant que « la technologie en question était l'une des plus transformatrices que beaucoup d'entre nous verrons au cours de notre vie ».

Interrogé par nos confrères, l'avocat Chris Mammen du cabinet étasunien Womble Bond Dickinson affirme que cette décision sur le caractère transformateur de l'entrainement s'applique « même en cas de mémorisation importante ». Selon lui, le juge « a notamment rejeté l'argument selon lequel ce que font les humains lorsqu'ils lisent et mémorisent est différent de ce que font les ordinateurs lorsqu'ils entrainent un LLM ».

Par contre, le juge William Alsup n'avalise pas l'utilisation de bibliothèques clandestines par les entreprises d'IA pour collecter les livres numériques. « Anthropic a téléchargé plus de sept millions de copies pirates de livres, n'a rien payé et a conservé ces copies pirates dans sa bibliothèque même après avoir décidé qu'elle ne les utiliserait pas pour entraîner son IA (du tout ou plus jamais) », décrit-il, « les auteurs soutiennent qu'Anthropic aurait dû payer pour ces copies piratées ». Ici, William Alsup se dit en accord avec les auteurs des livres. Et il annonce dans ses conclusions : « Nous aurons un procès sur les copies pirates utilisées pour créer la bibliothèque centrale d'Anthropic et les dommages qui en découlent ».

Une concurrence déloyale non prouvée

Deux jours plus tard, dans le même district, le juge Vince Chhaabria rendait lui aussi sa décision [PDF] concernant l'affaire opposant Meta notamment à une douzaine d'auteurs dont celui de science-fiction Richard Kadrey. Celui-ci visait justement l'utilisation de bibliothèque clandestine par Meta pour entrainer ses modèles Llama. « La Cour n'a d'autre choix que d'accorder [son] jugement à Meta sur l'allégation des plaignants selon laquelle l'entreprise a violé la loi sur le copyright en entrainant ses modèles à l'aide de leurs livres », écrit-il.

Mais il ajoute que sa décision « confirme seulement que ces plaignants ont avancé les mauvais arguments et n'ont pas réussi à constituer un dossier à l'appui des bons arguments ». Notamment, ce juge fait remarquer qu' « en ce qui concerne l'argument potentiellement gagnant, à savoir que Meta a copié leurs œuvres pour créer un produit qui inondera probablement le marché avec des œuvres similaires, entraînant une dilution du marché, les plaignants accordent à peine une attention particulière à cette question et ne présentent aucune preuve de la manière dont les résultats actuels ou attendus des modèles de Meta dilueraient le marché de leurs propres œuvres ».

Dans sa décision, le juge Chhaabria a aussi commenté celle de son collègue, expliquant que « le juge Alsup s'est fortement concentré sur la nature transformatrice de l'IA générative tout en balayant les préoccupations concernant le préjudice qu'elle peut infliger au marché des œuvres sur lesquelles elle est entraînée ».

Commentant la position du juge Alsup, selon laquelle « il ne s'agit pas du type de déplacement concurrentiel ou créatif qui relève de la loi sur le copyright », le juge Chhaabria affirme que « en ce qui concerne les effets sur le marché, l'utilisation de livres pour apprendre aux enfants à écrire n'est pas du tout comparable à l'utilisation de livres pour créer un produit qu'un seul individu pourrait utiliser pour générer d'innombrables œuvres concurrentes avec une fraction minuscule du temps et de la créativité que cela nécessiterait autrement. Cette analogie inopportune ne permet pas d'écarter le facteur le plus important de l'analyse du fair use ».

Le débat sur le fair use pour entrainer les IA est donc loin encore d'être refermé.

Commentaires (14)

votre avatar
Le cas des oeuvres piratées n'est pas une surprise.
votre avatar
Intéressant, ce point d'étape.
On voit que l'on est encore loin d'une jurisprudence établie aux USA.
votre avatar
La mémorisation importante, ça comprend la mémorisation totale ?
votre avatar
"les plaignants (...) ne présentent aucune preuve de la manière dont les résultats actuels ou attendus des modèles de Meta dilueraient le marché de leurs propres œuvres"
Présenter une telle preuve reviendrait à reconnaitre que les versions générées par IA sont d'une qualité suffisante pour plaire à leur public cible. C'est limite faire de la pub aux IA.
votre avatar
Dans celle-ci, il affirme notamment qu'Anthropic avait le droit d'entrainer ses modèles sur les livres de ces auteurs qu'elle avait achetés en version papier puis scannés,
Je suis d'accord avec le point de vue. Achat vaut utilisation. Même si certains ayants-droits dans l'audio ne l'entendent pas de la même oreille.

Par contre, Anthropic peut-il prouver qu'il a acheté tous les livres utilisés pour l'entrainement ?
Le point d'attaque se situe là pour moi.
votre avatar
Par contre, Anthropic peut-il prouver qu'il a acheté tous les livres utilisés pour l'entrainement ?
Le compte rendu du jugement mentionne une référence vers ce qui me semble être une pièce. Donc je suppose que oui, ils ont produit une preuve d'achat.
votre avatar
Marrant comme obtenir des exemptions au DMCA pour adapter les oeuvres pour les personnes malvoyantes, ça passait pas, mais pour donner à manger à l'IA, c'est beaucoup plus facile.
votre avatar
On dirait que les deux juges disent exactement le contraire l'un de l'autre :

Juge 1 : Pas de problème de fair use lié à la transformation, par contre, l'aspect piratage y a ptèt à redire.
Juge 2 : Pas de problème de piratage. Par contre, la question du fair use, y a ptèt à redire.

Nous v'la bien avancés...
votre avatar
Pour le piratage, non, le second juge ne dit pas "pas de problème". Il dit que les plaignants n'ont pas réussi à prouver celui-ci et pas utilisé de bons arguments :
sa décision « confirme seulement que ces plaignants ont avancé les mauvais arguments et n'ont pas réussi à constituer un dossier à l'appui des bons arguments ».
Et pour le fair use, le premier juge ne regarde que l'aspect transformation alors que le second juge dit qu'il faut aussi regarder les effets sur le marché. Et j'ai l'impression qu'il a raison si je me souviens bien de ce que j'ai lu à ce sujet quand il a été abordé dans des articles précédents.

Mais comme je le disais dans le premier commentaire, établir une jurisprudence va prendre du temps. Je crois me souvenir que c'est une raison pour laquelle le Royaume-Uni a préféré passer par la loi afin d'aller plus vite.
votre avatar
Mais du coup, est-ce qu'ils peuvent utiliser la copie pirate s'ils ont préalablement acheté un exemplaire papier de l'oeuvre ? Ou il faut tout re-scanner soi-même ?
votre avatar
Creative Commons a officiellement lancé ses travaux sur les CC Signals, des indicateurs visant à enrichir les licences CC pour préciser les droits en matière d'usage vis à vis de l'entraînement d'IA notamment.

L'initiative a son propre site web pour en savoir plus. Les propositions d'implémentation sont intéressantes, car elles reposent sur quatre critères que l'auteur peut activer et auxquels le détenteur de la licence CC devra se conformer :
- Crédit : le détenteur de la licence devra créditer les méthodes, objectifs et le contexte de l'usage
- Direct contribution : le matériel peut être utilisé en l'échange d'un soutien (financier ou en nature)
- Ecosystem Contribution : Même chose, mais visiblement c'est l'organisme dont dépendrait le détenteur de la licence, je ne suis pas certain de l'avoir bien compris lui
- Open : le système découlant de l'usage doit remplir les exigences du Model Openness Framework ou du Open Source AI Definition.

Voilà qui va être un sujet intéressant à suivre ! Rappelons que les termes actuels des licences CC ne permettent pas de manifester sont opposition à la fouille et collecte de textes au sens de la DAMUN européenne.
votre avatar
@AlexandreLaurent je me permets de te bipper sur ce sujet, car vous n'en avez pas encore parlé (sauf si c'est dans les cartons). Ce genre d'évolution est tout de même assez importante je pense :)
votre avatar
Merci @SebGF pour le ping, j'avoue que je n'avais pas vu passer l'info jusqu'ici, mais on va regarder, ça semble effectivement très intéressant !
votre avatar
Avec plaisir. Ils ont publié une update hier d'ailleurs :)

Copyright : les entreprises d’IA gagnent plusieurs manches judiciaires, mais pas toutes

  • Le droit d'entrainer sur des livres achetés et scannés

  • Une concurrence déloyale non prouvée

Fermer