Connexion
Abonnez-vous

IA et copyright : Thomson Reuters gagne un premier procès

Le 12 février à 09h18

Thomson Reuters a gagné le premier procès sur l'utilisation de contenus copyrightés pour entrainer une IA, explique Wired. Le juge américain Stephanos Bibas s'est prononcé [PDF] sur l'affaire impliquant la startup d'IA, Ross Intelligence, qui utilisait du machine learning sur la base de données Westlaw dont la multinationale de l'édition possède le copyright.

des nuages de données s'échappent des cheminées de petites maisons dessinées en rang d'oignon

Comme le note Wired, il explique dans sa décision qu' « aucune des défenses possibles de Ross ne tient la route. Je les rejette toutes ».

Le juge y précise aussi que l'utilisation des contenus que fait l'IA de Ross n'est pas « transformatrice » et ajoute : « étant donné que le paysage de l'IA évolue rapidement, je signale aux lecteurs que seule l'IA non générative est à l'examen aujourd'hui ».

Mais cette décision pourrait bien concerner tout le secteur, y compris l'IA générative. Ross Intelligence, qui a annoncé sa fermeture en 2021 tout en qualifiant ce procès de « fallacieux », a en effet utilisé l'argument du fair use pour défendre la légalité de son utilisation des contenus copyrightés de Thomson Reuters.

Le juge explique que quatre facteurs doivent être pris en compte dans le fair use :

  1. le but et le caractère de l'utilisation, y compris son caractère commercial ou non lucratif ;
  2. la nature de l'œuvre protégée par le droit d'auteur ;
  3. la quantité de l'œuvre utilisée et son importance par rapport à l'ensemble de l'œuvre protégée par le droit d'auteur ;
  4. la façon dont l'utilisation de Ross a affecté la valeur de l'œuvre protégée par le droit d'auteur ou son marché potentiel.

Stephanos Bibas a jugé que Ross « avait l'intention de concurrencer Westlaw en développant un substitut sur le marché » avec son outil et contrevenait donc au quatrième facteur du fair-use.

Le 12 février à 09h18

Commentaires (7)

votre avatar
Je ne connais pas Ross Intelligence, cependant avant de sauter pied joint sur une généralité, il est important de noter que le juge précise que sa décision concerne les "IA non génératives". Donc cette décision ne s'applique pas aux IA génératives comme GPT, LLaMA, DeepSeek, Claude ou Mistral AI.
votre avatar
...et que la décision se base sur le droit américain (le fair use n'existe pas tel quel en France, on a d'autres concepts)
votre avatar
Ils ont entraîné une IA en utilisant les résultats de l'utilisation du moteur de recherche juridique de Reuter, qui affiche en plus des décisions de justes des headnotes rédigées par Reuter et qui sont l'objet du litige de plagiat avec en plus un système de numérotation qui est reconnu comme original au sens du Copyright. Je n'ai pas encore lu le PDF du jugement en entier pour voir si ça peut s'appliquer aux IA génératives comme indiqué dans l'article de wired et ici.
votre avatar
Maintenant que j'ai lu le jugement en entier, je peux dire que sur les 4 facteurs, Ross a gagné sur les 2 et 3 mais le 2 est moins fort et le 4 le plus important. C'est pour cela que le juge a rejeté le faire use invoqué par la défense (Ross).

C'est donc parce que Ross n'a pas démontré que son utilisation de l'œuvre protégée ne modifiait pas le marché qu'il a perdu sur le faire use.

Je pense qu'il peut y avoir un jugement différent pour de l'AI générative quand elle est sur un autre marché que l'œuvre utilisée.
votre avatar
Mais cette décision pourrait bien concerner tout le secteur, y compris l'IA générative.
C'est assez audacieux d'écrire ça juste après le rappel du juge de ne pas tirer de conclusions trop hâtives. Les raisons de la condamnations sont précisément celles qui différencie ce cas des IA génératives.
votre avatar
J'ai bien écrit que ça concernait l'ensemble du secteur car une bonne partie des défenses dans les procès en cours prend appuie sur le fair use.

Après, effectivement sur l'IA générative, il faut considérer 1/ l'entraînement d'un outil avec les contenus copyrightés (ce qui est le cas ici aussi) et 2/ la régurgitation de contenus qui est parfois attaquée pour plagiat de contenus copyrightés (ce qui n'est pas le cas ici par contre)
votre avatar
Moi aussi je vais utiliser l'argument du fair use pour défendre la légalité de mon utilisation des contenus copyrightés (applis, musiques, séries, films et autres jeux tipiak)... :D

IA et copyright : Thomson Reuters gagne un premier procès

Fermer