Connexion
Abonnez-vous

Utilisation d’œuvres sous droits : auteurs et éditeurs français assignent Meta

Le comte Almaviva désespère

Utilisation d’œuvres sous droits : auteurs et éditeurs français assignent Meta

Les auteurs et les éditeurs font l'union sacrée face à l'utilisation faite par les géants de l'IA de leurs œuvres, protégées par le droit, dans le cadre de l'entraînement de leurs modèles. Ils assignent en justice Meta, à Paris, et réclament notamment le retrait complet des répertoires de données créés sans autorisation.

Le 13 mars à 15h31

Dans un rare mouvement d'union, le Syndicat national de l’édition (SNE), la Société des Gens de Lettres (SGDL) et le Syndicat national des auteurs et des compositeurs (SNAC) ont annoncé mercredi avoir assigné en justice le groupe Meta. Ils dénoncent une « utilisation massive d’œuvres sous droits, sans autorisation de leurs auteurs et éditeurs ».

« Alors que nous avons constaté la présence de nombreuses œuvres éditées par des membres du Syndicat national de l’édition dans les corpus de données utilisés par Meta, nous saisissons aujourd’hui le juge pour faire reconnaître le non-respect du droit d’auteur, le parasitisme », précise Vincent Montagne, président du SNE, dans un communiqué.

Accusations de parasitisme

D'après l'AFP, la procédure ciblerait particulièrement l'utilisation faite par Meta de la base de données Books3. Issue du tracker bittorrent bibliotik, celle-ci est notoirement connue pour réunir, au format txt, l'équivalent de près de 200 000 livres, dont beaucoup sont protégés par le droit d'auteur.

Meta, comme NVIDIA et OpenAI, ont déjà fait l'objet de poursuites, initiées en 2023 puis début 2024 par des détenteurs de droit américains, pour avoir exploité le corpus de Books3 à des fins d'entraînement de leurs grands modèles de langage.

À l'époque, Meta avait admis que des portions de Books3 avaient été utilisées, entre autres jeux de données, pour procéder à l'entraînement de ses modèles Llama 1 et Llama 2. La société se défendait cependant de toute infraction au droit d'auteur, invoquant une « utilisation raisonnable » (fair use).

Un argument que récusent par avance les trois organisations du livre. « Cette action en justice s’inscrit dans un contexte de régulation au niveau européen, l’AI Act ayant rappelé la nécessité pour les sociétés éditrices de solutions d’intelligence artificielle générative de respecter le droit d’auteur et d’assurer la transparence sur les sources utilisées pour développer des modèles de fondation », rappellent-elles de façon opportune, alors que l'exécutif devra bientôt préparer la mise en œuvre des dispositions du règlement européen sur l'IA.

Appel à un cadre légal et à un dédommagement

L'appel adressé à Meta se révèle quant à lui plus pragmatique, dans une logique de droits voisins similaire à celle qui sous-tend déjà les accords passés au sujet de l'exploitation des œuvres de l'esprit sur les réseaux sociaux ou les moteurs de recherche.

« L’action que nous entamons doit aussi faire naître une volonté sérieuse des IA de tenir compte de la création, d’en respecter le cadre juridique et le cas échéant de trouver des contreparties pour l’utilisation d’œuvres dont ils se nourrissent. C’est essentiel pour préserver un écosystème fragile qui doit sa richesse à la diversité éditoriale », estime ainsi Christophe Hardy, président de la SGDL.

Début février, 38 organisations internationales représentant l’ensemble des secteurs créatifs et culturels soulignaient déjà, à l'occasion du Sommet pour l'action sur l'IA, la nécessité de concilier « le développement de l’IA avec le respect des droits d’auteurs et des droits voisins ».

Commentaires (23)

votre avatar
J'ai du mal à comprendre pourquoi il faudrait un "cadre légal" en plus avec qu'on a déjà celui-ci dans l'UE.

De ma compréhension, la base de données book3 est illicite puisque composées d'oeuvres protégées par le droit d'auteur diffusées sans accords.

La directive DAMUN considère que les oeuvres doivent avoir une origine licite. Quant à l'usage de Meta, il ne rentre pas dans l'exception de recherche scientifique et de conservation du patrimoine donc les auteurs peuvent s'opposer à la fouille de textes librement accessibles (pour ma part je l'ai indiqué à la fois dans les balises meta des EPUB via le TDM Protocol et dans les mentions légales). Et par librement accessible, j'entend diffusion licite. Un bouquin sur un tracker torrent en piratage est une diffusion illicite.

Et le droit d'auteur à l'échelle nationale protège aussi des usages non autorisés par les titulaires des droits.

Pour moi, l'usage de Meta de Book3, c'est juste de la contrefaçon.

Enfin, la notion de "fair use" sur laquelle se base Meta n'existe pas à ma connaissance dans l'UE pour le droit d'auteur. C'est une notion américaine.
votre avatar
Pour moi, l'usage de Meta de Book3, c'est juste de la contrefaçon.
Exactement comme OpenAI et ChatGPT, quoi.
votre avatar
S'il est montré qu'ils ont utilisé la base book3, oui je suis de l'avis que c'est une contrefaçon.

Je n'ai pas souvent que OpenAI l'ait reconnu dans l'immédiat.

Par contre, pour rappel, la fouille des oeuvres librement et licitement accessibles sur Internet est autorisé par la DAMUN sauf opposition de l'auteur ou de ses ayants-droits (sachant qu'il ne peut s'opposer à l'exception recherche scientifique et sauvegarde du patrimoine).
votre avatar
Book3 je ne sais pas, mais ils ont bien utilisé pas mal de textes sans autorisation. Exactement comme Meta.
votre avatar
Si tu dis tout avant que je passe, je n'ai plus rien à dire (ou presque).

Il est fort probable que la diffusion de Book3 soit illicite, comme l'est la diffusion sur Sci-Hub de papiers scientifiques dont l'accès est normalement protégé, payant.

Par contre, citer l'AI Act et la transparence sur les sources utilisées est une double connerie :

1) l'utilisation de Book3 est antérieure à la date d'application de l'AI Act concernant la transparence. Les dates d'applications sont échelonnées et actuellement, seules les "Interdictions relatives aux systèmes d’IA présentant des risques inacceptables." sont applicables.

2) la transparence dont ils parlent n'est demandée aux fournisseurs de modèles d'IA que pour les fournisseurs de systèmes d'IA (si ceux-ci sont différents des premiers) et pas pour tout le monde (auteurs divers ou utilisateurs) : article 53 1 b et l'annexe XII précisant les données à fournir.

Remarque : la défense de Meta par le fair use était aux USA donc tout à fait appropriée par rapport au contexte juridique. On verra ce que les juges US diront au final.

Remarque 2 : l'entraînement de Llama 1 et Llama 2 a très probablement eu lieu aux USA. Je me demande si attaquer en France est la bonne façon de faire. Je pense qu'il faut attaquer aux USA. Le code de la propriété intellectuelle me semble applicable seulement en France et au niveau de l'UE la directive DAMUN ne concerne que les usages nationaux ou transfrontaliers (c'est-à-dire entre pays de l'UE).
votre avatar
Pour moi, l'usage de Meta de Book3, c'est juste de la contrefaçon.
Tu connais quelqu'un qui utilise un LLM pour lire des livres toi ?
votre avatar
Ici je ne parle pas du résultat produit (le LLM) mais de l'usage de sources de données acquises d'une manière manifestement illicite. Le dataset Books3 est controversé en raison de la présence de livres protégés par le droit d'auteur dedans. Il a été supprimé de HuggingFace pour ces raisons.

Au regard du droit d'auteur en France (puisqu'on parle d'une plainte du SNE en France), c'est de la contrefaçon.

Que ce soit pour faire du LLM ou les imprimer et s'en servir de torche cul, ça reste une exploitation de matériel sous droit d'auteur sans en avoir acquis les droits. Sauf si Meta s'en est occupée, ce qui ne me semble pas avoir été le cas au vu de leurs déclarations.

Un dataset ne contenant que des données du domaine public n'aurait pas posé de soucis. Tout comme Creative Commons avait considéré l'usage training comme du fair use et invitait les créateurs à bien expliciter leur opposition (notamment en vertue de la DAMUN européenne, les termes de la CC ne constituant pas une opposition telle que définie par la directive).
votre avatar
Au regard du droit d'auteur en France (puisqu'on parle d'une plainte du SNE en France), c'est de la contrefaçon.
Que ce soit pour faire du LLM ou les imprimer et s'en servir de torche cul, ça reste une exploitation de matériel sous droit d'auteur sans en avoir acquis les droits.
Ben non, c'est pas ça la contrefaçon. Il n'y a aucune reproduction du matériel par Meta.
Et quand bien même ce serais le cas, ce serait totalement injuste puisqu'il n'y a aucun préjudice.
votre avatar
Il y a usage de contrefaçon par Meta (au moins en droit français) car utilisation d'œuvres copiées de façon illicite par celui qui a fait book3.

Comme je le disais, je pense que le droit français n'est pas applicable ici si cet usage a été fait aux USA comme c'est probable.

Ce n'est pas pour autant que les œuvres publiées en France ne sont pas protégées aux USA. Elle le sont par des accords internationaux où règne la réciprocité.

L'article L111-4 du code de la propriété intellectuelle est d'ailleurs intéressant :
Sous réserve des dispositions des conventions internationales auxquelles la France est partie, dans le cas où, après consultation du ministre des affaires étrangères, il est constaté qu'un Etat n'assure pas aux oeuvres divulguées pour la première fois en France sous quelque forme que ce soit une protection suffisante et efficace, les oeuvres divulguées pour la première fois sur le territoire de cet Etat ne bénéficient pas de la protection reconnue en matière de droit d'auteur par la législation française.
Toutefois, aucune atteinte ne peut être portée à l'intégrité ni à la paternité de ces oeuvres.
Dans l'hypothèse prévue à l'alinéa 1er ci-dessus, les droits d'auteur sont versés à des organismes d'intérêt général désignés par décret.
Si les USA n'assure pas une protection suffisantes aux œuvres françaises, les œuvres US pourraient ne plus bénéficier de protection en France. En cette période tendue avec les USA, ça serait assez amusant.
Cela voudrait dire que tous les droits concernant les œuvres US seraient conservés en France pour des "organismes d'intérêt général".

Remarque : c'est en particulier cet article qui me fait penser qu'il faut attaquer aux USA.
votre avatar
Il y a usage de contrefaçon par Meta (au moins en droit français) car utilisation d'œuvres copiées de façon illicite par celui qui a fait book3.
En matière de produit numérique sur des œuvres intellectuelles ça va être difficile à vendre, je doute que cela s'applique. Il y aurais usage si Meta avait recréé un livre, un film ou une autre œuvre avec ces histoires, mais ce n'est pas le cas.
Si les USA n'assure pas une protection suffisantes aux œuvres françaises, les œuvres US pourraient ne plus bénéficier de protection en France.
Encore une fois, il n'y a aucun préjudice, les œuvres sont bien protégées.
votre avatar
point 1 :
rien ne dit que ça soient uniquement des œuvres diffusées numériquement dans book3 et qu'il n'y ait pas de scan puis reconnaissance de caractères.
De toute façon, on s'en fiche la protection de la propriété intellectuelle s'applique à tout type de support.

Edit : le terme contrefaçon est le terme légal en France pour dire copie non autorisée, c'est peut-être une partie de notre mécompréhension mutuelle. Je ne parle pas des modèles entraînés quand je parle de contrefaçons mais des copies des œuvres qui ont servi à l'entraînement

book3 est un ensemble d'œuvres dont au moins certaines sont protégées qui était mis illégalement à disposition. C'est là qu'est la contrefaçon. Utiliser une œuvre contrefaite est interdit en France quel que soit son usage y compris pour entraîner de l'IA.

Point 2 :
Je ne me suis pas prononcé sur l'issue des procès aux USA. Je n'ai pas la boule de cristal appropriée, tellement le sujet est difficile dans un pays de common law.
Il est possible que ce que tu dis soit vrai (ou faux). Vus les enjeux, ça remontera probablement jusqu’à la Cour Suprême des USA.
Il y a au moins le préjudice initial d'accès à des œuvres protégées copiées illégalement. Celui-ci me semble indéniable et peut mériter une indemnisation, pas forcément élevée (le coût d'achat de l'œuvre).
votre avatar
On verra ce que dira la procédure.

Pour le moment, à ma connaissance, la DAMUN n'a été éprouvée qu'une seule fois en Europe (un photographe allemand contre LAION) et celles aux USA sur le fair use m'intéressent aussi pour savoir ce qui va en découler.
votre avatar
tout le brousouf.
(Les mastodondes de l'IA ne pas des enfants de coeurs non plus) mais là ce n'est pas pour protégé l'Art mais bien pour s'en foutre (encore) plein les poches.

Rappel : Quelle est la durée du droit d'auteur pour un livre ?
L'auteur jouit, sa vie durant, du droit exclusif d'exploiter son oeuvre sous quelque forme que ce soit et d'en tirer un profit pécuniaire. Au décès de l'auteur, ce droit persiste au bénéfice de ses ayants droit pendant l'année civile en cours et les soixante-dix années qui suivent.

Versus
Maintenez en vigueur votre brevet
Maintenez en vigueur votre brevet par le paiement de vos annuités ! Elles doivent être acquittées au plus tard le dernier jour du mois anniversaire du dépôt de la demande. Passée une période de 20 ans maximum, votre invention tombe dans le domaine public, c’est-à-dire qu’elle ne bénéficie plus de protection et que toute personne peut l’exploiter.
Les certificats d’utilité sont délivrés pour une période de 6 ans à compter du jour du dépôt de la demande. Le régime juridique du certificat d’utilité et le système de paiement des redevances sont les mêmes que ceux des brevets, à l’exception du rapport de recherche, qui n’est établi qu’en cas de contrefaçon.


source : legifrance.gouv.fr République Française

et
https://www.inpi.fr/comprendre-la-propriete-intellectuelle/le-brevet/votre-brevet-quelle-vie-apres-le-depot#:~:text=Votre%20invention%20est%20prot%C3%A9g%C3%A9e%20pour,arr%C3%AAte%20pas%20%C3%A0%20son%20d%C3%A9p%C3%B4t.
votre avatar
• une création

• une invention

Si besoin d'une explication mercantile ou financière, dans un cas l'exploitation a un potentiel plus lucratif que dans l'autre. Sinon, c'est juste que le "beau" n'apporte pas le même intérêt que l' "utile" et que la comparaison des deux a une signification nulle ou très limitée.
votre avatar
Sans attaque aucune, je ne comprends pas la réponse.
Une création : renvoi vers une publicité Orange de 2009 (très belle au deumeurant) qui explicite le métaphorique et le litérrale.
Une invention ; renvoi vers une publicité pour les airbags latéraux pour volvo.
Je serais tempté de dire oui et alors...?

pour la France
Il y a une différence entre la propriété industriel et la propriété litérraire et artistique.
Je ne comprends pas le bien fondé de cette distinction. (A part autrement que de la pseudo supériorité des artistes vis-à-vis des artisans...).
Car les prérogatives du droit moral de l’auteur sont inaliénables. 9a je suis tout à fait d'accord (et heureusement que ça l'ait.
Mais je ne comprends pas la différences d'application des droits patrimoniaux entre celui d'un auteur ou d'un détendeur de brevet.
Les deux proviennent d'Oeuvre de l'ésprit.
En jouant la provopcation (amical)
Vous-même vous avez du mal en faisant (du point de vue du Droit Français) de recel de contrefçon par les lien vers des publicités (Elle sont aussi protégé par le droit d'auteur :non::non::non::-D:yes: ; chose qu'on oublie souvent)
votre avatar
D'abord, tu opposes deux notions qui sont complémentaires. La propriété industrielle est un versant spécifique de la propriété intellectuelle.

La propriété industrielle se compose de deux éléments :
- La création industrielle : comprenant les brevets (durée de vie 20 ans) et le droit des dessins et modèles (5 ans renouvelable jusqu'à 25 ans), ils sont censés accorder un monopole d'exploitation pour valoriser la création.
- Les signes distinctifs : le droit des marques. Une marque est déposée pour 10 ans et peut être renouvelée indéfiniment pour protéger ce qui distingue l'entreprise des autres.

La propriété littéraire et artistique se compose de deux éléments :
- Les droit d'auteur : ils sont censés protéger la créativité
- Les droits voisins : ils sont censés protéger les interprètes et producteurs

C'est quoi la différence entre ces deux branches :
- La propriété littéraire et artistique est acquise automatiquement à condition que l'oeuvre soit originale et ne demande aucune démarche administrative. Les droits moraux sont valables 70 ans (et même 100 ans dans le cas d'un auteur mort pour la France) au 1er janvier de l'année suivant le décès de l'auteur.
- La propriété industrielle doit faire l'objet d'un dépôt et d'un renouvellement, elle est plus limitée dans le temps à l'exception des signes distinctifs.

Une autre différence notable est qu'un dépôt de brevet implique la divulgation de l'invention au public. Pour être protégée, une invention doit respecter trois critères :
- Être nouvelle, ne pas avoir été rendue accessible au public avant dépôt
- Elle doit avoir une application industrielle
- Elle doit être inventive et ne pas être une production "évidente"

Dans le cas de la propriété intellectuelle, tu n'as aucune obligation de divulguer l'oeuvre. Tu peux la garder pour toi, elle sera protégée dans tous les cas.

Je pense que c'est là un point important, car le brevet permet d'avoir un monopole sur l'invention durant toute cette période. Comme le but de la propriété industrielle est de protéger mais aussi de dynamiser la création, il ne me paraît pas sensé de faire des brevets de très longue durée. Il y a une notion d'intérêt général à prendre en compte. L'impact entre une oeuvre littéraire protégée 70 ans après la mort de l'auteur sur le marché et celle d'une invention industrielle n'est pas du tout le même. Tout comme la durée de vie d'une invention n'est pas aussi longue qu'un oeuvre de l'esprit. Un bouquin, c'est théoriquement immortel. Une technologie, une invention, un produit, ça peut devenir désuet et dépassé.

Par contre, un auteur peut recourir au droit des marques pour protéger son nom de plume et des composants de son oeuvre.

Bref, en gros je pense que ce qui fait la différence de cette durée de protection, c'est avant tout la finalité de la création en question. Si la roue était encore brevetée et monopole d'une seule entreprise, quelle serait la gueule de l'industrie ? Je pense que l'impact est bien plus fort que de savoir qu'un bouquin est encore protégé pendant 70 ans.
votre avatar
Merci pour ces précisions.
Cependant mon niveau d'incompréhention vient de la différence de traitement entre les deux et aussi de la durée bien au delà de la mort de l'auteur dans le second cas.
Pour moi à partir du moment où une oeuvre est rendue publique cela devrait être le même traitement que celui du brevet. Car bien que cela doit encore existé, je pense que la plus grandes majorités des oeuvres littéraires (ou autre) qui sont diffusées au publics le sont dans un but mercantile et non plus pour le "profit de l'Humanité" ;-)

Et Ca n'enleve rien que à la partinité d'une oeuvre.
par exemple, les fables de la fontaines sont toujours celle de la Fontaine.

Et je reprends mon exemple à la c. précedent, les pubs dont l'on m'a mi les liens youtube tout à l'heure, sont pourant aussi protégé par le droit d'auteur et pourtant personne s'en emmeut.
Par contre si je republiais "Harry Potter et la coupe de feu (année)", même en indiquant bien l'autrice, le non du traducteur, ainsi que le nom de la 1er maison d'édtion.
Ce serait haro sur moi, car je vole l'auteur.

Et question naîve en passant :
fr.wikipedia.org Wikipedia (le presse agrume de Stark)
C'est ne pas un objet d'art à la base et à du faire l'objet d'un depot de brevet . Comment est-ce ou (a été) protégé ?
PS : réponse à moi-même c'est une marque tridimentionnel
https://www.inpi.fr/sites/default/files/inpi_saga_culinaire_0.pdf
fr.wikipedia.org Wikipedia
Dépot de la marque pour dix ans renouvelable indéfiniment.

Même dans ce cas l'inventeur doit payer pour protégé son oeuvre alors que l'auteur non ...
Deux poids deux mesures.



PPS : Je ne cherche pas à créer une oposition, simple échange d'idées.
Mon raisonnement peut avoir des biais et des erreurs.
Ne pas taper outres mesures, si j'ai dit de la m.
:tchintchin:
votre avatar
Le droit d'auteur et la PI des inventions matérialisée par les brevets ne remplissent pas du tout les mêmes rôles (les dispositifs ont été créés pour des objectifs différents). C'est donc normal que les durées et les modalités soient différentes.

Edit : JK m'a grill(é)er
votre avatar
«Au décès de l'auteur, ce droit persiste au bénéfice de ses ayants droit pendant l'année civile en cours et les soixante-dix années qui suivent.»
C'est-à-dire, qu'en quelque sorte, on assure une pension de réversion à des arrières-petits-enfants qui n'ont même pas connu l'auteur… Mais compte tenu du très faible % qui est reversé à l'auteur c'est plutôt l'éditeur qui se sucre durant 70 ans.
votre avatar
alors que l'exécutif devra bientôt préparer la transposition en droit français de l'AI Act.
Je n'avais pas remarqué ce détail de prime abord, mais le AI Act est un règlement européen. Il est donc applicable directement sans transposition en droit national.

La France a par contre des adaptations à faire pour rendre ses lois conformes au règlement (comme le RGPD la loi Informatique et Libertés de 1978 qui a du être modifiée, par exemple en abrogeant des dispositions).
votre avatar
bien entendu, merci de l'avoir relevé, je corrige de ce pas
votre avatar
Bon courage à eux vu qu'ils s'attaquent au nouveau Zuck sous stéroïde appuyé par l'Agent Orange et sa bande de mafieux :(
votre avatar
La difficulté de réussir peut-elle s'ajouter à la nécessité d’entreprendre ?

Figaro-used-Fact

Utilisation d’œuvres sous droits : auteurs et éditeurs français assignent Meta

  • Accusations de parasitisme

  • Appel à un cadre légal et à un dédommagement

Fermer