Connexion Premium

Présomption d’usage de contenus culturels dans l’IA : les tentatives d’influence de Google

Google est très mobilisé pour faire évoluer la proposition de loi sur l’intelligence artificielle adoptée au Sénat le 8 avril dernier. En l’état, le texte instaure surtout une présomption d’usage des contenus culturels par les constructeurs d’IA dès que des indices peuvent en être repérés dans les résultats.

Concrètement, cette présomption s’appliquerait dès qu’il est possible de créer des contenus « dans le style » d’un ou une autrice, ou dès que la machine recrache des éléments visiblement protégés, comme ces extraits de Harry Potter retrouvés dans les données d’entraînement des machines de Meta ou de Mistral.

D’après L’Informé, Google a tenté de pousser trois stratégies pour minimiser les effets du texte : l’une aurait consisté à « limiter l’effet du texte aux contenus culturels de qualité », c’est-à-dire ne réserver l’idée de présomption d’entraînement qu’aux œuvres présentes dans les catalogues d’organismes de gestion collective.

Illustration : Flock

Une autre cherchait à « clarifier » la manière dont la loi s’agençait « avec l’exception de fouille de données », ou « text and data mining » (TDM) de la directive de 2019 sur le droit d’auteur et les droits voisins dans le marché unique numérique.

Si elle est « alléguée par les fournisseurs d’IA comme fondement juridique à leurs pratiques de moissonnage de contenus protégés », écrivait le Sénat dans son rapport, il s’agit néanmoins d’un « détournement » de l’objectif initial du texte.

Une autre tentative a consisté à empêcher que le texte final ne s’applique aux litiges déjà ouverts lorsqu’il entrera en vigueur. Là encore, le Sénat a retoqué sa proposition.

Que les sociétés numériques tentent d’influer sur la rédaction des textes légaux fait partie intégrante du jeu de la régulation – on retrouve quelquefois très directement leurs traces, y compris au niveau européen.

Dans le présent cas, les propositions de Google ont échoué à l’étape sénatoriale. Le texte doit encore être débattu à l’Assemblée nationale.

Commentaires (6)

votre avatar
Une nouvelle preuve s'il en était besoin que les lobbys des Zayandroi sont plus efficaces/puissants que ceux de la technologie...
votre avatar
l’une aurait consisté à « limiter l’effet du texte aux contenus culturels de qualité », c’est-à-dire ne réserver l’idée de présomption d’entraînement qu’aux œuvres présentes dans les catalogues d’organismes de gestion collective.
Ah, si c'est pas dedans, c'est pas de la qualité ? Belle vision élitiste ! Comme si ça n'arrivait jamais que le travail éditorial soit bâclé dans le domaine.
votre avatar
Je vais me faire l'avocat du diable, mais si on ne fait pas de distinguo entre "vrai oeuvre" et "création normale" (gros, gros guillemets ! ), alors presque tout ce qui est sur le Web 2.0 (articles de blog, wiki, etc...) rentre dans le cadre de cette loi.

Est-ce un mal ou un bien, je sais pas, mais ça me semble logique de vouloir faire la différence.
votre avatar
Le droit d'auteur couvre toutes les oeuvres de l'esprit. Donc oui, un article de blog, de wiki, etc., est protégé par le droit d'auteur.

Encore heureux, c'est un droit fondamental !

Ce distinguo est absurde.
votre avatar
Actuellement, oui, tout peut tomber dans le champ du droit d'auteur, mais comme ils s'en battent l'oreille avec une babouche et qu'il faut prouver qu'ils ont piraté, c'est comme si rien n'était protégé.
Si cette nouvelle loi passe, c'est l'inverse et ils ne peuvent pratiquement plus rien siphonner sous peine de devoir prouver que, non, ce qui a été aspiré ne peut pas entrer dans la définition d'œuvre d'art, etc...
Mettre des règles plus claires sur ce qu'est ou n'est pas une œuvre d'art susceptible de passer dans le champ de cette loi est logique pour aider les entreprises d'IA.

Maintenant, est-ce que, franchement, j'ai envie que des pillards se retrouvent le nez dans le caca ?... Bien sûr ! 😁
votre avatar
Le cadre légal en Europe est pourtant déjà en place sur ce point. À améliorer, certes, mais il protège déjà.

La SGDL a d'ailleurs mis en place (tardivement, à croire que les gens du domaine découvrent leurs droits !! - Le SNE en parlait déjà en 2023) un outil pour déclarer ses oeuvres dans l'opt-out de l'exception de fouille de textes.

Rappelons que l'exception de fouille de textes n'est légale qu'à partir du moment où l'oeuvre est librement accessible sur le Web et de manière licite. Donc les libgen et compagnie, c'est illégal quoiqu'il arrive si l'oeuvre s'y trouve sans le consentement de l'auteur ou de ses ayants-droits.

Cela dit, je préférerais que le mécanisme d'exception devienne de l'opt-in pour les usages commerciaux. Le problème restant l’ambiguïté des organismes à but non lucratifs comme l'allemand LAION a pu en bénéficié dans son cas.