Connexion
Abonnez-vous

L’éditeur Penguin Random House refuse que ses livres servent à entrainer des IA

L’éditeur Penguin Random House refuse que ses livres servent à entrainer des IA

Le 22 octobre à 09h00

La multinationale de l'édition d'origine britannique Penguin Random House (PRH) a modifié le texte accompagnant la mention de son Copyright sur tous ses livres à l'échelle mondiale pour l'adapter à l'interdiction de l'utilisation de ses textes pour entrainer des systèmes d'intelligence artificielle explique le média spécialisé The Bookseller.

« Aucune partie de ce livre ne peut être utilisée ou reproduite de quelque manière que ce soit dans le but d'entrainer des technologies ou des systèmes d'intelligence artificielle », indiqueront maintenant tous les nouveaux titres ou les rééditions de livres de l'éditeur. Et ceci sera lisible « dans les pages des collections sur tous nos marchés », explique PRH à The Bookseller.

Une mention réservant « expressément [le titre du livre] de l'exception de text and data mining », sera aussi ajoutée pour prendre en compte les lois européennes.

Selon le média spécialisé, PRH est le premier des cinq grands éditeurs commerciaux anglophones à prendre cette décision.

Le 22 octobre à 09h00

Commentaires (14)

votre avatar
Peut-on rajouter cette phrase dans les mentions légales d'un site FR (qui est aussi une édition) et penser que cela puisse avoir un soupçon de valeur légale ?
votre avatar
Possiblement non car la directive européenne DANUM confère un "droit de fouille" à des fins scientifiques.

En cherchant un peu, j'ai d'ailleurs vu passer une décision du tribunal régional de Hambourg dans un litige opposant LAION (l'organisme à but non lucratif derrière les data set ayant notamment permis d'entraîner Stable Diffusion) et Robert Kneschke.
La reproduction d’une photographie dans un set de données n’est pas contrefaisante car couverte par l’exception de fouille de textes et de données à des fins scientifiques.
Le lien vers la décision (en allemand) est disponible dans l'article pour les intéressés ( @MartinClavey si jamais vous voulez étudier la décision) . Apparemment c'est la première rendue dans le cadre de cette directive.
votre avatar
Ah, merci, je vais regarder ça.
votre avatar
Merci :smack:
votre avatar
Disclaimer : ce message n'a aucune valeur juridique. En cas de nécessité, veuillez consulter un bon avocat disponible au rayon fruits et légumes de votre magasin habituel.
votre avatar
Cette directive distingue la fouille de textes et données à des fins scientifiques (article 3) dont tu parles des autres cas de fouilles (article 4).
Ce dernier dispose qu'il y a bien une exception aux droits d'auteurs sauf si les titulaires des droits ont réservé l'utilisation dans ce cas :
L'exception ou la limitation prévue au paragraphe 1 s'applique à condition que l'utilisation des œuvres et autres objets protégés visés audit paragraphe n'ait pas été expressément réservée par leurs titulaires de droits de manière appropriée, notamment par des procédés lisibles par machine pour les contenus mis à la disposition du public en ligne.
C'est d'ailleurs pour cela que l'éditeur Penguin Random House a rajouté une phrase concernant l'UE.

Donc ajouter une telle phrase ne protège pas de la fouille scientifique mais protège bien de tous les autres cas.
votre avatar
Et que dit la Hadopi à ces techbros sans scrupule ?
votre avatar
PRH aurait dû utiliser OpenOffice pour faire d'une pierre deux coups :
1) Ecriture du livre avec OpenOffice
2) Utilisation du parefeu intégré pour bloquer les IA
:prof:
votre avatar
La question est : est-ce rétroactif ?
votre avatar
Non.
votre avatar
De toute façon, ils ont déjà indexé le contenu via des kit "pirates" d'ebook, ça ne les empêchera pas de continuer vu que le respect du droit d'auteur n'a jamais été un obstacle pour ces boites
votre avatar
Du coup, l'intérêt n'est pas gigantesque il me semble. Si c'est pour protéger que les nouvelles œuvres, ça ne devrait pas être un gros problème pour les éleveurs d'IA.
votre avatar
Ça protégera aussi les rééditions des anciennes œuvres.
votre avatar
Une réédition peut être aussi concernée.

En gros, c'est applicable dès qu'il y a attribution d'un ISBN. Donc non, ça ne couvre pas le passé mais ça rend future proof. PRH a publié 15 000 titres en 2021 si j'en crois leur page Wikipedia, c'est loin d'être la petite maison d'édition qui sort cinq livres par an.

L’éditeur Penguin Random House refuse que ses livres servent à entrainer des IA

Fermer