Connexion
Abonnez-vous

Internet Archive retire plus de 500 000 livres de sa bibliothèque sous la pression des éditeurs

Bibliotricards

Internet Archive retire plus de 500 000 livres de sa bibliothèque sous la pression des éditeurs

Flock

La bibliothèque numérique d'Internet Archive a été contrainte de retirer de son offre de « prêt numérique contrôlé » plus de 500 000 livres qu'elle avait pourtant légalement acquis, et numérisés. Une auto-censure que déplorent de nombreux chercheurs, étudiants, wikipédiens et lecteurs, dans le monde entier.

Le 24 juin à 15h26

Chris Freeland, directeur des services bibliothécaires d'Internet Archive, vient d'annoncer avoir retiré plus de 500 000 livres de sa « bibliothèque ouverte » en ligne à la demande des éditeurs qui lui ont intenté un procès, et dont l'appel devrait avoir lieu le 28 juin.

L'organisation à but non lucratif états-unienne, dont l'objectif est de fournir un « accès universel à toutes les connaissances », achète ou récupère sous forme de dons des livres au format papier, les numérise avant de les proposer sous forme de « prêt numérique contrôlé ».

Ces fichiers .epub ne peuvent dès lors être « empruntés » que par un internaute à la fois, et pour période de temps limitée, à la manière de ce que font les bibliothèques traditionnelles :

« Notre position est simple : nous voulons simplement permettre aux usagers de notre bibliothèque d'emprunter et de lire les livres que nous possédons, comme n'importe quelle autre bibliothèque. »

Dans la page de présentation de la plainte dont la « bibliothèque ouverte » fait l'objet, l'Electronic Frontier Foundation précise en effet que ce système de « prêt numérique contrôlé » permet d'emprunter des copies numériques de livres « pour une durée de deux semaines ou moins, et ne permet aux utilisateurs d'emprunter que le nombre d'exemplaires qu'Internet Archive et ses bibliothèques partenaires possèdent physiquement ».

Ce qui n'avait pas empêché Hachette, HarperCollins, John Wiley et Penguin Random House d'attaquer l'ONG au motif que ce système violerait leurs droits d'auteur, qu'il leur en aurait déjà coûté des millions de dollars, et qu'il menaçait leurs activités.

« Laissez les lecteurs lire »

Techdirt souligne que si le tribunal n'a pas ordonné la fermeture immédiate de l'Open Library, il a par contre exigé qu'Internet Archive « retire tout livre à la demande des éditeurs (mais seulement si les éditeurs rendent ces livres disponibles sous forme de livres électroniques ailleurs) ».

Sur une page d'aide, Internet Archive explique qu'au-delà de ces quatre éditeurs, l'Association of American Publishers (AAP), l'organisation commerciale à l'origine de l'action en justice, a aussi collaboré avec certains de ses membres qui n'étaient pas cités dans la plainte pour exiger que leurs livres soient, eux aussi, retirés de la bibliothèque.

Y figurent notamment Elsevier, Macmillan, Pearson, Simon & Schuster, Springer, Wolters Kluwer et plusieurs éditeurs universitaires, dont ceux liés aux universités de Cambridge, Harvard, Princeton et Yale.

L'AAP accusait en effet Internet Archive d'avoir « effrontément reproduit et proposé en téléchargement quelque 1,3 million de scans pirates de livres imprimés », en 2020, et d'avoir depuis mis à la disposition du public « plus de 3 millions de livres électroniques protégés par le droit d'auteur ».

L' « open library » d'Internet Archive recense à ce jour près de 8,5 millions de livres numérisés, et plus de 3,5 millions d'utilisateurs ayant emprunté au moins un livre.

L'ONG, qui a fait appel afin de redonner aux lecteurs l'accès à ces livres, vient de lancer une pétition, « Laissez les lecteurs lire », signée par près de 23 000 personnes en 10 jours, réclamant aux éditeurs qu'ils reconsidèrent leur position, et qu'Internet Archive puisse remettre les 500 000 livres en circulation.

« Votre décision de retirer des livres dInternet Archive a un impact dévastateur sur les lecteurs aux États-Unis et dans le monde entier, avec des conséquences d'une portée considérable », avance la pétition, qui liste trois principaux griefs :

    • Le retrait de ces livres entrave la recherche universitaire et « met en péril la préservation de nos connaissances culturelles et historiques, en particulier dans les communautés mal desservies où l'accès est limité ».
    • Tout le monde ne dispose pas d'une bibliothèque locale, n'a pas les moyens de s'y rendre, et Internet Archive « démocratise l'accès à la connaissance ». En restreignant l'accès à ces livres, « vous avez rendu la lecture et l'apprentissage plus difficiles pour les personnes les plus vulnérables de notre société ».
    • La conservation numérique des livres par les bibliothèques « garantit la préservation de notre patrimoine culturel pour les générations futures », les bibliothèques devraient donc être autorisées à les posséder, « et pas seulement à leur accorder des licences à court terme. Votre attaque contre les droits des bibliothèques est une attaque contre la préservation culturelle ».

La version numérique d'un livre de 30 dollars facturée 1 300 dollars

« Une demande qui tombera très certainement dans l'oreille d'un sourd », résume Techdirt, « parce que les droits d'auteur et les systèmes DRM permettent aux éditeurs de surfacturer massivement les livres électroniques » :

« Dans le passé, les bibliothèques pouvaient payer le prix normal d'un livre et le prêter. Mais avec l'octroi de licences pour les livres électroniques, elles sont en mesure de facturer des redevances monopolistiques exorbitantes, tout en limitant artificiellement le nombre de livres que les bibliothèques peuvent même acheter. »

Techdirt avait ainsi relevé qu'un livre coûtant 29,99 dollars au détail pouvait être facturé 1 306,2 dollars pour une licence de livre électronique, licence pouvant en outre comporter des restrictions, « comme l'obligation de renouveler la licence après un certain nombre de prêts, ou le fait qu'une bibliothèque ne peut acheter qu'une seule licence de livre électronique à la fois ».

« Ce n'est pas Internet Archive qui a modifié le fonctionnement des bibliothèques », conclut Techdirt, « ce sont les éditeurs : ils abusent des droits d'auteur et des DRM pour détruire fondamentalement le concept même de bibliothèque, et ce procès fait partie de cette stratégie ».

Les bibliothèques, un « bien commun »

« Les revenus des éditeurs tirés des livres électroniques ont augmenté depuis qu'Internet Archive a commencé ses prêts », plaide de son côté l'ONG, dont Ars Technica résume les arguments (.pdf) qu'elle compte défendre en appel.

Elle rappelle que le tribunal doit mettre en balance tous les facteurs favorables à une décision d'usage « loyal », y compris le fait que la bibliothèque d'Internet Archive soit « non commerciale, sert les missions importantes des bibliothèques reconnues depuis longtemps par le Congrès, et ne cause pas de préjudice au marché ».

Or, les éditeurs, « dont les profits sont en hausse », auraient jusqu'à ce jour « eu du mal à prouver que le marché était lésé », tandis qu'Internet Archive a de son côté présenté de nombreux avis d'experts montrant que le prêt numérique de l'AI n'avait pas d'incidence négative sur les licences d'ebooks.

« Le dossier regorge d'exemples où Internet Archive a facilité l'accès à des livres nécessaires à l'enseignement et à la recherche universitaire, ce qui n'aurait pas été possible autrement », souligne le mémoire de l'ONG.

Internet Archive espère que la cour d'appel reconnaîtra que les licences des éditeurs pour les livres électroniques « constituent un marché distinct » du prêt numérique contrôlé par l'ONG, « qui sert un objectif différent de celui des livres électroniques », avance le plaidoyer :

« Les licences des éditeurs ne peuvent pas servir les missions des bibliothèques telles que la préservation des collections permanentes, l'élargissement de la portée et des ressources par le biais des prêts entre bibliothèques et la protection de la vie privée des utilisateurs. »

Internet Archive rappelle que sa « bibliothèque ouverte » est utilisée à des fins d'enseignement, de recherche et d'accès au savoir et à la connaissance, et que la confirmation de la décision du tribunal « nuirait à de nombreuses autres bibliothèques et aux publics qu'elles desservent ».

Permettre à ces lecteurs de poursuivre leurs lectures

Dans sa lettre ouverte, le directeur des services de bibliothèque à Internet Archive rétorque qu' « en faisant appel de la décision du tribunal de district, notre objectif est simplement de permettre à ces lecteurs de poursuivre leurs lectures » :

« Nous imaginons un monde dans lequel les wikipédiens peuvent vérifier les faits en suivant les citations d'informations contenues uniquement dans notre histoire imprimée ; où les bibliothèques peuvent servir leurs communautés en ligne avec des collections financées par l'investissement public ; et surtout, où les usagers des bibliothèques sont libres de lire sans craindre la surveillance des entreprises ou des gouvernements. »

Internet Archive a en effet collecté de nombreux témoignages de lecteurs frustrés de ce retrait des plus de 500 000 livres électroniques, parce qu' « aucun des livres que je recherche n'est disponible à l'achat dans mon pays », déplorent des lecteurs vivant en Russie et dans des pays non occidentaux, ou parce qu'ils vivent dans des contrées rurales, ou pays pauvres, ne bénéficiant même pas de bibliothèques :

« Poppy, Indonésie : La plupart des ouvrages que j'ai consultés sur Internet Archive sont ceux que je ne pouvais pas trouver dans la bibliothèque de ma ville, qu'elle soit publique ou universitaire. Sans Internet Archive, mes progrès scolaires auraient été interrompus.

Jefferson C., Managua, Nicaragua : Internet Archive m'a fourni tout ce dont j'avais besoin pour mes études universitaires, alors que je ne disposais d'AUCUNE bibliothèque dans mon pays d'origine et que les livres universitaires coûtaient des centaines de dollars en plus des frais d'importation et des taxes (qui, à eux seuls, pourraient représenter le salaire d'une personne dans ce pays). »

Une Polonaise explique n'avoir « ni l'argent ni la possibilité d'acheter des livres papiers ou électroniques et, bien qu'il y ait une bibliothèque à proximité, elle n'a généralement pas les livres que nous recherchons ». Une personne souffrant d'une maladie chronique remercie l'Archive de lui permettre de lire des livres alors qu'elle ne peut pas se rendre en bibliothèque.

Une lectrice, vivant, elle aussi, aux États-Unis, évoque « une question d'accès : il est beaucoup plus difficile de trouver les livres qui m'intéressent. Même pour les livres les plus courants, les bibliothèques de ma région sont difficilement accessibles autrement qu'en voiture, et j'ai beaucoup d'amis qui n'ont pas facilement accès à une voiture ». D'autres se plaignent de voir ainsi disparaître l'accès à des livres qui, sinon, ne sont disponibles que dans des bibliothèques universitaires, auxquelles ils n'ont pas accès.

« Mon travail aurait été impossible sans l'Archive »

Des contributeurs de Wikipedia précisent qu'ils s'en servaient pour vérifier ou rajouter des citations et informations afin d'améliorer la qualité de l'encyclopédie participative : « chaque affirmation factuelle est accompagnée d'une note de bas de page, et le lecteur peut cliquer sur l'hyperlien dans la note de bas de page pour aller directement à la source de l'information dans un livre d'Internet Archive (souvent un livre académique ancien qui n'est plus imprimé ou qui n'est de toute façon plus disponible dans les bibliothèques publiques) ».

Une ancienne écolière nord-américaine remercie de son côté Internet Archive pour lui avoir permis de lire des livres « considérés comme interdits (comme Gatsby le magnifique) » que son école voulait qu'elle lise « pour en apprendre davantage sur la culture et l'histoire de l'époque ».

« Je comprends que les éditeurs et les auteurs doivent faire des bénéfices, mais la plupart des documents auxquels j'essaie d'accéder ont été écrits par des personnes qui sont mortes et dont les éditeurs ont cessé d'imprimer les ouvrages », déplore un autre lecteur américain.

« Cette zone grise de livres encore sous copyright mais qui ont disparu des librairies et des bibliothèques peut être très utile… et le DRM sur les copies numériques était très intelligent et juste », précise un lecteur parisien. Une Néerlandaise explique qu'elle adore lire des livres en anglais, mais que les bibliothèques auxquelles elle a accès n'en proposent quasiment pas, contrairement à Internet Archive.

« Internet Archive me permet de rechercher un grand nombre de livres par mot-clé/nom et m'a incitée à acheter de nombreuses copies papier de livres dont je n'aurais même jamais soupçonné l'existence », explique une Britannique effectuant des recherches sur l'histoire du lesbianisme, « un domaine de niche extrêmement difficile à étudier ».

Une rédactrice en chef explique aussi qu'elle s'en servait pour accéder aux livres cités par ses rédacteurs, effectuer des recherches pour ses articles, vérifier citations et autres informations. Une artiste et auteur de jeux vidéo précise qu'elle doit souvent faire des recherches sur des sujets très divers, « sans soutien institutionnel ni ressources de studio », et qu'elle n'y parviendrait pas sans l'aide d'Internet Archive.

Un Américain, qui avait fait don de sa bibliothèque personnelle d'environ 700 livres afin que ceux « qui n'avaient pas encore été scannés soient accessibles au reste du monde », et pouvoir s'y référer, déplore de son côté de ne plus pouvoir accéder aux livres qu'il avait pourtant bel et bien achetés.

Plusieurs étudiants se plaignent de ne plus avoir accès à des ouvrages sur lesquels ils travaillaient dans le cadre de leurs recherches, ou que les liens et notes de bas de pages qui renvoyaient à la bibliothèque d'Internet Archive sont désormais cassés, et que cela entrave leurs études.

Des chercheurs déplorent la disparition de livres qui n'étaient plus disponibles depuis des années, sauf sur Internet Archive, quand d'autres la remercient de leur avoir facilité, voire permis, d'aboutir dans leurs recherches : « en tant qu'autrice d'un livre, d'une thèse de doctorat, et d'un grand nombre d'articles et de chapitres, je peux dire que mon travail aurait été impossible sans l'Archive », explique une certaine Ana L., de Paris.

L'ONG, qui peut continuer à numériser des livres à des fins de conservation, prêter des livres épuisés ou relevant du domaine public, explique à Ars Technica qu'il faudra « des mois, voire plus d'un an », avant qu'une décision ne soit prise dans cette affaire.

Commentaires (11)

Vous devez être abonné pour pouvoir commenter.

Abonnez-vous
votre avatar
De mémoire, et pour bien comprendre le fond de l'histoire, il me semble qu'Internet Archive avait mis à disposition les ouvrages durant la période COVID en faisant sauter les restrictions (ce qui n'a pas beaucoup plus aux éditeurs, bien évidemment).

Ensuite, ne pas oublier non plus que la porté géographique de l'Internet Archive est mondiale, tandis que la bibliothèque du coin n'a qu'un rayon d'action limité.

Je ne me prononce pas pour, ni contre. A mes yeux il y a des problèmes des deux côtés. C'est juste pour soulever que le problème ne se résume pas aux gentils d'un côté, les méchants éditeurs de l'autre.
votre avatar
Bah, de toutes façons, il vaudrait mieux graver tout sur des tablettes minérales si on veut que d'éventuels xénoarchéologistes venus d'ailleurs aient une chance de comprendre notre culture. S'ils doivent commencer par reconstruire un DHCP, ils vont vraiment nous prendre pour des sauvages.
votre avatar
bah rien de nouveau, le profit au détriment de la culture...
votre avatar
Ici, il s'agit plus de connaissance que de culture. On parle de livres universitaires, pas de romans.
votre avatar
Où as-tu vu cela ? (pas de romans)

500 000 livres uniquement universitaires, ça m'étonnerait fortement.
votre avatar
:censored:
D'ailleurs oujours étonné que les éditeurs et autres ayant droit ne soient jamais monté au front contre apprentissages des IA, combien touchent-ils ?
votre avatar
Il y a eu des takedown sur HuggingFace de dataset contenant des livres qui ne sont pas dans le domaine public. Exemple avec the_pile_books3.

Mais ça c'est quand les dataset sont publics. Comme la plupart des entreprises de l'IA ont des dataset privés, le seul moyen de le démontrer c'est par procédure. Cf le New York Times en ce moment par exemple.

Mais en cherchant rapidement, on voit que c'est Common Crawl qui fait l'objet de plaintes.
votre avatar
Ils devraient se délocaliser en France, le prix du livre est fixe (imprimé dessus), avec interdiction de vendre plus cher :
culture.gouv.fr République Française

Du coup les ebooks à $1300 c'est impossible en France ?
votre avatar
Du coup les ebooks à $1300 c'est impossible en France ?
Cela reste possible.

Il suffit de publier à compte d'auteur, voire de faire uniquement en ebook et tu restes libre de fixer son prix.

C'est même l'une des arnaques à fuir avec les maisons d'édition à compte d'auteur qui font croire qu'elles publient à compte d'éditeur, alors qu'elles ne sont qu'un service de publication. Comme l'auteur paye pour être publié (ce qui n'est pas le cas à compte d'éditeur), il y en a qui n'ont pas de scrupules pour mettre le livre à un prix délirant invendable type 17.99€ pour un ebook et 50 pour le papier. Cela ne les engage à rien puisqu'ils sont payés par l'auteur. Les éventuelles ventes sont du bonus.
votre avatar
En France aussi, les bibliothèques paient plus cher, mais pas autant. Voir ici, par exemple, difficile de trouver un autre article, avec prix, livre et bibliothèque, je tombe beaucoup sur des prix littéraires. :D
votre avatar

Internet Archive retire plus de 500 000 livres de sa bibliothèque sous la pression des éditeurs

  • « Laissez les lecteurs lire »

  • La version numérique d’un livre de 30 dollars facturée 1 300 dollars

  • Les bibliothèques, un « bien commun »

  • Permettre à ces lecteurs de poursuivre leurs lectures

  • « Mon travail aurait été impossible sans l’Archive »

Fermer