Internet Archive met 2,6 millions d’images du domaine public sur Flickr

Internet Archive met 2,6 millions d’images du domaine public sur Flickr

Sage comme une image

Avatar de l'auteur

Xavier Berne

Publié dansInternet

01/09/2014
14
Internet Archive met 2,6 millions d’images du domaine public sur Flickr

Plus de deux millions d’images libres de droits viennent d’être mises en ligne sur Flickr par Internet Archive, une organisation coutumière de ce type de partage. Fruit d’un partenariat avec Yahoo, qui détient la célèbre plateforme d’images, cette initiative repose sur l’extraction et la mise en valeur de photos, de croquis ou de dessins issus de livres remontant pour certains à plusieurs siècles. 

Déjà connue pour permettre le téléchargement gratuit (et légal) de centaines de milliers de films, de concerts, de livres numériques ou bien encore d’émissions de radio, l’association américaine Internet Archive continue d’œuvrer en faveur d’une large diffusion de la culture. L’organisation américaine a en effet annoncé vendredi la mise en ligne, sur un compte Flickr dédié, de 2,6 millions d’images libres de droits.

 

Toutes ces images sont extraites de livres appartenant au domaine public, et dont la numérisation a été effectuée par Internet Archive. Il s’agit donc de photos, mais également de dessins, de cartes, de croquis,... dont certains datent de plus de 500 ans. On retrouve également des illustrations plus récentes, jusqu'aux années 1920 notamment. Cette collection a vocation à s’agrandir, puisque 14 millions d’images devraient au total être extraites à partir de 2 millions de livres.

Des images et leurs métadonnées

La particularité de cette initiative ? Les images mises en ligne sur Flickr sont accompagnées de précieuses métadonnées qui permettent de les retrouver et les resituer plus facilement. Les personnes à l’origine du projet, menées par Kalev Leetaru de l’Université de Georgetown, sont en effet arrivées à extraire les 500 mots précédant et succédant chaque image. Ces bouts de texte peuvent être consultés directement depuis la page Flickr de l’image, à partir de laquelle il est également possible d’accéder au livre d’origine, en version numérisée.

 

 

« Pendant toutes ces années, toutes les bibliothèques ont numérisé des livres pour les proposer au format PDF ou sous forme de fichiers pour lesquels il était possible de faire une recherche au sein du texte. Ils ont vu les livres comme une collection de mots. Nous avons inversé ça » a expliqué Kalev Leetaru à la BBC. « En parcourant un demi-millénaire, il est fascinant de voir cet éventail d’images et la façon dont les représentations ont changé au fil du temps. »

Internet Archive prévoit de mettre 14 millions d'images à disposition du public

À plus long terme, cette initiative pourrait être reprise par d’autres structures, à commencer par des bibliothèques publiques. C’est en tout cas le souhait de Kalev Leetaru, qui aimerait que cette galerie d’images puisse « grandir constamment » au niveau mondial. Il se dit même prêt à mettre à disposition son programme permettant d’extraire de manière automatisée les mots accompagnants les illustrations.

14
Avatar de l'auteur

Écrit par Xavier Berne

Tiens, en parlant de ça :

#Flock a sa propre vision de l’inclusion

Retour à l’envoyeur

13:39 Flock 15
Un Sébastien transformé en lapin par Flock pour imiter le Quoi de neuf Docteur des Looney Tunes

Quoi de neuf à la rédac’ #10 : nous contacter et résumé de la semaine

On est déjà à la V2 de Next ?

11:55 21
Autoportrait Sébastien

[Autoportrait] Sébastien Gavois : tribulations d’un pigiste devenu rédac’ chef

Me voilà à poil sur Internet

17:18 Next 16

Sommaire de l'article

Introduction

Des images et leurs métadonnées

Internet Archive prévoit de mettre 14 millions d'images à disposition du public

#Flock a sa propre vision de l’inclusion

Flock 15
Un Sébastien transformé en lapin par Flock pour imiter le Quoi de neuf Docteur des Looney Tunes

Quoi de neuf à la rédac’ #10 : nous contacter et résumé de la semaine

21
Autoportrait Sébastien

[Autoportrait] Sébastien Gavois : tribulations d’un pigiste devenu rédac’ chef

Next 16
Logo de StreetPress

Pourquoi le site du média StreetPress a été momentanément inaccessible

Droit 13
Amazon re:Invent

re:Invent 2023 : Amazon lance son assistant Q et plusieurs services IA, dont la génération d’images

IA 10
Un œil symbolisant l'Union européenne, et les dissensions et problèmes afférents

Le Conseil de l’UE tire un bilan du RGPD, les États membres réclament des « outils pratiques »

Droit 4

19 associations européennes de consommateurs portent plainte contre Meta

DroitSocials 14

#LeBrief : Ariane 6 l’été prochain, Nextcloud rachète Roundcube, désinformation via la pub

Chiffre et formules mathématiques sur un tableau

CVSS 4.0 : dur, dur, d’être un expert !

Sécu 11
Une tête de fusée siglée Starlink.

Starlink accessible à Gaza sous contrôle de l’administration israélienne

Web 34
Fibre optique

G-PON, XGS-PON et 50G-PON : jusqu’à 50 Gb/s en fibre optique

HardWeb 51
Photo d'un immeuble troué de part en part

Règlement sur la cyber-résilience : les instances européennes en passe de conclure un accord

DroitSécu 10
lexique IA parodie

AGI, GPAI, modèles de fondation… de quoi on parle ?

IA 10

#LeBrief : logiciels libres scientifiques, fermeture de compte Google, « fabriquer » des femmes pour l’inclusion

livre dématérialisé

Des chercheurs ont élaboré une technique d’extraction des données d’entrainement de ChatGPT

IAScience 3
Un chien avec des lunettes apprend sur une tablette

Devenir expert en sécurité informatique en 3 clics

Sécu 11
Logo ownCloud

ownCloud : faille béante dans les déploiements conteneurisés utilisant graphapi

Sécu 16
Le SoC Graviton4 d’Amazon AWS posé sur une table

Amazon re:invent : SoC Graviton4 (Arm), instance R8g et Trainium2 pour l’IA

Hard 12
Logo Comcybergend

Guéguerre des polices dans le cyber (OFAC et ComCyberMi)

Sécu 10

#LeBrief : faille 0-day dans Chrome, smartphones à Hong Kong, 25 ans de la Dreamcast

Mur d’OVHcloud à Roubaix, avec le logo OVHcloud

OVHcloud Summit 2023 : SecNumCloud, IA et Local Zones

HardWeb 2
algorithmes de la CAF

Transparence, discriminations : les questions soulevées par l’algorithme de la CAF

IASociété 62

Plainte contre l’alternative paiement ou publicité comportementale de Meta

DroitIA 38
Nuage (pour le cloud) avec de la foudre

Économie de la donnée et services de cloud : l’Arcep renforce ses troupes

DroitWeb 0
De vieux ciseaux posés sur une surface en bois

Plus de 60 % des demandes de suppression reçues par Google émanent de Russie

Société 7
Une vieille boussole posée sur un plan en bois

La Commission européenne et Google proposent deux bases de données de fact-checks

DroitWeb 3

#LeBrief : des fichiers Google Drive disparaissent, FreeBSD 14, caméras camouflées, OnePlus 12

Le poing Dev – round 6

Next 151

Produits dangereux sur le web : nouvelles obligations en vue pour les marketplaces

Droit 9
consommation de l'ia

Usages et frugalité : quelle place pour les IA dans la société de demain ?

IA 12

La NASA établit une liaison laser à 16 millions de km, les essais continuent

Science 17
Concept de CPU

Semi-conducteurs : un important accord entre l’Europe et l’Inde

Hard 7

#LeBrief : PS5 Slim en France, Valeo porte plainte contre NVIDIA, pertes publicitaires X/Twitter

next n'a pas de brief le week-end

Le Brief ne travaille pas le week-end.
C'est dur, mais c'est comme ça.
Allez donc dans une forêt lointaine,
Éloignez-vous de ce clavier pour une fois !

Commentaires (14)


NonMais
Il y a 9 ans

Houla, mais Pascal Rogard déteste ça!! Et la propriété intellectuelle? Et les redevances?


« chaque internaute peut devenir diffuseur et dès lors qu’il devient diffuseur, il porte atteinte naturellement aux droits de propriété intellectuelle »


Alors si on balance des millions d’images sans droits, où va-t-on? Faut arrêter de spolier les ayants droit et les établissements de perception!


FRANCKYIV
Il y a 9 ans

Le selfie du singe y est ?!?!? <img data-src=" />


FRANCKYIV
Il y a 9 ans

&gt;où va-t-on?

:dtc: mon cher … :dtc: … <img data-src=" />


Oliewan Abonné
Il y a 9 ans

Excellente initiative !


Commentaire_supprime
Il y a 9 ans






Oliewan a écrit :

Excellente initiative !



+1 !

Je cherche des plans de gares anglaises, je pense que j’ai une chance de trouver mon bonheur avec ceci.



Pwney
Il y a 9 ans

Yes, le pâté que ça envoie, c’est trop bien !
Il faut quand même dire que le site d’IA, c’est quand même pas génial pour trouver le contenu qu’on veut en terme d’images, c’est pas aussi intuitif que flickr.


Pwney
Il y a 9 ans






Commentaire_supprime a écrit :

+1 !

Je cherche des plans de gares anglaises, je pense que j’ai une chance de trouver mon bonheur avec ceci.


Si tu n’y trouves pas ton bonheur, va voir les forums de modélisme (peut-être viens-tu de ce domaine), des gens t’aideront sûrement.



Commentaire_supprime
Il y a 9 ans






Pwney a écrit :

Si tu n’y trouves pas ton bonheur, va voir les forums de modélisme (peut-être viens-tu de ce domaine), des gens t’aideront sûrement.



J’y pense. Pour l’instant, je suis inscrit sur un forum français, je verrais pour un forum anglais quand j’aurais le temps. Pour cause de répétitions de théâtre, je suis très pris en ce moment.



Pwney
Il y a 9 ans






Commentaire_supprime a écrit :

J’y pense. Pour l’instant, je suis inscrit sur un forum français, je verrais pour un forum anglais quand j’aurais le temps. Pour cause de répétitions de théâtre, je suis très pris en ce moment.


J’ai vu tes messages dessus, ça m’a permis de découvrir MyCube, c’est un peu ce dont je rêvais (mais à base d’Arduino), merci de m’avoir fait découvrir ça, même si c’est totalement fortuit !



Bicounet
Il y a 9 ans

C’est à la mode les photos qui tombent dans le domaine public en ce moment <img data-src=" />


Pwney
Il y a 9 ans

Elles ne tombent pas, elles s’élèvent dans le domaine public !<img data-src=" />


Bixou Abonné
Il y a 9 ans

La belle initiative <img data-src=" />


Jarodd Abonné
Il y a 9 ans

J’applaudis <img data-src=" />

Même si j’aurais préféré le choix de Wiki Commons…


zefling Abonné
Il y a 9 ans






Pwney a écrit :

Elles ne tombent pas, elles s’élèvent dans le domaine public !<img data-src=" />



+1