Connexion
Abonnez-vous

Wikipédia : 9 millions de liens cassés renvoient vers l’Internet Archive

Wikipédia : 9 millions de liens cassés renvoient vers l'Internet Archive

Le 03 octobre 2018 à 09h45

Ces pages disparues reviennent via la Wayback Machine. Dans un billet de blog, l'Internet Archive déclare avoir référencé tous les liens de 300 versions de Wikipédia pendant plus de cinq ans, soit 20 millions d'URL par semaine.

Ils ont été ajoutés à chaque arrivée ou changement. En parallèle, pendant trois ans, l'outil IABot a parcouru 22 éditions de Wikipédia en quête de liens morts, pour les remplacer par une version archivée.

6 millions de liens ont été revus de la sorte, en plus de 3 millions modifiés à la main par des wikipédiens.

Selon un projet de recherche de la fondation Wikimedia, sur dix jours, 25 000 clics quotidiens renvoyaient vers la Wayback Machine. Soit trois fois plus que le second site externe le plus populaire, Google Books.

Pour mémoire, l'Internet Archive est une fondation avec une mission simple : archiver toutes les pages web du monde, en fournissant des instantanés réguliers.

Le 03 octobre 2018 à 09h45

Commentaires (1)

Vous devez être abonné pour pouvoir commenter.

Abonnez-vous
votre avatar

Je ne sait pas si c’est actif sur la Wikipédia FR, mais je n’avais jamais été convaincu de l’outil Wikiwix :



fr.wikipedia.org Wikipedia:Prise_de_d%C3%A9cision/Syst%C3%A8me_de_cache



Maintenant faut mettre en place un bot qui fait une requête vers Internet Archive quand un lien est créé sur Wikipédia, pour éviter d’avoir des versions avec trop d’écart.

Wikipédia : 9 millions de liens cassés renvoient vers l’Internet Archive

Fermer