Wikipédia : 9 millions de liens cassés renvoient vers l’Internet Archive
Le 03 octobre 2018 à 09h45
1 min
Internet
Internet
Ces pages disparues reviennent via la Wayback Machine. Dans un billet de blog, l'Internet Archive déclare avoir référencé tous les liens de 300 versions de Wikipédia pendant plus de cinq ans, soit 20 millions d'URL par semaine.
Ils ont été ajoutés à chaque arrivée ou changement. En parallèle, pendant trois ans, l'outil IABot a parcouru 22 éditions de Wikipédia en quête de liens morts, pour les remplacer par une version archivée.
6 millions de liens ont été revus de la sorte, en plus de 3 millions modifiés à la main par des wikipédiens.
Selon un projet de recherche de la fondation Wikimedia, sur dix jours, 25 000 clics quotidiens renvoyaient vers la Wayback Machine. Soit trois fois plus que le second site externe le plus populaire, Google Books.
Pour mémoire, l'Internet Archive est une fondation avec une mission simple : archiver toutes les pages web du monde, en fournissant des instantanés réguliers.
Le 03 octobre 2018 à 09h45
Commentaires (1)
Vous devez être abonné pour pouvoir commenter.
Déjà abonné ? Se connecter
Abonnez-vousLe 03/10/2018 à 10h38
Je ne sait pas si c’est actif sur la Wikipédia FR, mais je n’avais jamais été convaincu de l’outil Wikiwix :
Wikipedia:Prise_de_d%C3%A9cision/Syst%C3%A8me_de_cache
Maintenant faut mettre en place un bot qui fait une requête vers Internet Archive quand un lien est créé sur Wikipédia, pour éviter d’avoir des versions avec trop d’écart.