Wikipédia : 9 millions de liens cassés renvoient vers l’Internet Archive

Le 03 octobre 2018 à 09h45
1 min
Internet
Internet
Ces pages disparues reviennent via la Wayback Machine. Dans un billet de blog, l'Internet Archive déclare avoir référencé tous les liens de 300 versions de Wikipédia pendant plus de cinq ans, soit 20 millions d'URL par semaine.
Ils ont été ajoutés à chaque arrivée ou changement. En parallèle, pendant trois ans, l'outil IABot a parcouru 22 éditions de Wikipédia en quête de liens morts, pour les remplacer par une version archivée.
6 millions de liens ont été revus de la sorte, en plus de 3 millions modifiés à la main par des wikipédiens.
Selon un projet de recherche de la fondation Wikimedia, sur dix jours, 25 000 clics quotidiens renvoyaient vers la Wayback Machine. Soit trois fois plus que le second site externe le plus populaire, Google Books.
Pour mémoire, l'Internet Archive est une fondation avec une mission simple : archiver toutes les pages web du monde, en fournissant des instantanés réguliers.
Le 03 octobre 2018 à 09h45
Commentaires (1)
Abonnez-vous pour prendre part au débat
Déjà abonné ? Se connecter
Cet article est en accès libre, mais il est le fruit du travail d'une rédaction qui ne travaille que pour ses lecteurs, sur un média sans pub et sans tracker. Soutenez le journalisme tech de qualité en vous abonnant.
Accédez en illimité aux articles
Profitez d’un média expert et unique
Intégrez la communauté et prenez part aux débats
Partagez des articles premium à vos contacts
Abonnez-vousLe 03/10/2018 à 10h38
Je ne sait pas si c’est actif sur la Wikipédia FR, mais je n’avais jamais été convaincu de l’outil Wikiwix :
Wikipedia:Prise_de_d%C3%A9cision/Syst%C3%A8me_de_cache
Maintenant faut mettre en place un bot qui fait une requête vers Internet Archive quand un lien est créé sur Wikipédia, pour éviter d’avoir des versions avec trop d’écart.