Internet Archive lance son extension Chrome pour retrouver les pages web introuvables
Y compris en cas de censure légale
Le 16 janvier 2017 à 07h50
2 min
Internet
Internet
Internet Archive lance son extension Chrome afin de proposer une alternative pour certains liens cassés sur Internet. En cas d'erreur 404 (et bien d'autres codes), elle va chercher une sauvegarde dans la Wayback Machine afin de la proposer à l'internaute.
En août de l'année dernière, Mozilla lançait un nouveau Test Pilot pour Firefox avec No More 404 s. Le principe est simple : lorsque vous tombez sur une erreur 404, ce qui signifie que la page demandée n'existe pas ou plus, cet outil va piocher dans la Wayback Machine du site Archive.org afin d'en trouver une version sauvegardée, si elle existe bien évidemment.
Mais Firefox n'est pas le seul et il existe déjà de nombreuses alternatives du genre, que ce soit via la base de données d'Internet Archive ou bien via le cache de Google par exemple. Aujourd'hui, c'est au tour d'Internet Archive de lancer son extension officielle pour Chrome.
Une recherche automatisée dans la Wayback Machine
Elle « détecte les codes d'erreur 404, 408, 410, 451, 500, 502, 503, 504, 509, 520, 521, 523, 524, 525 et 526, et elle vérifie alors si une version archivée de l'URL demandée est disponible dans la machine Wayback » explique Internet Archive. Le cas échéant, l'extension affiche alors un message afin d'informer l'utilisateur, en lui laissant la possibilité de consulter cette copie archivée.
Les codes d'erreur HTTP ciblés sont relativement larges puisque cela va de l'incontournable 404 ou récent 451 pour la censure en ligne, en passant par les 52x qui sont des codes étendus pour Cloudflare. Pour rappel, la liste complète des codes HTTP et de leur signification est disponible par ici.
La question de la confidentialité et de l'historique de navigation
Sur son blog, Internet Archive indique que « la confidentialité de nos utilisateurs est d'une importance cruciale » et ajoute que « nous essayons de ne pas enregistrer d'adresses IP ». L'organisme à but non lucratif affirme au passage que l'utilisation de cette extension « n'exposera pas votre historique de navigation ». Il travaille également avec Google afin d'ajouter une couche de protection supplémentaire via un serveur proxy.
Actuellement, Internet Archive revendique avoir sauvegardé plus 279 milliards de pages web différentes provenant de plus de 361 millions de sites, ce qui représente plus de 15 Po de stockage.
Internet Archive lance son extension Chrome pour retrouver les pages web introuvables
-
Une recherche automatisée dans la Wayback Machine
-
La question de la confidentialité et de l'historique de navigation
Commentaires (7)
Vous devez être abonné pour pouvoir commenter.
Déjà abonné ? Se connecter
Abonnez-vousLe 16/01/2017 à 08h08
Une extension qui pourrait consommer en ressources en cas de 404 intenpestifs, c’est pratique mais en utilisation nomade ça doit être moyen de charger en ajax + afficher la page la plus récente existante..
Le 16/01/2017 à 09h41
L’idée est pas mal, ca a permettre à pa mal de monde d’accéder aux infos censurées.
Les “pirates” vont pouvoir retourner sur zone téléchargement " />
Le 16/01/2017 à 12h36
Sur Firefox cela existe depuis longtemps :https://addons.mozilla.org/fr/firefox/addon/get-archive/
Le 16/01/2017 à 12h51
Il y a surtout un testpilot spécifique pour les 404, j’pense même qu’il y avait eu une news sur NXi à ce propos.
Le 16/01/2017 à 14h54
Oui, elle est même indiquée dans le premier lien du 1er paragraphe de l’actu " />
Le 16/01/2017 à 15h31
j’ai lu moins qu’en diagonale " />
Le 16/01/2017 à 22h56
Ok, mais perso je préfère l’aspect manuel, “oh tiens, 404, ce n’était pas le cas avant, voyons voir… clic droit -> Get Archive.org”. En plus y’a des 404 rigolotes ou utiles (sans même parler des autres erreurs). Mais bon, pour la fameuse Mme Michu ça peut le faire.