No More 404 s : en cas d’erreur 404, Firefox va piocher dans la base d’Internet Archive
Bientôt un No More451 s ?
Le 05 août 2016 à 09h30
2 min
Logiciel
Logiciel
Le programme Test Pilot de Firefox propose une nouvelle fonctionnalité intéressante : No More 404 s. Elle permet d'aller piocher dans les pages enregistrées par Internet Archive lorsqu'une URL retourne une erreur 404.
En mai de cette année, Mozilla lançait son programme Test Pilot pour Firefox. Via une extension à installer sur le navigateur, n'importe quel utilisateur peut ainsi accéder et tester de nouvelles fonctionnalités. Elles étaient au nombre de trois lors du lancement et une nouvelle vient d'arriver : No More 404 s.
Comme son nom l'indique, elle vous vient en aide lorsque vous tombez sur une erreur 404 durant votre navigation, ce qui signifie que la page demandée n'existe pas, ou plus. Pour cela, la fondation exploite la « Wayback Machine » de Internet Archive, une sorte de machine à voyager dans le temps d'Internet. Elle dispose actuellement d'une base de près de 500 milliards de pages sauvegardées à différentes périodes.
Ainsi, lorsque vous rencontrez une 404, le navigateur vous proposera de consulter une version sauvegardée, si elle est disponible bien évidemment. Cela prendra la forme d'un petit bandeau qui s'affiche en haut de la page :
Pour activer cette fonctionnalité, il faudra donc installer l'extension Test Pilot de Firefox (qui se télécharge depuis le site de Firefox et qui demande donc une validation supplémentaire à l'installation), puis vous rendre avec le navigateur de Mozilla sur cette page afin d'activer No More 404 s. Notez que pour la désactiver, c'est au même endroit que cela se passe. Un dépôt GitHub est également disponible ici avec des ressources supplémentaires.
Pour rappel, le navigateur Chrome propose une fonctionnalité assez proche, mais qui se base sur le cache de Google cette fois-ci. Pour accéder à la version sauvegardée d'une page web sur les serveurs du géant du Net, il suffit d'ajouter « cache: » dans la barre d'adresse, juste avant l'URL.
Commentaires (101)
Vous devez être abonné pour pouvoir commenter.
Déjà abonné ? Se connecter
Abonnez-vousLe 05/08/2016 à 09h31
Je sens que ça va être un cauchemar pour les développeurs web et pour les helpdesk…
Le 05/08/2016 à 09h33
Je pense que c’est vraiment une mauvaise idee… Une 404 doit rester une 404. Le navigateur n’a pas à aller recuperer du contenu je-sais-pas-ou pour combler les trous.
Le 05/08/2016 à 09h34
WTF.
Heureusement que ce n’est pas activé par défaut…
Le 05/08/2016 à 09h36
Oui, ça va faire péter les logs d’erreurs 404 vu que ces pages contiendront des liens périmés vers des erreurs 404…
C’est les Webmaster Tools qui vont être content !
Le 05/08/2016 à 09h43
Ce serait pas mal que les navigateurs ne viennent pas interférer avec le contenu ou la structure des sites.
Ils n’ont qu’à rediriger les noms de domaines non déposés vers d’autres tant qu’on y est…
Le 05/08/2016 à 09h43
Hmmm…
Ça ne me paraît pas être une mauvaise idée dans certains cas. Vu le fonctionnement, l’erreur 404 sortira toujours, mais FF proposera une version archivée… Ce qui me semble respectueux des responsables du site.
Il ne remplace pas la page par la version archivée, il suggère une version archivée quand le machin renvoie une erreur 404. Où est le problème avec ça?
C’est surtout sur les vieux posts de forums, qui vont poster le lien vers des articles, des tests, des objets en vente ou autres. Il suffit d’un remaniement du site cible ou qu’un objet ne soit plus vendu pour qu’au final le lien soit mort, et c’est toujours une plaie à retrouver. Cela règle ce souci de manière assez élégante, je trouve.
Le 05/08/2016 à 09h43
Pareil, si j’ai une page en 404, c’est pour une bonne raison (enfin normalement " /> ) !
Le 05/08/2016 à 09h45
Donc on pourrait tomber sur de vieux formulaires d’inscription ?
Étrange ^^
Le 05/08/2016 à 09h47
Pareil, je comprends pas trop la logique. Ce qui serait bien par contre c’est pour les erreurs 5xx ou quand l’ensemble du site est down (comme le fait cloudflare par exemple).
Le 05/08/2016 à 10h06
Le 05/08/2016 à 10h07
Le 05/08/2016 à 10h09
Le 05/08/2016 à 10h09
Et :
“ Ce serait pas mal que les navigateurs ne viennent pas interférer avec le contenu ou la structure des sites. ”
C’était aussi du second degré, ou simplement à côté de la plaque ?
Le 05/08/2016 à 10h12
Ou le No More493 " />
Oui, c’est dans une nouvelle RFC.
Le 05/08/2016 à 10h13
Il faudrait faire passer un petit QCM sur l’article qu’on devrait passer avec un 10⁄10 avant de pouvoir commenter " />
Le 05/08/2016 à 10h14
Ou faire une sorte de captcha, un truc glissé dans l’article et une question posée dessus pour pouvoir envoyer le formulaire.
Le 05/08/2016 à 10h14
Et sinon, il existait déjà l’extension Resurrect Pages.
Le 05/08/2016 à 10h15
Le 05/08/2016 à 10h16
Je prefere largement ça:
http://www.nextinpact.com/erreur-404?aspxerrorpath=/Error/Execute404
;)
Le 05/08/2016 à 10h20
" />
Dans la mesure où j’ai repensé le truc, je trouve que l’idée n’est pas si mauvaise " />
Tout se jouera dans la manière dont l’utilisateur est informé de ce qu’il est en train de faire, non ?
Le 05/08/2016 à 10h21
Le 05/08/2016 à 10h23
Je trouve l’idée intéressante, mais j’aime pas trop le fait qu’il vérifie automatiquement si l’url en 404 existe sur archive.org.
Le 05/08/2016 à 10h24
Le 05/08/2016 à 10h25
Le 05/08/2016 à 10h25
Tant que cela reste une extension qui s’installe pourquoi pas. Les gens peuvent être curieux par nature. Mais s’il vous plait pas d’Opt-In / Opt-out comme config de base de FF.
Et oui je n’aimerai pas qu’un utilisateur de FF par la suite (oui j’ai lus l’article merci :p ) se retrouve par défaut avec un bandeau sur les pages 404 vers Archives.org . Le but d’une page 404 étant à la base de donner l’information au moteur que la page n’existe plus, c’est qu’il y a une bonne raison. Si il n’y a pas eu de redirections (301, etc ….) c’est que la page n’existe plus et n’a pas vocation à exister ni à être consulté.
Et j’ai jamais beaucoup aimé ce qui redirige un internaute vers un autre site que le mien. Cela me parait assez légitime dans les faits.
Le 05/08/2016 à 11h25
Ils auraient pu embarquer une copie local d’Internet Archive pour les erreurs 503 qui risquent d’arriver " />
Le 05/08/2016 à 11h26
Chez Firefox, ils ferait mieux de s’occuper de me laisser supprimer pour raison de sécurité les extensions ou modules périmés que Firefox a désactivé pour raison de sécurité.
Enfin bon, tant qu’ils ne s’attaquent pas à l’erreur 51 et à l’erreur 1664 …" />
Le 05/08/2016 à 11h31
Wayback (et tout système similaire) s’articule comment avec le droit à l’oubli* ?
*qui, certes fonctionne à base de déréférencement des moteurs, actuellement…
Le 05/08/2016 à 11h32
pratique mais j’aurais préféré une erreur 404 avec un bandeau pour aller vers wayback machine, ça me semble plus logique que d’afficher directement la page wayback avec un bandeau
Le 05/08/2016 à 11h33
le droit à l’oubli c’est en france uniquement donc je suppose qu’ils s’en foutent comme de leur première chemise
Le 05/08/2016 à 11h39
Tu devrais le faire, ça m’aurait évité de lire tout ces commentaires de gens qui n’ont rien compris.
En tout cas, je trouve personnellement que c’est une bonne idée, le nombre de forum qui pointe vers du contenu qui n’existe plus : sites disparus, réorganisé sans faire les correspondances, etc.
Le 05/08/2016 à 11h40
Le 05/08/2016 à 11h42
Fait un commentaire sur windows pour voir. " />
Le 05/08/2016 à 11h45
C’est pas parce que tu le veux que les autres aussi. Perso, ça me fait souvent chier de chercher de la doc et de tomber sur des sites qui n’existe plus… Perso, si je l’ai mis sur le net, que j’accepte que ça soit archivé (robot.txt) j’accepte que ça persiste même si je vire, sinon je ne le mets pas en public. Après, les personnes qui iront sur archives.org sauront qu’elles sont sur page archives (avec sa date) donc potentiellement complètement obsolète.
Le 05/08/2016 à 11h45
Pour tous ceux qui ne veulent pas que leur site soit archivé par archive.org
Lire ici
Il suffit de le dire par robots.txt ou par mail.
Le 05/08/2016 à 11h46
C’est… ce… qu’ils… font !
Le 05/08/2016 à 11h50
Ah mais fais-le. Ces commentaires ne servent à rien. ^^
Le 05/08/2016 à 11h55
Le 05/08/2016 à 12h12
Les dernières news sur le jeux-vidéo sont disponibles sur http://www.inpactvirtuel.com
Edit: Ah… bah non. Ca ne marche pas. Le 404 ca n’existe déjà plus => fonction firefox inutile.
Le 05/08/2016 à 12h14
Le 05/08/2016 à 12h15
Le 05/08/2016 à 12h19
Je viens de voir le projet des devs Mozilla concernant TabCenter qui est l’une des extensions disponible via Test Pilot (cf. https://mozilla.invisionapp.com/share/GT22ZN6QW) et c’est magnifique. " />
Le 05/08/2016 à 12h20
Dans ce cas là, tu as l’erreur 410 Gone qui est faite pour.
Une 404 ne devrait jamais arriver sur un lien qui a existé, c’est de la mauvaise gestion de la part de l’administrateur.
Leur proposition se base sur la 404.
Le 05/08/2016 à 12h20
Le 05/08/2016 à 12h27
Le 05/08/2016 à 12h28
ça stocke du statique, comme d’autres le font déjà. Rien de nouveau à part la facilité d’accès.
Pour des sites ou tu recherche, c’est évident que ça ne marchera pas plus qu’avec le cache de google: il faut les données “POST”
Le 05/08/2016 à 12h30
just do it
Le 05/08/2016 à 12h36
Chiche ? " />
Le 05/08/2016 à 12h40
Le moteur de recherche tombera toujours sur une 404, pas de soucis donc. De plus, comme la 404 s’affiche bien pour l’utilisateur, elle apparait aussi dans les logs Apache du site.
Le 05/08/2016 à 12h45
Dans ce cas, c’est une 403 (Forbidden) qu’il faut mettre ou 410 (Gone).
Le 05/08/2016 à 12h52
Ca ne sert à rien, les archiveurs ne vont pas sur le site d’origine.
Le 05/08/2016 à 13h00
Le 05/08/2016 à 13h16
Bonne idée, surtout pour mettre des bâtons dans les roues de ceux qui voudrait supprimer un contenu qu’ils n’assument plus.
Le 05/08/2016 à 09h50
L’idée est bonne, mais rediriger directement l’utilisateur sans le notifier qu’une erreur est survenue sera problématique.
Il serait peut être intéressant de proposer une telle redirection sur la page qui affiche l’erreur 404, et pourquoi pas avec quelques explications au passage.
Le 05/08/2016 à 09h52
Ainsi, lorsque vous rencontrez une 404, le navigateur vous proposera de consulter une version sauvegardée, si elle est disponible bien évidemment. Cela prendra la forme d’un petit bandeau qui s’affiche en haut de la page
Le 05/08/2016 à 09h53
Vous arrêtez un peu de critiquer pour un rien. Avez-vous vraiment lu l’article ? L’erreur 404 s’affichera dans tous les cas avec le comportement par défaut (ce que dit bien l’article). Il faudra une intervention manuelle de l’utilisateur pour afficher la version sauvegardée de la page.
Le 05/08/2016 à 09h53
C’est le fonctionnement qui est documenté dans l’article et dans l’extension, non ? 404, tu vois l’erreur, et t’as un bandeau qui te propose la version wayback machine.
Le 05/08/2016 à 09h53
C’est une bonne idée si c’est bien présenté, par exemple la vraie page 404, avec une suggestion (genre une petite notification en bas, ou un bandeau) pour proposer de voir une “version archivée”. Sinon ca pourrait apporter de la confusion.
Et puis aussi j’espère qu’ils comptent donner des sous à Internet Archive !
EDIT : J’ai lu trop vite, c’est un bandeau, donc c’est très bien, il y a pas de quoi se plaindre !
Le 05/08/2016 à 09h54
Le niveau des comms…quasi zéro lecteurs de l’article complet…
Le 05/08/2016 à 09h57
La barre universelle de Test Pilot pourrait aussi être intégrée par défaut, non? C’est plus utile pour l’utilisateur en soi.
Le 05/08/2016 à 09h58
Absolument insensé, quel est le crétin qui a eu cette idée de “génie” ?
Une 404 est la pour une bonne raison. Il est vrai que de nombreux développeurs se servent très mal des codes de retour et des verbes http. Mais là, génial., ça ne veut plus rien dire autant ne plus s’en servir du tout.
Firefox, vous êtes des crétins.
Je pense que ça doit fonctionner qu’en mode application web. Sinon je peux changer de code de retour pour l’API FullRest que je développe.
Serait-il possible d’avoir un header qu’un serveur puisse désactiver cette fonctionnalité débile à distance ?
Le 05/08/2016 à 09h59
Il renvoi toujours la page d’erreur 404.
Le 05/08/2016 à 10h00
Le 05/08/2016 à 10h01
Le 05/08/2016 à 10h03
Voilà qui ne va pas contribuer à accélérer archive.org…
Le 05/08/2016 à 10h04
Ouais, c’est fou. Je sais qu’on est vendredi mais bon il y a des limites. Et puis ça commence à me faire chier les FUD sur Firefox.
Le 05/08/2016 à 10h04
" />
Le 05/08/2016 à 10h05
Il y a visiblement beaucoup de gens qui n’ont pas lu l’article " />
Je suis presque tenté par un swordage massif tellement c’est manifeste.
Le 05/08/2016 à 10h06
Commentaire insensé. parfois l’erreur 404 signifie que la page n’existe pas, pour une mauvaise raison (genre un domaine qui a disparu).
Merci de ne pas penser qu’à sa petite personne.
La solution pour les raleurs: faites votre propre 404, comme sur Nxi!
Le 05/08/2016 à 13h47
Effectivement, c’est une meilleur pratique, mais qui ne change pas tout dans l’absolue.
Matt Cutts explique que le moteur va réagir différemment selon que
tel ou tel code est renvoyé par le serveur lorsque Googlebot tente
d’atteindre une page : si le code http renvoyé est “404”,
il y aura un délai de 24 heures avant qu’une action soit effectuée (par
exemple, suppression de la page de l’index). Si le code d’erreur est 410,
l’action sera menée immédiatement, sans délai. Il souligne que, par la
suite, de nombreuses vérifications seront cependant effectuées par
Googlebot pour vérifier que la page en question a réellement disparu.
Matt Cutts explique également que, dans la majorité des cas, le
webmaster n’a pas à tenir compte de ces différences, qu’il s’agit plutôt
de “cuisine interne” à Google.
Source
Donc c’est sur c’est mieux, surtout si tu as du contenu qui doit disparaître régulièrement. Mais de base ce n’est pas une aberration d’avoir des pages que l’on passe en 404. Après cela vient pas forcement du webmaster, cela peut être une mauvaise écriture de l’url d’un lien vers ton site.
Cela m’ait arrivé de corriger et de réparer les liens d’un site après une migration qui avait opérer un changement dans la structure des URL. Certaines pages avait leur nouvelle URL et une 301 était la réponse. Mais des fois les pages n’avaient plus lieux d’être, et sont donc rester en 404.
Et l’on peux même faire comme l’on veux!
Après comme je disais tant que c’est un plug, je m’en fou, mais pas d’insertion de lien dans le site des gens de manière natif au navigateur c’est crade et non voulus.
Le 05/08/2016 à 13h53
Le 05/08/2016 à 14h19
Le 05/08/2016 à 14h33
Le 05/08/2016 à 15h30
Mouais, personne n’égalera la page d’erreur 404 de NextINpact !
" />
Le 05/08/2016 à 15h34
Mais c’est révolutionnaire ! Quelle nouveauté !!!
Dispo depuis des années: GitHub" />
Le 05/08/2016 à 17h27
Bravo à Mozilla. Encore une idée pourrie histoire d’enterrer Firefox un peu plus. Du grand art." />
Le 05/08/2016 à 18h13
Le 05/08/2016 à 19h08
J’allais faire la même remarque, je l’utilise depuis tellement longtemps cette extension :https://addons.mozilla.org/fr/firefox/addon/resurrect-pages/
Le 05/08/2016 à 22h21
Je ne suis pas vraiment d’accord avec ceux qui disent que c’est une catastrophe, mais je pense quand même que ça pose un problème du droit à l’oublie. Si quelqu’un veut se débarrasser de son site, quelqu’un lui en fait une copie sans prévenir, et firefox va la mettre sans même demander.
Tant que archive.org reste “confidentiel” ça va, mais quand ça devient accessible à tous les gugus ça commence à poser problème à mon avis…
Le 06/08/2016 à 05h32
Bha, si t’as envie de faire retirer ton site tu peux. Visiblement archives.org le permet.
Oui, après si t’as écrit de blog de merde ou un site néo-nazi, et que tu rends compte des années après que t’as fait de la merde, ça peut poser problème. Mais t’inquiète, s’il y a des gens qui veulent retrouver l’info, il la retrouveront. Il y a bien assez de crawlers (je pense en avoir au moins 40 qui passe sur mon serveur) sur le web pour archives tout ce que tu ne veux pas.
Le 06/08/2016 à 09h20
C’est pas le contraire justement ? L’utilisateur est notifié et peut, au choix, accéder à la page archivée.
Le 06/08/2016 à 09h20
Ouh la bonne idée de merde, ils auraient du garder ça pour un premier avril, ça aurait eu le mérite d’être drôle.
Le 06/08/2016 à 11h11
Worst idea ever…..
Le 06/08/2016 à 17h34
Le 06/08/2016 à 17h36
Le cache Google fait la même chose.
A toi d’assumer ou de faire marcher le droit à l’oubli.
Le 05/08/2016 à 10h28
Le 05/08/2016 à 10h28
Le 05/08/2016 à 10h29
C’est comme google cache en faite.
Plutôt pratique quand un site est down ou une page est supprimée pour x raison.
Où quand le site retourne un 404 ou tourne dans le vide parcequ’on utilise un VPN " />
Le 05/08/2016 à 10h31
Bah si tu n’es pas content, ce n’est pas vers FF qu’il faut te tourner, mais vers archive.org, le cache google et Wayback Machine !
déjà de base, si tu tombes sur une erreur 404, il te suffit de chercher le lien sur Google, de cliquer sur le petit triangle dans le premier résultat et cliquer sur “en cache”…
Le 05/08/2016 à 10h36
Le 05/08/2016 à 10h39
Excellente idée, de proposer une version en cache, de manière explicite.
Quand je trouve des liens vers des vieux sites qui n’existent plus, c’est souvent pour le contenu, et ca me permettait malgré tout d’avoir l’information.
Le 05/08/2016 à 10h41
Lisez.les.articles !! " />
Le 05/08/2016 à 10h42
C’est fou le nombre de réactionnaire qu’il y a sur NXi " />
Edit: Et le nombre de commentateurs qui ne lisent que le titre.
Le 05/08/2016 à 10h49
J’adore l’idée. Contre la censure abusée de certains sites ou les tentatives de déni, c’est génial.
Le 05/08/2016 à 10h50
Ils ré-écrivent les liens heureusement :) :  Archive.org://www.pcinpact.com/
Le 05/08/2016 à 10h50
En en plus c’est un test. Il se eput très bien que l’idée passe à la trappe " />
Le 05/08/2016 à 10h56
ça peut être pratique pour retrouver des vieilles informations :)
Le 05/08/2016 à 11h03
Le 05/08/2016 à 11h04
Message de M. LaBeouf : “Do it ! Just do it !” " />
(cf. https://www.youtube.com/watch?v=ZXsQAXx_ao0)
Le 05/08/2016 à 11h13
Le 05/08/2016 à 11h19
Vrai question ^^
Et si l’auteur du site ne veut pas qu’on y ait accès par choix divers ?
Parfois un site est fermé car il ne correspond plus à l’auteur.
Bon… Ça doit être rare.
Donc les sites de torrents vont pouvoir survivre ? Autre question que ça me soulève.