Internet Archive : 1 000 milliards de pages dans la Wayback Machine
On peut sauvegarder 1 000 fois une page ET 1 000 pages une fois
1 000 milliards de pages sauvegardées, c’est le palier atteint par Internet Archive avec sa machine à voyager dans le temps ou Wayback Machine. Depuis le retour de Donald Trump au pouvoir, l’organisation « n’a pas eu de période de repos ». Internet Archive continue de consulter des centaines de millions de pages par jour.
Le 22 octobre à 15h20
7 min
Internet
Internet
En ce mois d’octobre, Internet Archive annonce que sa Wayback Machine « devrait atteindre une étape unique en son genre » : 1 billion de pages Web archivées. L’organisation affirme ainsi être « le plus grand dépôt public de l’histoire d’Internet ». Alors avant toute chose, entendons-nous bien sur le terme billion !
En France et aux États-Unis, deux échelles différentes sont utilisées : la longue en France, la courte aux États-Unis. Sur les milliers et les millions, rien ne change, mais ça se complique rapidement après. Les billions de l’échelle courte des États-Unis sont des milliards en France (10⁹ dans les deux cas), mais surtout les trillions de l’échelle courte sont des… billions de l’échelle longue (10¹²). On s’arrêtera là, mais sachez que pour ne rien arranger les trillions existent aussi dans l’échelle longue et sont des quintillions de l’échelle courte (10¹⁸).
1 000 milliards de pages en presque 30 ans
Quand Internet Archive annonce donc un trillion de pages dans son échelle américaine, cela donne un billion de pages Web pour la France ou encore 1 000 milliards de pages si cela est plus parlant. L’organisation en profite pour remettre en avant son appel aux dons pour « archiver le prochain billion ».
À l’occasion des 25 ans d’Internet Archive, nous avions consacré tout un dossier à ce projet, lancé par Brewster Kahle en 1996. Il était alors question de « collecter des instantanés des sites web de tous les candidats à la présidentielle de 1996 ». Il faudra attendre octobre 2001 pour que la « machine à voyager dans le temps » – ou Wayback Machine – débarque.
Depuis le retour de Trump, « il n’y a pas eu de période de repos »
Il reste 72% de l'article à découvrir.
Déjà abonné ? Se connecter
Soutenez un journalisme indépendant,
libre de ton, sans pub et sans reproche.
Accédez en illimité aux articles
Profitez d'un média expert et unique
Intégrez la communauté et prenez part aux débats
Partagez des articles premium à vos contacts
Internet Archive : 1 000 milliards de pages dans la Wayback Machine
-
1 000 milliards de pages en presque 30 ans
-
Depuis le retour de Trump, « il n’y a pas eu de période de repos »
-
Internet Archive est une bibliothèque fédérale aux USA
-
Près de 500 millions de pages et 800 000 visiteurs par jour
-
Des Petabox avec des centaines de Po de stockage
Commentaires (11)
Le 22/10/2025 à 15h36
Et dans un deuxième temps, j'en arrive à la conclusion que c'est aussi l'histoire d'Internet, même si le contenu n'est pas pertinent, cette évolution sera très probablement étudiée dans un avenir plus ou moins proche et Internet Archive permet de dresser un état des lieux à des instants précis.
Le 23/10/2025 à 06h23
Le 22/10/2025 à 16h11
Internet Archive qui est devenu comme n'importe quel autre crawler de LLM, quel gâchis.
Modifié le 22/10/2025 à 21h04
- le billiard (pas de typo ici) : 10E12 c.a.d 1 péta.
- le trilliard: 10E21 c.a.d 1 zetta.
Et j'aime bien l'introduction sur la page Wikipédia: "L'échelle longue, ou échelle de Chuquet, et l'échelle courte sont deux systèmes incompatibles de noms des grands nombres"
Ben oui pourquoi faire simple quand on peut faire compliquer, ou bien chacun dans son coin et aucune envie d'harmoniser, assez typique de l'espèce humaine en fait...
Echelle courte (et non pas la courte échelle !
Le 22/10/2025 à 17h55
Modifié le 22/10/2025 à 23h35
car il fallait qu'elle switche entre un système basé sur du 10E3 - 10E6 à un système basé sur du 10E2 - 10E4 et vice-versa... et ça, je l'ignorais...
La Myriade ! relique du passé avec les fameux hectares de Bruno Lemaire ou bien les hectolitres de tonneaux de vin !
Modifié le 23/10/2025 à 13h20
avec Unité au centre.
déca (x10) déci(x0,1 ou 10^-1)
Hecto (x100) centi (x0,01 ou 10^-2)
Kilo (x1000) Milli (x0,001 ou 10^-3)
etc
De mémoire, les puissances positives préfixes grecs ; Les puissances négatives préfixes latins)
Ou sinon juste voir la page wiki qui dit surement mais de bêtises que moi ;-)
PS: C'est pour ça aussi que dans pas mal d'Isekaï, les trouves pieces de bronze (ou cuivre), pièces d'argent, pièces d'or et Grande pieces d'or.
Le 24/10/2025 à 10h23
Ha tiens, ça, je l'ignorais !
Le 23/10/2025 à 08h49
Modifié le 23/10/2025 à 12h18
Le 22/10/2025 à 22h15
Signaler un commentaire
Voulez-vous vraiment signaler ce commentaire ?