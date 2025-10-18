L’Internet Archive, créé en 1996, vient de franchir une étape historique en sauvegardant plus de 1 000 milliards de pages web. Cette organisation à but non lucratif œuvre depuis près de trente ans pour préserver la mémoire d’Internet et rendre accessibles des contenus en ligne, même après leur disparition.

Internet Archive franchit le cap du trillion de pages sauvegardées

Créé en 1996 à San Francisco par l’ingénieur et entrepreneur Brewster Kahle, l’Internet Archive est une organisation à but non lucratif dont la mission est de préserver la mémoire du Web. Son objectif est simple : sauvegarder le plus possible de contenus en ligne — sites web, vidéos, images, livres, logiciels ou musiques — afin qu’ils restent accessibles même après leur disparition d’Internet. Près de trente ans après sa création, le projet vient de franchir une étape historique en dépassant le trillion de pages archivées, soit plus de 1 000 milliards de versions de sites web conservées.

Une quantité de données colossale

Ce trillion de pages représente plus de 100 000 téraoctets de données, soit l’équivalent de plus de 21 millions de DVD. Chaque jour, l’Internet Archive ajoute environ 500 millions de nouvelles pages à ses serveurs. Le célèbre outil Wayback Machine, accessible à tous, permet de consulter ces versions anciennes de sites web et d’observer l’évolution du Web au fil du temps.

Cette base de données géante ne se limite pas aux sites Internet : elle abrite également des vidéos, des livres numérisés, des logiciels anciens et même des émissions de radio ou de télévision, offrant une véritable photographie de l’ère numérique.

Une mission essentielle pour la mémoire du Web

L’importance de ce travail dépasse la simple nostalgie. En archivant systématiquement le Web, l’Internet Archive contribue à préserver des contenus historiques, journalistiques et culturels qui disparaissent parfois du jour au lendemain. Ces archives sont devenues une ressource précieuse pour les chercheurs, les journalistes d’investigation et les historiens du numérique.

Elles permettent également de retrouver des informations supprimées ou modifiées, un outil essentiel dans le cadre d’enquêtes ou de vérifications factuelles. En un sens, l’Internet Archive agit comme une bibliothèque universelle du Web, garantissant la transparence et la continuité de la connaissance en ligne.

Une collaboration mondiale

Depuis son lancement, l’Internet Archive s’appuie sur un vaste réseau de partenaires. Plus de 1 200 bibliothèques et institutions à travers le monde participent à cette mission collective. Grâce à ces collaborations, les archives sont plus diversifiées, mieux documentées et accessibles au plus grand nombre.

Cette coopération internationale permet aussi de sécuriser les données : plusieurs copies des mêmes archives sont conservées dans différents lieux pour éviter toute perte en cas de panne ou d’attaque.

Un avenir tourné vers la durabilité

En célébrant ce trillion de pages, l’Internet Archive ne compte pas s’arrêter là. L’organisation réfléchit déjà à des solutions plus durables et automatisées pour continuer à sauvegarder un Web en constante expansion. Elle prévoit aussi d’organiser plusieurs événements pour remercier les contributeurs et sensibiliser le public à l’importance de la conservation numérique.

Alors que de plus en plus de contenus sont éphémères et dépendants de plateformes fermées, l’Internet Archive reste un pilier du Web libre et ouvert, garantissant que la mémoire collective d’Internet ne s’effacera jamais.