Assiste.com - Sécurité informatique - Vie privée sur le Web - Neutralité d'Internet

cr  01.04.2012      r+  22.10.2024      r-  22.10.2024      Pierre Pinard.         (Alertes et avis de sécurité au jour le jour)

La « Wayback Machine » (la « Machine à remonter le temps du WEB ») est l'un des services de l'Internet Archive (ou IA), un organisme à but non lucratif consacré à l'archivage du Web qui agit aussi comme bibliothèque numérique),

Si la recherche avec un moteur de recherche « traditionnel », comme « Google », permet de trouver et voir des objets Web (pages, sites, images, etc.) tels qu'ils sont maintenant, la « Wayback Machine » permet :

  • de voir des pages Web et autres historiques tels qu'ils étaient à différents moments dans le temps
  • de suivre les modifications de chaque objet Web (pages, sites, etc.) dans le temps
  • de trouver des pages et sites WEB qui ont disparu

Ce n'est plus une vision du Web plate (à deux dimensions), mais à trois dimensions, ajoutant la notion de temps.

La « Wayback Machine » permet cette recherche avec son propre moteur de recherche et sa propre navigation.

l'obsession de la « Wayback Machine » est de disposer de l'information avant qu'elle ne change ou disparaisse.

Si toutes les pages Web du monde étaient purement et simplement recopiées à intervalles, la « Wayback Machine » serait, à elle seule, des milliers de fois plus volumineuse que tout le WEB. En sus, pour assurer la stabilité et la sécurité des données archivées, un site WEB miroir fonctionnel est conservé à la « Bibliothèque Alexandrie », en Égypte.

Le symbole de la Bibliothèque d'Alexandrie

La « Bibliothèque d'Alexandrie » fut fondée en 288 avant notre ère (« … pour réunir, au complet si possible, tous les ouvrages parus dans le monde entier… »). Elle fut définitivement détruite dans des conditions inconnues [plusieurs hypothèses] et à un moment inconnu [plusieurs estimations, entre 48 av. J.-C. et 642]).

Des optimisations évitent les duplications de contenus strictement identiques.

Des sites WEB ne sont pas archivés (ils le refusent avec des directives dans les fichiers .htaccess). Ceci n'est plus respecté depuis avril 2017 (24.04.2017 – Digital Trends - Internet Archive will ignore robots.txt files to keep historical record accurate - https://www.digitaltrends.com/computing/internet-archive-robots-txt/.

Il est possible à quiconque de forcer une page à être archivée (peut servir de preuve dans une contestation, ou flatter l'orgueil de son auteur, etc.). Il suffit de chercher une URL dans la Wayback Machine qui, si elle ne la trouve pas, la cherche sur le WEB. Si elle la trouve, elle suggère à l'utilisateur de l'archiver.

Bien évidemment, il n'est pas question de référencement, au sens du SEO des webmasters.




l'« Internet Archive », dont la « Wayback Machine » n'est que l'un des services, est une association à but non lucratif qui construit perpétuellement, depuis 1996 (le Web est né le 06 août 1991), une bibliothèque de l'universalité de ce qui existe numériquement (sites Internet et tous autres artefacts culturels numériques). À l'instar d'une bibliothèque papier, l'« Internet Archive » fournit un accès gratuit aux chercheurs, historiens, érudits, grands publics, personnes sans accès à l'impression, etc. La mission que se donne l'« Internet Archive » est de fournir un accès universel à toutes les connaissances.