Assiste.com - Sécurité informatique - Vie privée sur le Web - Neutralité d'Internet

cr  03.08.2022      r+  22.10.2024      r-  22.10.2024      Pierre Pinard.         (Alertes et avis de sécurité au jour le jour)

Les fichiers « Index.dat » ont été introduits dans Windows avec Internet Explorer 4 (en octobre 1997), initialement dans « Windows 95 OEM Service Release 2.5 » puis avec « Internet Explorer 4.01 » dans « Windows 98 ».

Prédécesseurs des fichiers index.dat

Des fichiers similaires ont précédé les fichiers index.dat. Ils étaient connus sous les noms de « Mm256.dat » (256 caractères) et « Mm2048.dat » (2048 caractères), situés dans les dossiers WindowsCookies et WindowsHistory. Ils sont apparus avec Internet Explorer 1 (soit depuis 1995). Ils ont disparu après Internet Explorer 5.5, définitivement remplacés par les index.dat.

Divers logiciels, dont le navigateur Web de Microsoft, Internet Explorer (qui est volontairement mutualisé avec de très nombreuses fonctions de Windows, permettant à Microsoft de prétendre qu'il est impossible de le retirer de Windows, même si on ne s'en sert pas et qu'on lui préfère Opéra ou Firefox...) y notent en permanence divers pointeurs, à la suite de requêtes, vers des ressources trouvées (pré-existantes) ou établies (calculées, construites...).

L'argument mis en avant par Microsoft pour de tels fichiers est qu'ils permettent une accélération notable lors de la formulation ultérieure de requêtes identiques.

Cache ?

Ce mot va être employé plusieurs fois - de quoi s'agit-il ?

Il s'agit d'un principe d'accélération par l'anticipation. Voir les différentes acceptions du terme « cache » dans les nouvelles technologies de l'information (informatique). Cache.


Cas d'usage des fichiers index.dat :

Ces fichiers sont, par exemple, des gestionnaires de points d'entrées (des « index ») vers les « caches » utilisés par Internet Explorer.

Lorsque vous visitez une page Web, Internet Explorer calcule, pour l'adresse Web visitée, un numéro d'identification unique (un calcul de type « Condensat ») et recherche dans les fichiers index.dat ce numéro d'identification.

  • Si ce numéro d'identification est trouvé dans index.dat, c'est que la page Web a déjà été visitée et que son contenu est déjà stocké localement, sur votre disque dur, dans le « cache » du navigateur. Internet Explorer utilise alors le contenu stocké localement, dans son « cache », au lieu de télécharger l'information à partir d'Internet.

  • Si le numéro d'identification de la page Web est introuvable dans votre appareil, le contenu de la page Web n'est pas dans le « cache » et doit être téléchargé à partir d'un serveur sur le réseau Internet. Cela ne se produit que :

    • Si vous n'avez pas visité la page Web auparavant (c'est la première fois que vous y allez).

    • Si le numéro d'identification de la page Web a expiré (durée de validité au-delà de laquelle la ressource locale, dans le « cache », est considérée obsolète et la place mobilisée est libérée pour d'autres mises en « cache ».

    • Si la copie de la page Web, même réçamment mise en « cache », a été supprimée du cache, c'est pour faire de la place à d'autres pages Web plus réçamment consultées, la taille totale du fichier servant de « cache » n'étant pas extensible.

Des dispositifs complémentaires s'assurent que la page Web d'origine, sur le site visité, n'a pas été mise à jour depuis, etc. ...

Deux informations, au moins, aident à la décision de recharger une page à jour depuis le Web plutôt que de prendre sa copie obsolète dans le « cache » d'Internet Explorer :

  1. Une information, déposée à l'intérieur même de la page Web, par l'auteur de la page, donne la durée de validité de la page (mais cette information est rarement donnée et, lorsqu'elle l'est, elle est généralement fantaisiste et il ne lui est pas beaucoup prêtée d'attention).

  2. La date et heure de dernière mise à jour du fichier contenant la page Web, sur le serveur.

Chaque fois que le contenu d'une page Web a été téléchargé sur le disque dur (première fois ou mise à jour d'une fois précédente), le fichier index.dat est mis à jour avec le numéro d'identification de la page Web dont l'image est conservée dans le « cache » d'Internet Explorer (le tout enrichi par des données comportementales).

Tous les navigateurs utilisent le même principe d'anticipation

« index.dat » est le fichier d'indexation du contenu des caches d'Internet Explorer, mais tous les navigateurs (Firefox, Opera, Google Chrome, Safari, etc. ...) utilisent une technologie de « cache » et de méthode d'accès au contenu du « cache », similaire (calcul d'un condensat).

Cette technologie d'anticipation et les fichiers index.dat ont été également déployés, par Microsoft, pour d'autres ressources :

  • Répertoires Cookies : les données d'indexation dans des fichiers de type index.dat sont les noms des cookies (donc l'historique quasi complet des sites Web visités puisque quasiment 100% des sites Web créent au moins un cookie et généralement des dizaines), les pointeurs vers les fichiers réels associés, stockés sur le disque dur (fichiers de cookies dans les répertoires de cookies), le tout enrichi par des données comportementales.

  • Historiques : il s'agit d'une collection d'URL utilisée pour l'AutoComplete et pour la mise en évidence des liens déjà visités (il n'y a pas de fichier réel physiquement présent dans un répertoire et qui serait pointé par les contenus des index.dat d'historique), le tout enrichi par des données comportementales.

Les fichiers index.dat posent deux problèmes épineux :

  1. Il représentent une surveillance condensée de toute notre activité (une partie de notre vie - en ligne et hors ligne). On y trouve les duplications cachées de toutes les traces de notre activité que nous laissons un peu partout dans notre ordinateur. Nous tentons bien d'effacer nos traces de temps en temps (les historiques, les cookies, les répertoires temporaires, les derniers documents manipulés (MRU) etc. ...), mais nous n'arrivons pas à effacer ou vider ces fichiers qui sont ineffaçables ! Les fichiers index.dat sont les traces de nos traces ! Or ils peuvent être lus librement par n'importe quel logiciel dédié à leur lecture, que ce soit par une personne présente devant l'ordinateur ou par un cybercriminel ayant implanté, à distance, un tel logiciel dans notre appareil. Il n'y a plus de navigation privée ou d'usage privé de l'ordinateur. Les fichiers index.dat favorisent dramatiquement les innombrables logiciels espions et sites espions faisant commerce de la violation de la vie privée sur Internet (au minimum : Tracking et Profiling). Windows centralise en quelques fichiers compressés une grande part des données servant à l'analyse comportementale et le ciblage comportemental des internautes et des utilisateurs de PC, même s'ils ne sont pas internautes.

  2. Ces fichiers croissent indéfiniment et finissent par atteindre des tailles considérables et, à l'oposé de leur finalité affichée, ils finissent par ralentir le système. Paramétrer Internet Explorer, par exemple, en lui disant de ne conserver les historiques de navigation que sur 1 jour, ne change rien à la gestion des fichiers index.dat qui, eux, conservent tout indéfiniment.

Microsoft a corrigé ces deux problèmes (taille et confidentialité) à partir d'Internet Explorer 7.

  • Taille :
    Les entrées d'index ne sont plus conservées lorsque la ressource dans le « cache » est détruite pour une raison ou pour une autre. Ceci règle partiellement le problème de confidentialité.

  • Confidentialité :
    Lorsque le « cache » est vidé, l'index.dat est vidé.

La défiance envers les index.dat continueLa défiance envers les index.dat continueLa défiance envers les index.dat continue

Le mal est fait et les internautes avertis développent une peur paranoïaque à l'égard des fichier index.dat.

Le problème vient aussi de l'opacité que Microsoft oppose à propos de ces fichiers index.dat. Aucune information n'a été communiquée. Microsoft laisse courir le bruit d'un risque de perte de stabilité de Windows si les fichiers index.dat sont détruits brutalement. Ils évoquent une histoire de synchronisation entre leurs contenus et les contenus des répertoires vers lesquels ils pointent, ce qui est une pure intoxication car, lorsque les index.dat sont détruits, ils sont vides et ne contiennent donc aucun pointeur - il n'y a donc pas de désynchronisation - il n'y a rien ! Les « cache », eux, sont de bêtes répertoires normaux de Windows et contiennent simplement des fichiers, comme tous les autres répertoires de Windows. L'inverse, (vider les « cache » sans vider les index.dat), ne pose pas plus de problème. Il tombe sous le sens que le cas de figure d'un index pointant vers une ressource qui n'existe pas dans le « cache », ne pose aucun problème puisque c'est le fondement même du principe d'anticipation : la ressource existe ou n'existe pas (sinon, aucun Windows dans le monde ne fonctionnerait !)

Y a-t-il un risque en détruisant ou vidant les fichiers index.dat ?Y a-t-il un risque en détruisant ou vidant les fichiers index.dat ?Y a-t-il un risque en détruisant ou vidant les fichiers index.dat ?

Aucun risque ! Strictement aucun risque !

Aucun des contenus des fichiers index.dat n'est nécessaire. Ils peuvent être détruits sans aucun risque pour le système, absolument aucun risque.

Deux axes de travail ont été développés pour se débarasser de ces traces dans les fichiers index.dat :

  1. Détruire les fichiers
    Les fichiers index.dat peuvent être détruits (difficilement) par des utilitaires, spécialisés ou génériques. Ils seront recréés automatiquement, mais vides.

  2. Vider les fichiers.
    Les fichiers index.dat sont vidés de leurs contenus par une famille d'utilitaires, spécialisés ou génériques, et ré-écrits vides.

Nota : Les utilisateurs des navigateurs Firefox ou Opera ou Chrome, et autres navigateurs ne s'appuyant pas sur Internet Explorer, sont un peu moins concernés par les fichiers index.dat.

Voir les fichiers index.datVoir les fichiers index.datVoir les fichiers index.dat

Ces fichiers sont, par défaut, cachés. Vous pouvez demander, dans les options de l'Explorateur Windows, à voir tous les fichiers (fichiers cachés, fichiers système, etc. ...).

Comment voir les fichiers et dossiers cachés de Windows ?
Cet article traite intégralement du sujet des fichiers et dossiers cachés et des dossiers système cachés

Maintenant, vous pouvez voir la présence des fichiers index.dat. Exemple (sous Windows 7) :

Voir les fichiers cachés dans tous les répertoires d'un volume
Voir les fichiers cachés dans tous les répertoires d'un volume

Le fichier index.dat au niveau le plus élevé de la hiérarchie du répertoire d'historique est utilisé pour stocker les noms des URL (adresses) visitées avec date et heure. Ce sont ces données qui sont utilisées par Internet Explorer pour sa fonction "AutoComplete" ainsi que pour la notation des URL déjà visitées parmi les liens apparaissant sur les pages Web.

Notons qu'il y a autant de sous répertoires mshistxx qu'il y a de jours d'historique paramétrés dans les préférences d'Internet Explorer. Comme leur nom l'indique, ce sont des index. Il y en a 1 par répertoire pour certains répertoires comme ceux des cookies, des historiques, des « cache »... Ils servent à accéder rapidement (à accélérer l'accès) aux objets du répertoire vers lesquels ils pointent. Les données y sont stockées dans un format compressé illisible directement. Malheureusement, ils ne contiennent pas que des pointeurs mais aussi des données significatives enrichies de données comportementales (compteurs de "hits", date et heure du dernier accès etc. ...) donc il ne sert à rien d'effacer nos traces sur nos ordinateurs si nous n'effaçons pas les fichiers index.dat.

Supprimer (vider - détruire) les fichiers index.datSupprimer (vider - détruire) les fichiers index.datSupprimer (vider - détruire) les fichiers index.dat

Il n'est pas possible de détruire un fichier lorsque celui-ci est ouvert par une tâche en cours d'exécution. Comme Windows et Internet Explorer sont en permanence en cours d'exécution, il ne sera donc jamais possible de détruire les fichiers index.dat "normalement". C'est la raison pour laquelle la quasi totalité des prétendus « effaceurs de traces » passent sous silence ces fichiers qu'ils ne savent pas manipuler.

Détruire les fichiers index.dat à la main

Seuls les fichiers index.dat de l'utilisateur actuellement identifié (session ouverte) sont mobilisés. Pour les détruire sans utiliser un outil spécialisé :

Créer un autre compte utilisateur, avec privilèges administratifs, réservé à cet effet (qui ne servira pas à utiliser l'ordinateur ni la navigation Internet). Appelons-le, par exemple, Compte-anti-indexdat.

Fermer la session normale de travail.

Démarrer une session sous le compte Compte-anti-indexdat

Rechercher tous les fichiers index.dat et les détruire. Ils sont recréés automatiquement à vide par Windows.

Les fichiers index.dat persistent même si le contenu des dits répertoires est effacé et ils ne peuvent être effacés ou vidés par un moyen simple. Le seul moment où il est possible de les effacer est lorsque Windows n'en a pas le contrôle, c'est-à-dire uniquement durant le tout début de la phase de démarrage de l'ordinateur.

C'est un véritable foutage de gueule de la part de Microsoft car, si on prend simplement la fonction "vider le répertoire temporaire d'Internet (le « cache » d'Internet Explorer) les fichiers index.dat ne changent pas d'un iota, au contraire, ils continuent à croître.

On utilisera donc des outils capables de détruire ces fichiers ou de nous en donner le contrôle, comme :
CCleaner
Unlocker

Les fichiers index.dat détruits sont recréés à vide par Windows. Ceux indexant le cache Internet Explorer pèsent 32 KO, les autres, indexant les cookies, les historiques, etc. ... pèsent 16 KO.






Internet Explorer n'existe plus.

Internet Explorer a été retiré le 15 juin 2022 et n'existe plus. Il est remplacé par Microsoft Edge.

Si un site que vous visitez nécessite Internet Explorer (IE), probablement à cause de l'utilisation de la technologie scélérate ActiveX, vous pouvez le recharger en mode IE dans le navigateur Microsoft Edge.