Flux RSS - La vie du site - Nouveautés et mises à jour
Assiste.com - Sécurité informatique - Décontamination - Antivirus - Protection - Protection de la Vie Privée Assiste.com - Sécurité informatique préventive - Décontamination - Antivirus - Protection - Protection de la Vie Privée

Index.dat (fichiers index.dat)

Dernière mise à jour : 2018-10-12T14:52 - 12.10.2018
01.04.2012 - 00h00 - Paris - (Assiste - Pierre Pinard) - Mise à jour de notre article antérieur (versions 1997-2007)
21.06.2012 - 17h37 - Paris - (Assiste - Pierre Pinard) - Mise à jour

Les fichier "index.dat" sont des fichiers du monde Windows (Microsoft) présents dans de nombreux répertoires deWindows. Ils sont souvent appelés "les fichiers secrets de Windows".

Que sont les fichiers index.dat ? - Lien permanentQue sont les fichiers index.dat ?Que sont les fichiers index.dat ?

Les fichiers "Index.dat" ont été introduits dans Windows avec Internet Explorer 4 (en octobre 1997), initialement dans Windows 95 OEM Service Release 2.5 puis avec Internet Explorer 4.01 dans Windows 98.

Prédécesseurs des fichiers index.dat

Des fichiers similaires ont précédés les fichiers index.dat. Ils étaient connus sous les noms de "Mm256.dat" et "Mm2048.dat" situés dans les dossiers WindowsCookies et WindowsHistory et ont commencé avec Internet Explorer 1 (soit depuis 1995). Ils ont disparu après Internet Explorer 5.5, définitivement remplacés par les index.dat.

Divers logiciels, dont le navigateur Internet de Microsoft, Internet Explorer (qui est volontairement mutualisé avec de très nombreuses fonctions de Windows, permettant à Microsoft de prétendre qu'il est impossible de le retirer de Windows, même si on ne s'en sert pas et qu'on lui préfère Opéra ou Firefox...) y notent en permanence divers pointeurs, à la suite de requêtes, vers des ressources trouvées (pré-existantes) ou établies (calculées, construites...).

L'argument mis en avant par Microsoft pour de tels fichiers est qu'ils permettent une accélération notable lors de la formulation ultérieure de requêtes identiques.

Cache ?

Ce mot va être employé plusieurs fois - de quoi s'agit-il ?

Il s'agit d'un principe d'anticipation (accélérateur). Voir les différentes acceptions du terme " cache " dans les nouvelles technologies de l'information (informatique). Cache.

Cas d'usage des fichiers index.dat :

Ces fichiers sont, par exemple, des gestionnaires de points d'entrées (des "index") vers les "caches" utilisés par Internet Explorer.

Lorsque vous visitez une page Web, Internet Explorer calcule, pour l'adresse Web visitée, un numéro d'identification unique (un calcul de type Condensat) et recherche dans les fichiers index.dat ce numéro d'identification.

  • Si ce numéro d'identification est trouvé dans index.dat, c'est que la page Web a déjà été visitée et que son contenu est déjà stocké localement, sur votre disque dur, dans le "cache" du navigateur. Internet Explorer utilise alors le contenu stocké localement, dans son "cache", au lieu de télécharger l'information à partir d'Internet.
  • Si le numéro d'identification de la page Web est introuvable, le contenu de la page Web n'est pas dans le "cache" et doit être téléchargé à partir d'Internet. Cela ne se produit que :

    • Si vous n'avez pas visité la page Web auparavant (c'est la première fois que vous y allez)
    • Si le numéro d'identification de la page Web a expiré (durée de validité au-delà de laquelle la ressource locale, dans le "cache", est considérée obsolète
    • Si la copie de la page Web, dans le "cache", a été supprimée pour faire de la place à d'autres pages plus récentes (la taille totale du fichier servant de "cache" étant limitée).

Des dispositifs complémentaires s'assurent que la page Web d'origine, sur le site visité, n'a pas été mise à jour depuis, etc. ...

Deux informations, au moins, aident à la décision de recharger une page à jour depuis le Web plutôt que de prendre sa copie obsolète dans le "cache" d'Internet Explorer :

  1. Une information déposée dans la page Web même par l'auteur de la page, donnant la durée de validité de la page (mais cette information est rarement donnée et, lorsqu'elle l'est, elle est généralement fantaisiste et il ne lui est pas beaucoup prêtée d'attention).
  2. La date et heure de dernière mise à jour du fichier contenant la page Web, sur le serveur.

Chaque fois que le contenu d'une page Web a été téléchargé sur le disque dur (première fois ou mise à jour d'une fois précédente), le fichier index.dat est mis à jour avec le numéro d'identification de la page Web dont "l'image" est conservée dans le "cache" d'Internet Explorer (le tout enrichi par des données comportementales).

Tous les navigateurs utilisent le même principe d'anticipation

index.dat est le fichier d'indexation du contenu des caches d'Internet Explorer, mais tous les navigateurs (Firefox, Opera, Google Chrome, Safari, etc. ...) utilisent une technologie de "cache" et de méthode d'accès au contenu du "cache", similaire.



Cette technologie d'anticipation et les fichiers index.dat a été déployée, par Microsoft, à d'autres ressources :
  • Répertoires Cookies : les données d'indexation dans les fichiers index.dat sont les noms des cookies (donc l'historique quasi complet des sites visités puisque quasiment tous les sites créent un cookie), les pointeurs vers les fichiers réels associés, stockés sur le disque dur (fichiers de cookies dans les répertoires de cookies), le tout enrichi par des données comportementales.

  • Historiques : il s'agit d'une collection d'URL utilisée pour l'AutoComplete et pour la mise en évidence des liens déjà visités (il n'y a pas de fichier réel physiquement présent dans un répertoire et qui serait pointé par les contenus des index.dat d'historique), le tout enrichi par des données comportementales.
Les fichiers index.dat posent deux problèmes épineux :
  1. Il représentent un condensé de toute notre activité (une partie de notre vie - en ligne et hors ligne). On y trouve les duplications cachées de toutes les traces de notre activité que nous laissons un peu partout dans notre ordinateur. Nous tentons bien d'effacer nos traces de temps en temps (les historiques, les cookies, les répertoires temporaires, les derniers documents manipulés (MRU) etc. ...), mais nous n'arrivons pas à effacer ou vider ces fichiers qui sont ineffaçables ! Les fichiers index.dat sont les traces de nos traces ! Or ils peuvent être lus librement par n'importe quel logiciel dédié à leur lecture, que ce soit par une personne présente devant l'ordinateur ou par un cybercriminel ayant implanté, à distance, un tel logiciel dans notre ordinateur. Il n'y a plus de navigation privée ou d'usage privé de l'ordinateur. Les fichiers index.dat favorisent dramatiquement les innombrables logiciels espions et sites espions faisant commerce de la violation de la vie privée sur Internet (au minimum : Tracking et Profiling). Windows centralise en quelques fichiers compressés une grande part des données servant à l'analyse comportementale et le ciblage comportemental des internautes et des utilisateurs de PC, même s'ils ne sont pas internautes.

  2. Ces fichiers croissent indéfiniment et finissent par atteindre des tailles considérables et, à l'oposé de leur finalité affichée, ils finissent par ralentir le système. Paramétrer Internet Explorer, par exemple, en lui disant de ne conserver les historiques de navigation que sur 1 jour, ne change rien à la gestion des fichiers index.dat qui, eux, conservent tout indéfiniment.
Microsoft a corrigé ces deux problèmes (taille et confidentialité) à partir d'Internet Explorer 7.
  • Taille :
    Les entrées d'index ne sont plus conservées lorsque la ressource dans le "cache" est détruite pour une raison ou pour une autre. Ceci règle partiellement le problème de confidentialité.
  • Confidentialité :
    Lorsque le "cache" est vidé, l'index.dat est vidé.

La défiance envers les index.dat continueLa défiance envers les index.dat continueLa défiance envers les index.dat continue

Le mal est fait et les internautes avertis développent une peur paranoïaque à l'égard des fichier index.dat.

Le problème vient aussi de l'opacité que Microsoft oppose à propos de ces fichiers index.dat. Aucune information n'a été communiquée. Microsoft laisse courir le bruit d'un risque de perte de stabilité de Windows si les fichiers index.dat sont détruits brutalement. Ils évoquent une histoire de synchronisation entre leurs contenus et les contenus des répertoires vers lesquels ils pointent, ce qui est une pure intoxication car, lorsque les index.dat sont détruits, ils sont vides et ne contiennent donc aucun pointeur - il n'y a donc pas de désynchronisation - il n'y a rien ! Les "caches", eux, sont de bêtes répertoires normaux de Windows et contiennent simplement des fichiers, comme tous les autres répertoires de Windows. L'inverse, (vider les "caches" sans vider les index.dat), ne pose pas plus de problème. Il tombe sous le sens que le cas de figure d'un index pointant vers une ressource qui n'existe pas dans le "cache", ne pose aucun problème puisque c'est le fondement même du principe d'anticipation : la ressource existe ou n'existe pas (sinon, aucun Windows dans le monde ne fonctionnerait !)

Y a-t-il un risque en détruisant ou vidant les fichiers index.dat ?Y a-t-il un risque en détruisant ou vidant les fichiers index.dat ?Y a-t-il un risque en détruisant ou vidant les fichiers index.dat ?

Aucun risque ! Strictement aucun risque !

Aucun des contenus des fichiers index.dat n'est nécessaire. Ils peuvent être détruits sans aucun risque pour le système, absolument aucun risque.

Deux axes de travail ont été développés pour se débarasser de ces traces dans les fichiers index.dat :

  1. Détruire les fichiers
    Les fichiers index.dat peuvent être détruits (difficilement) par des utilitaires, spécialisés ou génériques. Ils seront recréés automatiquement, mais vides.

  2. Vider les fichiers.
    Les fichiers index.dat sont vidés de leurs contenus par une famille d'utilitaires, spécialisés ou génériques, et ré-écrits vides.
Nota : Les utilisateurs des navigateurs Firefox ou Opera ou Chrome, et autres navigateurs ne s'appuyant pas sur Internet Explorer, sont un peu moins concernés par les fichiers index.dat.

Voir les fichiers index.datVoir les fichiers index.datVoir les fichiers index.dat

Ces fichiers sont, par défaut, cachés. Vous pouvez demander, dans les options de l'Explorateur Windows, à voir tous les fichiers (fichiers cachés, fichiers système etc. ...).

Comment voir les fichiers et dossiers cachés de Windows ?
Cet article traite intégralement du sujet des fichiers et dossiers cachés et des dossiers système cachés

Maintenant, vous pouvez voir la présence des fichiers index.dat. Exemple (sous Windows 7) :

Voir les fichiers cachés dans tous les répertoires d'un volume
Voir les fichiers cachés dans tous les répertoires d'un volume

Le fichier index.dat au niveau le plus élevé de la hiérarchie du répertoire d'historique est utilisé pour stocker les noms des URL (adresses) visitées avec date et heure. Ce sont ces données qui sont utilisées par Internet Explorer pour sa fonction "AutoComplete" ainsi que pour la notation des URL déjà visitées parmi les liens apparaissant sur les pages Web.

Notons qu'il y a autant de sous répertoires mshistxx qu'il y a de jours d'historique paramétrés dans les préférences d'Internet Explorer. Comme leur nom l'indique, ce sont des index. Il y en a 1 par répertoire pour certains répertoires comme ceux des cookies, des historiques, des "caches"... Ils servent à accéder rapidement (à accélérer l'accès) aux objets du répertoire vers lesquels ils pointent. Les données y sont stockées dans un format compressé illisible directement. Malheureusement, ils ne contiennent pas que des pointeurs mais aussi des données significatives enrichies de données comportementales (compteurs de "hits", date et heure du dernier accès etc. ...) donc il ne sert à rien d'effacer nos traces sur nos ordinateurs si nous n'effaçons pas les fichiers index.dat.

Supprimer (vider - détruire) les fichiers index.datSupprimer (vider - détruire) les fichiers index.datSupprimer (vider - détruire) les fichiers index.dat

Il n'est pas possible de détruire un fichier lorsque celui-ci est ouvert par une tâche en cours d'exécution. Comme Windows et Internet Explorer sont en permanence en cours d'exécution, il ne sera donc jamais possible de détruire les fichiers index.dat "normalement". C'est la raison pour laquelle la quasi totalité des prétendus "effaceurs de traces" passent sous silence ces fichiers qu'ils ne savent pas manipuler.

Détruire les fichiers index.dat à la main

Seuls les fichiers index.dat de l'utilisateur actuellement identifié (session ouverte) sont mobilisés. Pour les détruire sans utiliser un outil spécialisé :

Créer un autre compte utilisateur, avec privilèges administratifs, réservé à cet effet (qui ne servira pas à utiliser l'ordinateur ni la navigation Internet). Appelons-le, par exemple, Compte-anti-indexdat.

Fermer la session normale de travail.

Démarrer une session sous le compte Compte-anti-indexdat

Rechercher tous les fichiers index.dat et les détruire. Ils sont recréés automatiquement à vide par Windows.

Les fichiers index.dat persistent même si le contenu des dits répertoires est effacé et ils ne peuvent être effacés ou vidés par un moyen simple. Le seul moment où il est possible de les effacer est lorsque Windows n'en a pas le contrôle, c'est-à-dire uniquement durant le tout début de la phase de démarrage de l'ordinateur.

C'est un véritable foutage de gueule de la part de Microsoft car, si on prend simplement la fonction "vider le répertoire temporaire d'Internet (le "cache" d'Internet Explorer) les fichiers index.dat ne changent pas d'un iota, au contraire, ils continuent à croître.

On utilisera donc des outils capables de détruire ces fichiers ou de nous en donner le contrôle, comme :
CCleaner
Unlocker

Les fichiers index.dat détruits sont recréés à vide par Windows. Ceux indexant le cache Internet Explorer pèsent 32 KO, les autres, indexant les cookies, les historiques, etc. ... pèsent 16 KO.

RessourcesRessources" Ressources "

Index.dat: Part I - What is index.dat?
Index.dat: Part II - What are they used for?
Index.dat Part III - How do I delete index.dat?
Index.dat Part IV - It's doing what on the UI thread?