Flux RSS - La vie du site - Nouveautés et mises à jour
Assiste.com - Sécurité informatique - Vie privée sur le Web - Neutralité d'Internet Assiste.com - Sécurité informatique - Vie privée sur le Web - Neutralité d'Internet

Anonymisation des données issues du tracking

Anonymisation des données issues du tracking : il n'est pas besoin de discours alambiqués pour affirmer que l'anonymisation est un leurre.

01.01.2012 - Révision 24.04.2022 - Révision mineure 13.05.2022. Auteur : Pierre Pinard.

Sans cesse, les clauses obligatoires « Vie privée » (Privacy) de tout ce à quoi l'on accède sur le Web nous disent que des données sont collectées « anonymement » afin de permettre aux webmasters d'améliorer leurs sites Web et au modèle économique d'un Web gratuit de rémunérer, par la publicité ciblée (comportementale), sur la base du profilage, les sites Web qui, sinon, basculent dans un modèle payant.

Même si l'on met de côté les clauses « Vie privée » (Privacy) un peu moins malhonnêtes, qui disent clairement collecter des informations nominatives et recopier intégralement nos documents (Word, Excel, Outlook, etc.) sur leurs serveurs et dans les clouds, il n'est pas besoin de discours alambiqués pour affirmer que l'anonymisation est un leurre.

Quelles sont les données collectées ?

  • Liste des données privées officiellement collectées (révélation malheureuse de Microsoft).

  • Un autre cas, très médiatisé, prouve que l'anonymisation prétendue des données est un mensonge : le cas d'AOL qui, par erreur, a mis en ligne, avant de le retirer promptement, les données de tracking (espionnage) de quelques 658.000 internautes (environ 20 millions de données sur les recherches demandées, les liens visités, etc. représentant le tracking de mars, avril et mai 2006). Le fichier a été téléchargé plusieurs fois avant qu'AOL ne l'efface. Ceux qui l'on téléchargé l'on anonymisé (remplacement des identités réelles des utilisateurs d'AOL par un simple numéro d'identification) avant de le rendre public.

Des chercheurs ont développé des applications de recherches dans ce fichier (AOL Search Database, Datablunder, Frogspy, etc.)

Beaucoup de ces recherches portent sur le SEO (optimisation de l'indexation dans les moteurs de recherche). Il est intéressant de savoir quelles sont les fautes d'orthographe ou de frappe les plus souvent commises sur chaque mot utilisé en recherche, etc., mais certains travaux sur cette base de données ont permis de trouver, tout de même, des données comme un numéro de sécurité sociale, etc. et de remonter à des identifications nominatives des visiteurs d'AOL. La mise bout à bout des requêtes d'un internaute anonyme permet de lever l'anonymat. Par exemple :

AOL : Identification de l'utilisateur 4417749, le 09.08.2006 (un article du NewYork Times [un site devenu payant]), ici.
Un utilisateur a posé, durant les 3 mois de la fuite du fichier, des centaines de requêtes comme :

  • « Chien qui fait pipi partout »

  • « Taxe foncière de Harrisburg, Virginie »

  • « Solitude »

  • « Paranoïa »

  • « Thé pour une bonne santé »

  • Etc.

Ce qui a permis d'identifier nominativement une veuve de 62 ans.

Avec des outils d'espionnage avancé, comme RIOT - Rapid Information Overlay Technology - Raytheon, on accède (dont les gouvernements) à tout ce que l'on veut sur toute la population touchant au Web dans le monde (environ 5,5 milliards d'individus au monde en 2022).

# # # # # # # # # # # # # # # # # # # # # # # # # # # #