Alertes de sécurité en cours Discussion Discussion
Faire un lien Lien
Assiste.com - Sécurité informatique - Décontamination - Antivirus - Protection - Protection de la Vie Privée Assiste.com - Sécurité informatique - Décontamination - Antivirus - Protection - Protection de la Vie Privée


Anonymisation des données issues du tracking

Dernière mise à jour : 2017-02-01T00:00 - 01.02.2017 - 00h00
16.05.2016 - 00h00 - Paris - (Assiste - Pierre Pinard) - Mise à jour

Anonymisation des données issues du tracking

Anonymisation des données issues du trackingAnonymisation des données issues du trackingAnonymisation des données issues du tracking

Sans cesse on nous dit, dans les clauses " Vie privées " (Privacy), que des données sont collectées anonymement afin de permettre aux webmasters d'améliorer leurs sites.

Même si l'on met de côté les clauses " Vie privées " (Privacy) un peu moins malhonnêtes, qui disent clairement collecter des informations nominatives et recopier intégralement nos documents (Word, Excel, Outlook, etc. ...) sur leurs serveurs, il n'est pas besoin de discours alambiqués pour affirmer que l'anonymisation est un leurre.

Le plus simple est de se pencher sur un cas qui a été très médiatisé et qui prouve que l'anonymisation des données ne sert à rien : le cas d'AOL qui, par erreur, à mis en ligne, avant de le retirer promptement, les données de tracking de quelques 658.000 internautes (environ 20 millions de données sur les recherches demandées, les liens visités, etc. ... représentant le tracking de mars, avril et mai 2006).

Le fichier a été téléchargé plusieurs fois avant qu'AOL ne l'efface.

Ceux qui l'on téléchargé l'on anonymisé (remplacement des identités réelles (nom, prénom) des utilisateurs d'AOL par un simple numéro d'identification) avant de le rendre publique.

Des chercheurs ont développé des applications de recherches dans ce fichier (AOL Search Database, Datablunder, Frogspy, etc. …).

Beaucoup de ces recherches portent sur le SEO (optimisation de l'indexation dans les moteurs de recherche). Il est intéressant de savoir quelles sont les fautes d'orthographe ou de frappe les plus souvent commises sur chaque mot utilisé en recherche, etc. ... mais certains travaux sur cette base de données ont permis de trouver, tout de même, des données comme un numéro de sécurité sociale, etc. ... et de remonter à des identifications nominatives des visiteurs d'AOL. La mise bout à bout des requêtes d'un internaute anonyme permet de lever l'anonymat. Par exemple :

Identification de l'utilisateur 4417749 :
09.08.2006 NewYork Times : ici
Un utilisateur a posé, durant les 3 mois de la fuite du fichier, des centaines de requêtes comme : “chien qui fait pipi partout”, “taxe foncière de Harrisburg, Virginie”“solitude”, “Paranoïa”“Thé pour une bonne santé”, etc. ...) ce qui a permis d'identifier une veuve de 62 ans.

Puis, avec des outils comme RIOT - Rapid Information Overlay Technology - Raytheon, on accède à tout ce que l'on veut.