Assiste.com - Sécurité informatique - Vie privée sur le Web - Neutralité d'Internet

cr  01.01.2012      r+  22.10.2024      r-  22.10.2024      Pierre Pinard.         (Alertes et avis de sécurité au jour le jour)

Sans cesse, les clauses obligatoires « Vie privée » (Privacy) de tout ce à quoi l'on accède sur le Web nous disent que des données sont collectées « anonymement » afin de permettre aux webmasters d'améliorer leurs sites Web et au modèle économique d'un Web gratuit de rémunérer, par la publicité ciblée (comportementale), sur la base du profilage, les sites Web qui, sinon, basculent dans un modèle payant.

Même si l'on met de côté les clauses « Vie privée » (Privacy) un peu moins malhonnêtes, qui disent clairement collecter des informations nominatives et recopier intégralement nos documents (Word, Excel, Outlook, etc.) sur leurs serveurs et dans les clouds, il n'est pas besoin de discours alambiqués pour affirmer que l'anonymisation est un leurre.

Quelles sont les données collectées ?

  • Liste des données privées officiellement collectées (révélation malheureuse de Microsoft).

  • Un autre cas, très médiatisé, prouve que l'anonymisation prétendue des données est un mensonge : le cas d'AOL qui, par erreur, a mis en ligne, avant de le retirer promptement, les données de tracking (espionnage) de quelques 658.000 internautes (environ 20 millions de données sur les recherches demandées, les liens visités, etc. représentant le tracking de mars, avril et mai 2006). Le fichier a été téléchargé plusieurs fois avant qu'AOL ne l'efface. Ceux qui l'on téléchargé l'on anonymisé (remplacement des identités réelles des utilisateurs d'AOL par un simple numéro d'identification) avant de le rendre public.

Des chercheurs ont développé des applications de recherches dans ce fichier (AOL Search Database, Datablunder, Frogspy, etc.)

Beaucoup de ces recherches portent sur le SEO (optimisation de l'indexation dans les moteurs de recherche). Il est intéressant de savoir quelles sont les fautes d'orthographe ou de frappe les plus souvent commises sur chaque mot utilisé en recherche, etc., mais certains travaux sur cette base de données ont permis de trouver, tout de même, des données comme un numéro de sécurité sociale, etc. et de remonter à des identifications nominatives des visiteurs d'AOL. La mise bout à bout des requêtes d'un internaute anonyme permet de lever l'anonymat. Par exemple :

AOL : Identification de l'utilisateur 4417749, le 09.08.2006 (un article du NewYork Times [un site devenu payant]), ici.
Un utilisateur a posé, durant les 3 mois de la fuite du fichier, des centaines de requêtes comme :

  • « Chien qui fait pipi partout »

  • « Taxe foncière de Harrisburg, Virginie »

  • « Solitude »

  • « Paranoïa »

  • « Thé pour une bonne santé »

  • Etc.

Ce qui a permis d'identifier nominativement une veuve de 62 ans.



Avec des outils d'espionnage avancé, comme RIOT - Rapid Information Overlay Technology - Raytheon, on accède (dont les gouvernements) à tout ce que l'on veut sur toute la population touchant au Web dans le monde (environ 5,5 milliards d'individus au monde en 2022).



  • Anonymisation des données issues du tracking

    Anonymisation des données issues du tracking - Ressources spécifiques

    Ressources externes sur ce sujet Anonymisation des données issues du tracking


    1. Wikipedia (EN) : 2006 : AOL publie des requêtes utilisateurs avec des données permettant de les identifier



    Les encyclopédies

    1. Encyclopédie des termes et concepts informatique et Internet # Liste

    2. Encyclopédie des acronymes, sigles et abréviations # Liste

    3. Encyclopédie de la terminologie officielle française # Liste

    4. Encyclopédie de la terminologie Warez, DDL et P2P # Liste