Assiste.com - Sécurité informatique - Vie privée sur le Web - Neutralité d'Internet Assiste.com - Sécurité informatique - Vie privée sur le Web - Neutralité d'Internet

PageRank (Google)

PageRank (Google) - algorithme de classement des pages Web par degré de pertinance basée sur la popularité (nombre de liens). Top secret depuis le 08 mars 2016.

cr  01.04.2012      r+  21.08.2020      r-  20.04.2024      Pierre Pinard.         (Alertes et avis de sécurité au jour le jour)

Le PageRank n'est plus disponible publiquement.

La valeur publique du PageRank de Google n'est plus mise à jour depuis 2013 et n'est plus publiée du tout (secret absolu) depuis le 08 mars 2016 (modification de la Google Toolbar qui était l'unique endroit où cette information était affichée (et capturée par les outils prétendant donner le PageRank d'un site).


Larry Page et Sergey Brin, les fondateurs de Google, commencent le PageRank en 1995. Le moteur s'appelle d'abord « BackRub » avant d'être rebaptisé « Google » (un nombre quasi infini – un 1 suivi de 100 zéros).

La société Google Inc., est créée le 04 septembre 1998.

Le PageRank est la mesure, par Google, de l'importance/la valeur relative de chaque page Web du monde. Il s'agit de répondre à une question posée au moteur de recherche de Google (son nom formel est Google Search) en ne donnant pas, en vrac, toutes les pages qui en parlent (qui contiennent les mots-clés recherchés), comme le font tous les moteurs de recherche de l'époque, mais de classer les réponses en commençant par les meilleures probables.

Pour déterminer l'importance relative des pages, au début du PageRank, l'idée était que si de nombreuses pages du Web pointent, pour des mots-clés donnés, vers une même page Web, c'est qu'elle répond bien au sujet. Plus il y a de pages pointant vers elle, plus elle est populaire, plus son importance relative est élevée. Il ne suffit pas du nombre de liens pointant sur une page, il faut aussi pondérer la valeur de chaque liaison par la notoriété du site qui pointe, etc.

Les algorithmes de calcul de cette valeur sont le fondement de l'émergence puis du succès fulgurant de Google.

Le PageRank a été, un temps, affiché dans la barre d'outils de Google qu'il était possible d'installer dans tous les navigateurs Web. Tous les webmasters du monde et bien des internautes installaient cette barre d'outils, au plus grand profit de Google, les barres d'outils étant l'un des meilleurs moyens d'espionner les internautes et Google ne disposait pas encore de son propre navigateur (Google Chrome) qui n'apparaîtra que le 2 septembre 2008.

Depuis, le PageRank est bien plus compliqué et les algorithmes de calcul sont totalement secrets.

PageRank a donné lieu à des recherches effrénées des webmasters et des cybercriminels pour "pousser" leurs sites. On doit à ces recherches les fermes de liens, les fermes de contenus, le spamdexing (bourrage des forums de discussion, etc.). Google a été pris en flagrant délit de spamdexing.

Toutes ces attaques pour fausser le PageRank ont donné naissance à la lutte contre ces types de spammeurs. Google identifie désormais les fermes de liens et les fermes de contenus. Tous les sites qui s'y trouvent sont déclassés, voire totalement désindexés. Quant aux robots d'inscriptions automatiques de messages dans les forums, etc., pointant vers des sites pour faire grimper leurs PageRank, cela à donné naissance aux Captcha, reCaptcha, No Captcha reCaptcha, Captcha à trier, et autres Tests de Turing.