Alertes de sécurité en cours Discussion Discussion
Faire un lien Lien
Assiste.com - Sécurité informatique - Décontamination - Antivirus - Protection - Protection de la Vie Privée Assiste.com - Sécurité informatique - Décontamination - Antivirus - Protection - Protection de la Vie Privée

Spamdexing

Dernière mise à jour : 2017-04-28T00:00 - 28.04.2017
18.06.2013 - 00h00 - Paris - (Assiste - Pierre Pinard) - Mise à jour de notre article antérieur (versions 1997-2007)

Le Spamdexing consiste, pour un éditeur d'un site Internet ou un vendeur d'un produit ou service (logiciel, fer à repasser, etc. ...), à "occuper le terrain" (squatter le terrain - bourrer le Web) de mots clés afin de vous "capturer" lors de vos recherches pour vous diriger vers ses pages. Cela consiste donc à tenter de manipuler les pondérateurs de pertinence des moteurs de recherche.

SpamdexingSpamdexingEcrire au Webmaster à propos de : Spamdexing

Soyez vigilent avec ce que vous trouvez dans un moteur de recherche.

Assiste.com a pour vocation la sécurité des systèmes d'information et la protection de la vie privée sur l'Internet. A ce titre, il convient de vous mettre en garde, par l'information, et de vous protéger, par l'éveil de la vigilance et, accessoirement, par des outils (Web Réputation, Listes noires, etc. ...), contre une technique de référencement des sites, dans les moteurs de recherche, qui peut vous conduire vers des pièges ou des produits ou services de faible ou mauvaise qualité.

L'internaute cherche, le moteur trouve.

Pour que le moteur mette en haut de sa liste de trouvailles, son " index ", un produit ou un service donné, il y a deux méthodes :

  1. Acheter du trafic
    Acheter, auprès du moteur de recherche, des mots clé. C'est, par exemple, le service Google Adwords, de la régie publicitaire de Google, la première au monde et de très loin, qui permet d'acheter du trafic. Le produit ou service apparaîtra en haut à droite des résultats de recherche ou en haut de la liste des réponses du moteur (liens publicitaires difficiles à séparer des liens normaux, bien qu'un avertissement soit obligatoire (mais quasi invisible)).
  2. Avoir naturellement du trafic
    Avoir un très bon contenu vers lequel de nombreux autres sites pointent (font un lien). Les moteurs de recherche considèrent que, si de nombreux sites pointent vers une même page du Web, c'est que celle-ci est de bonne qualité : la page est pertinente pour le sujet qu'elle traite. Cet indice de pertinence, inventé par Google, et repris depuis par les autres moteurs de recherche, est appelé " PageRank " chez Google. Il est impératif, pour les Webmasters ne désirant ou ne pouvant pas acheter du trafic, d'avoir des pages " populaires " et donc d'avoir de nombreux liens pointant vers ces pages. Si le contenu n'est pas pertinent, le seul moyen de le rendre apparemment pertinent, au sens de " PageRank ", et de bourrer le Web de liens vers ses propres pages. Ceci permet de manipuler l'index de Google. C'est le Spamdexing.

Le Spamdexing consiste à "occuper le terrain" (squatter le terrain) du Web - à "améliorer" le classement de son site dans les moteurs de recherche (dans Google, etc. ...), en trompant les dispositifs de recherche de pertinence des résultats, afin de faire " monter " une page dans l'index des moteurs pour que vous tombiez dessus lors de vos recherches. En gros, il faut apparaître dans les 10 premiers dans un moteur de recherche (or Google traite plus de 90% des requêtes en recherche).

Ces techniques d'optimisation (Search Engine Optimization (SEO)) servent à promouvoir des pages Web qui ne possèdent pas les qualités naturelles pour être populaire (elles n'ont pas d'intérêt).

Normalement, seule la qualité du contenu d'une page Web doit servir à son classement. Malheureusement, il est impossible aux moteurs de recherche d'employer des centaines de milliers d'humains pour juger et classer toutes les pages Web du monde : ils y en a des centaines de milliards. Des milliers de nouveaux sites naissent chaque jour et des millions de pages sont créées ou mises à jour chaque minute. Seul le crowdsourcing bénévole le permettrait. Deux expériences de crowdsourcing bénévole sont remarquables :

  1. Le projet Open Directory - Dmoz est une tentative de classement à la main, par des milliers de bénévoles, de certains sites, (ceux qui en font la demande - gratuitement), par catégorie et ordre alphabétique dans la catégorie (sans classement par pertinence - site cool). Les sites peuvent être refusés au référencement et, en tout état de cause, il faut parfois plusieurs mois avant d'y être référencé.
  2. Le moteur de recherche Blekko, de Rich Skrenta.

Les techniques de SpamdexingLes techniques de SpamdexingEcrire au Webmaster à propos de : Les techniques de Spamdexing

Dans les techniques de Spamdexing, on y trouve :

Google dans le colimateur des auteurs de spamdexingGoogle dans le colimateur des auteurs de spamdexingEcrire au Webmaster à propos de : Google dans le colimateur des auteurs de spamdexing

Pourquoi les techniques d'indexation de Google sont plus spécialement visées?

Parce Google est le plus important moteur de recherche, de très loin, directement ou indirectement (en plus, Google fourni ses résultats à de nombreux autres moteurs de recherche) et parce que Google est l'inventeur de cette technique qui permet de vous répondre, lorsque vous faites une recherche, d'une manière que Google croit "intelligente - pertinente" : le "PageRank".

Google vous propose une liste de pages Web parlant du sujet sur lequel vous faites une recherche, mais Google ne vous propose pas cette liste "en vrac". Il la classe selon un indice de pertinence et les pages qui apparaissent en premier lui semble les plus pertinentes.

Tout le problème du Spamdexing vient de là ! Comment faire croire à Google qu'une page est pertinente ? Les autres moteurs de recherche sont marginaux et ne comptent pas.

Spamdexing et pertinence

Pour qu'une page Web soit "pertinente" sur un sujet donné (par exemple "sécurité informatique" ou "énergies renouvelables" etc. ...), aux yeux de Google, il faut que de nombreux autres sites pointent (aient un lien) à propos de ce sujet vers cette page. Google pense alors que, puisque tout le monde parle de cette page, elle est "populaire", c'est donc une bonne proposition de consultation à faire à celui qui fait une recherche sur le même sujet. Donc les webmasters (les auteurs de sites Internet) ont développé des techniques pour populariser leurs sites ou portail de e-commerce (car, s'il n'y a pas d'argent au bout, cela n'a pas d'intérêt - sauf, peut-être, l'orgueil qui motive certains).

Nota
La pertinence ne se limite pas à la présence de liens : elle est pondérée par la popularité du site qui pointe vers un page Web. Ainsi, lorsque Microsoft.com pointe vers une page d'Assiste.com, cela a plus d'importance, au sens du " PageRank " de Google (car le domaine Microsoft.com est extrêmement populaire), qu'un lien pointant vers la même page d'Assiste.com, mais provenant d'un micro site personnel sans popularité.

 

Comment je me fais avoirComment je me fais avoirComment je me fais avoir

Vérifiez la Web Réputation d'un site.
Vérifiez sa présence dans une Liste noire.
Recherchez le produit ou service et lisez les commentaires des internautes.
Réfléchissez d'abord, cliquez ensuite.

Contre mesuresContre mesures" Contre mesures "

Concernant l'internaute, la contre-mesure relève de son niveau de vigilance.

Concernant les Webmasters, leurs sites ou blogs ou forums de discussion peuvent servir à des margoulins qui vont y insérer des liens vers leurs pages, pour les rendre populaire et violer les index des moteurs de recherche. Ces techniques de SEO crapuleuses sont combattues avec les contre-mesures au spamdexing : principe des Tests de Turing mis en oeuvre par des CAPTCHAs dont, principalement, le CAPTCHA à trier, inviolé, et le malheureusement populaire reCaptcha. Voir les liens dans le dossier SEO - Référencement.

RéférencesRéférences" Références "

RessourcesRessources" Ressources "

 Requêtes similairesRequêtes similaires" Requêtes similaires "