Flux RSS - La vie du site - Nouveautés et mises à jour
Assiste.com - Sécurité informatique - Vie privée sur le Web - Neutralité d'Internet Assiste.com - Sécurité informatique - Vie privée sur le Web - Neutralité d'Internet

Spamdexing - bourrage de liens vers quelque chose

Spamdexing : consiste, pour un éditeur de site Web ou un vendeur de produit ou service (logiciel, fer à repasser, régime pour maigrir, etc.), à bourrer les forums et réseaux sociaux de liens pointant vers son produit afin de manipuler les pondérateurs de pertinence des moteurs de recherche.

Soyez vigilant avec les réponses à vos questions dans les moteurs de recherche. Le Spamdexing consiste à manipuler les résultats (SEO - Search Engine Optimization - Optimisation pour moteurs de recherche) pour apparaître dans les premiers, voire le premier.

Les moteurs de recherche considèrent que si le contenu d'une page Web est de nombreuses fois référencé par de nombreux liens pointant vers lui dans de nombreux sites et forums, c'est que ce contenu est pertinent pour le sujet traité.

Le jeu consiste donc, pour les margoulins, à bourrer les forums, blogs, réseaux sociaux, etc. de liens pointant vers ce qu'ils souhaitent pousser. Ce peut être n'importe quoi : cigarettes de contrebande, faux papiers, faux diplômes, prêt de particulier à particulier, molécules interdites, Viagra, fausse monnaie, escroqueries en tout genre, etc.

Un antivirus du nom de SpyHunter, par exemple, joue à ce jeu avec des centaines de sites Web satellites de son site, chacun pointant des centaines de milliers de fois vers cet antivirus, ce qui fait qu'il apparaît toujours en premier dans les moteurs de recherche.

Renseignez-vous et protégez-vous, par l'éveil de votre vigilance et avec des outils (Web Réputation, etc.).

L'internaute cherche, le moteur trouve.

Pour être dans les premiers d'un moteur de recherche, il y a deux méthodes :

  1. Acheter du trafic

    Acheter, auprès du moteur de recherche, des mots-clés. C'est, par exemple, le service Google Adwords, de la régie publicitaire de Google, la première au monde et de très loin, qui permet d'acheter du trafic. Le produit ou service apparaîtra en haut à droite des résultats de recherche ou en haut de la liste des réponses du moteur (liens publicitaires difficiles à séparer des liens normaux, bien qu'un avertissement soit obligatoire (mais quasi invisible)).

  2. Avoir naturellement du trafic

    Avoir un très bon contenu vers lequel de nombreux autres sites pointent (font un lien). Les moteurs de recherche considèrent que, si de nombreux sites pointent vers une même page du Web, c'est que celle-ci est de bonne qualité : la page est pertinente pour le sujet qu'elle traite. Cet indice de pertinence, inventé par Google, et repris depuis par les autres moteurs de recherche, est appelé « PageRank » chez Google (classement autrefois public et, désormais, totalement secret depuis le 08 mars 2016). Il est impératif, pour des Webmasters ou des marchands ne désirant ou ne pouvant pas acheter du trafic, d'avoir des pages « populaires » et donc d'avoir de nombreux liens pointant vers ces pages. Si le contenu n'est pas pertinent, le seul moyen de le rendre apparemment pertinent, au sens du « PageRank », et de bourrer le Web de liens vers ses propres pages. Ceci permet de manipuler l'index de Google. C'est le Spamdexing.

Le Spamdexing consiste à occuper le terrain (squatter le terrain) du Web afin d'améliorer le classement de l'objet à promouvoir dans les moteurs de recherche (dans Google, etc.), en trompant les dispositifs de recherche de pertinence des résultats, afin de faire « monter » une page dans l'index des moteurs pour que vous tombiez dessus lors de vos recherches. En gros, il faut apparaître dans les 10 premiers dans un moteur de recherche (or Google traite plus de 90% des requêtes en recherche).

Ces techniques d'optimisation (SEO - Search Engine Optimization) servent à promouvoir des pages Web qui ne possèdent pas les qualités naturelles pour être populaires (elles n'ont pas d'intérêt).

Normalement, seule la qualité du contenu d'une page Web doit servir à son classement. Malheureusement, il est impossible aux moteurs de recherche d'employer des centaines de milliers d'humains pour juger et classer toutes les pages Web du monde : il y en a des centaines de milliards. Des milliers de nouveaux sites naissent chaque jour et des millions de pages sont créées ou mises à jour chaque minute. Seul le crowdsourcing bénévole le permettrait. Deux expériences de crowdsourcing bénévole sont remarquables :

  1. Le projet Open Directory - Dmoz est une tentative de classement à la main, par des milliers de bénévoles, de certains sites (ceux qui en font la demande - gratuitement), par catégorie et ordre alphabétique dans la catégorie (sans classement par pertinence - site cool). Les sites peuvent être refusés au référencement et, en tout état de cause, il faut parfois plusieurs mois avant d'y être référencé. Assiste.com y est référencé.
    Dmoz n'existe plus, mais une archive est maintenue en ligne.

  2. Le moteur de recherche Blekko, de Rich Skrenta.
    Blekko n'existe plus, racheté par IBM.

Spamdexing - Les techniques de Spamdexing

Dans les techniques de Spamdexing, on y trouve :

Spamdexing - Les techniques de Spamdexing

Pourquoi les techniques d'indexation de Google sont plus spécialement visées?

Parce que Google est le plus important moteur de recherche, de très loin, directement ou indirectement (en plus, Google fourni ses résultats à de nombreux autres moteurs de recherche) et parce que Google est l'inventeur de cette technique qui permet de vous répondre, lorsque vous faites une recherche, d'une manière que Google croit « intelligente - pertinente » : le « PageRank ».

Google vous propose une liste de pages Web parlant du sujet sur lequel vous faites une recherche, mais Google ne vous propose pas cette liste en vrac. Il la classe selon un indice de pertinence et les pages qui apparaissent en premier lui semblent les plus pertinentes.

Tout le problème du Spamdexing vient de là ! Comment faire croire à Google qu'une page est pertinente ? Les autres moteurs de recherche sont marginaux et ne comptent pas.

Spamdexing - Google dans le colimateur des auteurs de spamdexing

Pour qu'une page Web soit « pertinente » sur un sujet donné (par exemple « sécurité informatique » ou « énergies renouvelables », etc.), aux yeux de Google, il faut que de nombreux autres sites pointent (aient un lien) vers cette page. Google pense alors que, puisque tout le monde parle de cette page, elle est « populaire », c'est donc une bonne proposition de consultation à faire à celui qui fait une recherche sur le même sujet. Donc les webmasters (ou les auteurs de trucs à promouvoir, y compris et surtout les virus, etc.) ont développé des techniques pour populariser leurs trucs (car, s'il n'y a pas d'argent au bout, cela n'a pas d'intérêt - sauf, peut-être, l'orgueil qui motive certains ou les influences du moment en période d'élections, etc.).

Nota
La pertinence ne se limite pas à la présence de nombreux liens vers un objet : elle est pondérée par la popularité du site qui pointe vers cet objet. Ainsi, lorsque Microsoft.com pointe vers une page d'Assiste.com, cela a plus d'importance, au sens du « PageRank » de Google (car le domaine Microsoft.com est extrêmement populaire), qu'un lien pointant vers la même page d'Assiste.com, mais provenant d'un micro site personnel sans popularité.

Spamdexing - Spamdexing et pertinence

Concernant les Webmasters, leurs zones de conversation (forums de discussion, etc.) peuvent servir à des margoulins qui vont y insérer des liens vers leurs objets promouvoir, pour les rendre populaires et violer/tromper les algorithmes de classements utilisés par les moteurs de recherche. Ces techniques de SEO crapuleuses sont combattues avec les contre-mesures au spamdexing : principe des Tests de Turing mis en oeuvre par des Captchas dont, principalement, le Captcha à trier, inviolé, et le malheureusement populaire reCaptcha. Voir les liens dans le dossier SEO - Référencement.

Spamdexing - Mesures préventives

Outils d'investigations pour chercheurs


Investigations sur « Spamdexing »Investigations sur « Spamdexing »Investigations sur « Spamdexing »