Assiste.com - Sécurité informatique - Vie privée sur le Web - Neutralité d'Internet

cr  11.04.2014      r+  12.01.2024      r-  20.04.2024      Pierre Pinard.         (Alertes et avis de sécurité au jour le jour)

« Comment spam » est une forme de « spamdexing » utilisant les « Zones de commentaires » et les « Zones de discussions ».

Les moteurs de recherche exercent un véritable terrorisme sur les auteurs de sites Web (les webmasters). Ils référencent ou déréférencent les sites, les classent, les déclassent, etc.

  • Les webmasters écrivent, dans leurs pages Web ou zones de discussion, ce qui constitue le fond documentaire de l'Internet, soit :

    • En sachant eux-mêmes de quoi ils parlent : envie de diffuser le savoir.

    • En donnant aux sachants les moyens de constituer ce fond documentaire ou d'y contribuer (par exemple Wikipédia ou Doctissimo).

  • Les internautes cherchent.

  • Les moteurs de recherche répondent. Leurs réponses désignent des contenus du fond documentaire. Mais les moteurs de recherche ne sont pas des sachants. Ils ne savent rien. Tout ce qu'ils savent faire est de :

    1. Remarquer que tel contenu semble appartenir à tels genre ou sujet par l'analyse des mots utilisés (les mots-clés).

    2. Remarquer que tel document (site Web ou page d'un site Web ou fil de discussion d'une zone de discussion) est de plus ou moins nombreuses fois pointé (liens entrants) par d'autres sites Web ou zones de discussion.

    3. Remarquer que les liens entrants proviennent de sites Web ou zones de discussion plus ou moins « de référence » (notés de 0,000 à 10,000) dans le même domaine (sur le même sujet). Chaque moteur de recherche passe sa vie, 24/24 7/7, à noter puis classer tous les sites Web et zones de discussion du monde, entre autres en fonction du nombre et de la qualité des liens entrants. Chaque moteur de recherche met ainsi à jour, chaque jour, le classement de tous les sites Web du monde :

      • Par sujet (un site Web peut couvrir de très nombreux sujets).

      • Dans l'ordre décroissant de pertinence calculée (estimée).


La « Pertinence décroissante » est le chef d'oeuvre que :




Le terme « Spam » est né d'une insertion publicitaire, le 17 janvier 1994, dans un groupe de discussion Usenet - lire Origine historique du terme « Spam ». Textuellement, le « Spam », c'est de la « merde ».




Les internautes s'arrêtent aux 10 premières réponses des moteurs de recherche (leur première page de réponses). Dans le monde numérique, il faut aller toujours plus vite et les moteurs de recherche pensent pour vous (enfin... leurs algorithmes). Les internautes ne vont que rarement fouiller dans les autres réponses, plus loin, plus bas, considérées (c'est devenu un réflexe) comme moins pertinentes (ciblage comportemental).

Il faut donc absolument figurer dans ces 10 premiers résultats. Il faut que les calculs des moteurs de recherche les conduisent à un estimer que :

  • Pour la question posée, tel site Web EST PERTINENT.

  • Pour la question posée, telle page Web EST PERTINENTE.

  • Pour la question posée, telle conversation dans telles zones de discussion EST PERTINENTE.




Pour ce faire, sans passer par la case « J'achète des mots-clés auprès des moteurs de recherche » (marketing payant), il n'y a qu'une solution :

Seulement, voilà : la popularité d'une page Web ne se décrète pas. Elle est la conséquence d'un long et lent travail sur la qualité de son contenu et sur le fait que de nombreux internautes s'en sont rendu compte et ont créé des liens vers cette page :

La « reconnaissance » peut prendre des années.

Les cybercriminels et autres margoulins de l'Internet sont pressés. Leurs pages, où ils vantent ou vendent tout et n'importe quoi, doivent être populaires dans l'instant. Le moyen le moins disant est de le faire soi-même ! Donc, on parle de soi un peu partout. Cela à deux impacts :

  1. La publicité immédiate pour cette page et son contenu.

  2. Les liens créés vers cette page depuis d'innombrables sites Web. Cela va donner aux moteurs de recherche l'impression que la page Web pointée est populaire et ils vont la faire « monter » dans leurs index.

Cela s'appelle le « Comment Spam ».

De grands pratiquants sont, par exemple, les marabouts. (cela ne leur coûte pas cher puisqu'il y a tellement d'argent à escroquer.)




Le « Comment Spam » est donc une technique de SEO (Search Engine Optimization) consistant à bourrer un maximum de zones de discussion avec des liens et des commentaires contenant des mots-clés vers la page Web ou le site Web dont on souhaite propulser le référencement et donc le classement par les moteurs de recherche.

Le faire à la main est fastidieux d'autant qu'il faut :

  1. Trouver des zones de discussion.

  2. S'inscrire manuellement dans chacune d'elles avec, chaque fois :

    1. Un identifiant (plutôt légèrement différent chaque fois).

    2. Une adresse courriel (différente chaque fois, mais il y a des astuces avec des services générateurs d'adresses courriel à la volée (adresses e-mail jetables) dont l'adresse retour est redirigée vers une adresse unique cachée des zones de discussion spammées.).

    3. Attendre la demande de confirmation d'inscription de la zone de discussion ciblée.

    4. Confirmer son inscription.

  3. Rédiger un texte (plutôt légèrement différent chaque fois) et rédiger dans différentes langues selon la couverture Web souhaitée.

  4. Poster le spam dans la zone de discussion ciblée.

Si le « Comment Spam » concerne la promotion d'un article (d'une page) en particulier, il faut recommencer pour chacune des pages Web à promouvoir (ce qui améliore le positionnement global du site lui-même).




Cet exemple de Spamdexing utilise une technique de SEO appelée Comment Spam.



Cette capture d'écran montre une foule de « Comment Spam », injectés dans les forums de discussion d'Assiste.com, par quelqu'un cherchant à rendre populaire son site pour plusieurs raisons, chacune ayant son propre message publicitaire.

Tous ces messages pointaient vers un site de streaming. Ils ont été créés manuellement, car ce forum est protégé par un « Test de Turing » de type « Captcha à trier », que les robots de spamdexing ne peuvent pas percer.




Parce que l'on s'adresse à des moteurs de recherche et qu'ils savent parfaitement bien détecter le « Comment Spam » qui n'est, pour eux, rien moins que du spamdexing dans des « Zones de commentaires » et une tentative de les violer.

Par exemple, Google a été pris à son propre spamdexing par ses propres algorithmes. Google vient de pondre son navigateur Web, Google Chrome, et tente une opération de promotion en spammant des blogs. Son algorithme détecte qu'il s'agit d'un spamdexing de la forme « Comment Spam » et diminue le classement (PageRank) de ses propres pages sur son propre Google Chrome dans son propre moteur de recherche ! Outre l'anecdote, on retiendra que Google tient à un référencement non manipulé (sincérité de son moteur de recherche) et a même mis en ligne une page de dénonciation des spamdexings, hameçonnages et malveillances.

Le simple fait de s'inscrire sur un forum et d'ajouter dans sa signature un lien vers un site que l'on souhaite soutenir peut être assimilé à du « Comment Spam ». Certains administrateurs de forums interdisent la présence de liens dans les signatures.