Flux RSS - La vie du site - Nouveautés et mises à jour
Assiste.com - Sécurité informatique - Décontamination - Antivirus - Protection - Protection de la Vie Privée Assiste.com - Sécurité informatique préventive - Décontamination - Antivirus - Protection - Protection de la Vie Privée

Comment Spam - Spam des zones de discussion

Dernière mise à jour : 2018-10-12T14:52 - 12.10.2018
11.04.2014 - 00h00 - Paris - (Assiste - Pierre Pinard) - Ajout d'une illustration remplaçant la précédente

Comment Spam (spam par commentaires) consiste à injecter des interventions dans tout ce qui permet des commentaires : zones de discussion sur les articles d'un site, blogs, forums de discussion, etc. ... Cette technique est utilisée pour insérer des publicités ou propager une idée, une doctrine... En optimisation du référencement dans les index des moteurs de recherche (SEO (Search Engine Optimisation)), c'est une des techniques de Spamdexing. Elle permet d'injecter un lien vers une page Web depuis des milliers de sites. Il s'agit de manipuler les pondérateurs de pertinence (tel le " PageRank " de Google) pour faire " monter " une page dans les index des moteurs de recherche.

Comment Spam - Spam des forums de discussionComment Spam - Spam des forums de discussionEcrire au Webmaster à propos de : Comment Spam - Spam des forums de discussion

Les moteurs de recherche exercent un véritable terrorisme sur les Webmasters : Les internautes cherchent - les moteurs trouvent. Mais les internautes s'arrêtent aux 10 premières réponses des moteurs de recherche : la première page de réponses.

Il faut donc absolument figurer dans ces 10 premiers résultats.

Pour ce faire, sans passer par la case " J'achète des mots clé auprès du moteur ", il n'y a qu'une solution : avoir des pages populaires.

Seulement, voila : la popularité d'une page Web ne se décrète pas. Elle est la conséquence d'un long et lent travail sur la qualité du contenu d'une page et sur le fait que de nombreux internautes s'en sont rendu compte et ont créés des liens vers cette page dans leurs sites, s'ils sont Webmasters, ou dans les zones de discussion de toutes natures où ils interviennent. La " reconnaissance " peut prendre des années.

Les cybercriminels et autres margoulins de l'Internet sont pressés. Leurs pages, où ils ventent ou vendent tout et n'importe quoi, doivent être populaires dans l'instant. Le meilleur moyen est de le faire soi-même ! Donc, on parle de soi un peu partout. Cela à deux impacts :

  1. La publicité immédiate pour cette page et son contenu.
  2. Les liens créés vers cette page depuis d'innombrables sites. Cela va donner aux moteurs de recherche l'impression que la page pointée est populaire et ils vont la faire " monter " dans leurs index.

Le Comment Spam est donc une technique de SEO (Search Engine Optimisation) consistant à bourrer les zones de discussion (dont les groupes de discussion Usenet, les Blogs, les forums, les sites, etc. ...) de liens et de mots clés vers une page Web (et recommencer pour chacune des pages du site du cybercriminels).

Le simple fait d'être inscrit sur un forum et d'ajouter un lien vers son propre site dans sa signature peut être assimilé à du "Comment Spam" et certains administrateurs de forums interdisent cela.

Origine du terme " Spam "

Le terme " Spam " est né d'une insertion publicitaire dans un groupe Usenet - lire Origine historique du terme "Spam".

Bien entendu, il n'est pas question d'insérer des millions de " commentaires " par page à promouvoir, à la main. Des logiciels robots font cela automatiquement et inondent les zones de discussion de leurs messages.

Ces robots ont besoin, dans un premier temps, de s'inscrire dans ces zones de discussion. C'est là qu'interviennent les dispositifs de protection :

Les Webmasters des sites avec zones de commentaire, des forums de discussion, des blogs, etc. ... n'aiment pas du tout voir ces squatters salir et poluer leur travail et promouvoir du viagra ou des molécules interdites ou des sites de piratages, etc. ... Ils vont se protéger de ce Comment Spam en tentant de discriminer entre les robots et l'humain, avec des Tests de Turing de la forme Challenge Message, comme les CAPTCHAs (tous percés et violés), les CAPTCHA à trier (inviolés), et, malheureusement, le populaire reCaptcha.

Comment font les gangsters du Net ?

Des robots parcours le Web, sans arrêt, à la recherche de zones de discussion. Les zones de discussion sont assez faciles à trouver. Il y a des astuces assez simples pour détecter, grâce à des requètes à des moteurs de recherche, les URL correspondant à des zones de discussion. Il est également aisé de détecter quelle est la nature de cette zone de discussion (forum de type phpBB, forum de type Invision, forum de type vBulletin, forum de type MesDiscussions, blog de tel ou tel type, etc. ...). Ces robots sont assez faciles à acheter.

Ces robots capturent toutes ces adresses automatiquement pour se constituer des listes de forums et récupèrent le classement en popularité de ces zones de discussion (pagerank de Google et indice Alexa).


Combien de zones de discussion ?

Par exemple, cliquez sur la requête Google inurl:viewtopic et vous obtenez en un quart de seconde 36 millions (oui, 36.100.000 URL, exactement, le 22.03.2007 et 194.000.000 URL le 04.05.2014) vers des fils de discussions sur des forums.

La requête Google inurl:viewforum vous dira combien de forums, utilisant ce type d'URL, sont trouvés (23 millions (23.700.000) forums le 11.05.2014!).


Ces robots s'inscrivent automatiquement sur ces millions de forums, sous un nom quelconque, généré automatiquement ou pioché dans un dictionnaire des prénoms et des patronymes, et mettent, dans leur fiche de profil, l'adresse de leur site crapuleux.

Peu importe qu'il y ait un système de validation de l'inscription par e-mail. Elle sera traitée automatiquement par le robot. Dès cet instant, le robot va inscrire des messages dans les zones de discussion (et ce n'est pas l'interval de flood (interval entre deux créations de messages, généralement fixé par l'administrateur à une valeur de 30 secondes), destiné à éviter les " poluposteurs ", qui va freiner le robot. Il a désormais tout son temps pour attaquer la zone de discussion.

Peu importe qu'il y ait ou non un système de protection par Test de Turing (captcha) - Tous les Test de Turing utilisés dans les forums sont cassés automatiquement par les robots.

La validation est automatisée par les robots, après quoi ils peuvent "poster" dans les forums et les bourrer de choses comme :


Spamdexing par Comment Spam - Tous ces messages pointaient vers un site de streaming Ils ont été créés manuellement car ce forum est protégé par un Test de Turing de type Captcha à trier, que les robots ne peuvent pas percer.
Spamdexing par Comment Spam - Tous ces messages pointaient vers un site de streaming
Ils ont été créés manuellement car ce forum est protégé par un Test de Turing de type Captcha à trier, que les robots ne peuvent pas percer.

Ces noms de domaines sont relevés tous les jours et introduits dans des listes noires de blocage. Ces listes sont offertes gratuitement et utilisables sur tous les systèmes. Voir le dossier Hosts.

Ces domaines sont également objets de commentaires et de mesures de Web Réputation qui peuvent être consultés avec des Outils de Web Réputation.

Contre mesuresContre mesures" Contre mesures "

Concernant les Webmasters, leurs sites ou blogs ou forums de discussion peuvent servir à des margoulins qui vont y insérer des liens vers leurs pages, pour les rendre populaire et violer les index des moteurs de recherche. Ces techniques de SEO crapuleuses sont combattues avec les contre-mesures au spamdexing : principe des Tests de Turing mis en oeuvre par des CAPTCHAs dont, principalement, le CAPTCHA à trier, inviolé, et le malheureusement populaire reCaptcha. Voir les liens dans le dossier SEO - Référencement.