Alertes de sécurité en cours Discussion Discussion
Faire un lien Lien
Assiste.com - Sécurité informatique - Décontamination - Antivirus - Protection - Protection de la Vie Privée Assiste.com - Sécurité informatique - Décontamination - Antivirus - Protection - Protection de la Vie Privée

Ferme de contenu - Farming
Une technique de Spamdexing

Dernière mise à jour : 2017-04-28T00:00 - 28.04.2017
25.04.2013 - 11h40 - Paris - (Assiste - Pierre Pinard) - Mise à jour et vérification des liens.

Ferme de contenu : Site sans intérêt, ayant réponse à tout, de très mauvaise qualité, optimisé pour générer des revenus publicitaires.

Ferme de contenuFerme de contenuFerme de contenu

Les " Fermes de contenu " (" Content-Farm ") sont l'une des plaies de la recherche sur l'Internet. Il s'agit de l'une des deux grandes techniques de spamdexing (une forme d'attaque des résultats des moteurs de recherche pour fausser leurs résultats), avec les " Fermes de liens ".

Les " Fermes de contenu " sont des sites " attrappe tout " dont le but est de générer des revenus publicitaires. Ils sont à l'information ce que sont les fastfood à l'alimentation. Leur contenu éditorial ne suit pas une spécialisation (un site sur la médecine, un site sur la géologie, un site sur la sécurité informatique, etc. ...) mais suit une politique de visites maximum du site, sans privilégier ni un sujet, ni la qualité du contenu.

Les " Fermes de contenu " sont de deux types :

  1. Type 1 : " Fermes de contenu " qui n'ont rien écrit mais ont recopié, grâce à des robots, des centaines de milliers de fragments du Web de manière à répondre, pratiquement, à toutes les requêtes faites à un moteur de recherche. Les fragments traitant du même sujet (contenant le même mot clé ou la même expression clé) sont regroupés en pages optimisées pour être bien référencées par les moteurs de recherche. Les fragments sont de même nature que les fragments qu'un moteur de recherche propose (lien vers le site d'origine et extrait, à titre d'accroche, de la page où les mots clés recherchés apparaissent). Les extraits piratés sont plus longs (1000 caractères environ dans la ferme de contenu au lieu de 100 caractères environ dans les résultats des moteurs de recherche). La page générée dans le ferme de contenu ne contient que 6 à 10 résultats, automatiquement choisis à partir des sites les mieux référencés ou dont l'analyse sémantique automatique du contenu permet de calculer que l'extrait donnera un bon classement dans les moteurs de recherche. Notons que l'écriture de tels robots, et de tels générateurs de sites, relèvent de très bons informaticiens.

  2. Type 2 : " Fermes de contenu " utilisant des armées de pigistes, dans des pays à coût de la main d'oeuvre dérisoire, voire des bénévolles, à leur insu, sur la base de questions posées sur des forums (on flatte l'égo des contributeurs), pour produire du texte qui ne donne pas l'impression d'être robotisé, le but étant le même : toujours avoir des réponses, même si elles sont souvent totalement imbéciles car rédigées par des salariés ou contributeurs qui ne connaissent absolument pas le sujet sur lequel ils écrivent, aux questions les plus souvent posées et aux mots clés les plus souvent cliqués !
Astuces utilisées par les " Fermes de contenu " :
  • Le contenu des " Fermes de contenu " est totalement orienté pour répondre " présent " aux recherches les plus utilisées à un moment donné, donc ayant un potentiel de génération de revenus publicitaires important (analyses des statistiques sur les mots clés les plus utilisés, suivi de l'évènementiel comme un scandale " people ", emboîter le pas à une campagne publicitaire, etc. ...).

  • Ces sites utilisent également le principe marketing de la " longue traîne " (en anglais : " Long tail ") qui consiste à avoir une réponse à tous les mots clés possibles (mots clés distincts couvrant un spectre très large), même si ceux-ci ne génèrent que peu de visites, afin de " ratisser large " (en cas d'achat de mots clés aux enchères, ceux-ci coûtent moins cher).
Pour un habitué du Web, les " Fermes de contenu ", en particulier de " Type 1 ", se reconnaissent immédiatement (contenus brefs, souvent tronqués, voire accumulation de contenus brefs et tronqués permettant de générer de nombreuses occurences d'un mot clé, ou d'une expression clé, sur la page...), mais un néophite se fera piéger et perdra son temps. Ce genre de sites ne comportent jamais, en réalité, de contenu d'un bon niveau, est sont des nids à publicités. Les " Fermes de contenu " sont des " pièges à faire des visiteurs " pour faire de la publicité (remunérée au clic ou au % sur les ventes).

Les robots qui construisent automatiquement les " Fermes de contenu ", optimisent également le référencement pour les moteurs de recherche (SEO (Search Engine Optimisation)), et principalement pour Google. Il n'est pas rare de tomber sur des Fermes de contenu dès les tout premiers résultats (première page) d'un moteur de recherche.

Les " Fermes de contenu " sont, également, souvent construits à partir de traductions automatiques de tout et n'importe quoi, avec des robots traducteurs catastrophiques, comme " Google traduction ", ce qui donne alors des pages complètement incompréhensibles, dans un français à vomir.

Généralement, un site de type " Fermes de contenu " est reproduit plusieurs fois, parfois plusieurs dizaines de fois, sur le Web, avec des noms et des chartes graphiques différents, un robot assurant quelques différences automatiques d'un site à l'autre de manière à ne pas être détectés comme du " contenu dupliqué " (duplicate content) aux yeux des robots de détection de ce type de malversassions qui provoqueraient le déréferencement des pages, voire du site en entier.

En plus, généralement, le site de la " Fermes de contenu " est traduit automatiquement, de manière immonde, dans plusieurs langues les plus utilisées sur le Web (Anglais, Chinois, Espagnol, Japonais, Portugais, Allemand, Arabe, Français, Russe, Corréen...). On obtient donc un site automatique, reproduit automatiquement, par exemple dans 5 langues, chacun de ces 5 sites étant reproduit automatiquement sous une dizaine de noms et de chartes graphiques, soit 50 sites sans contenu d'intérêt, mais squattant les réponses des moteurs de recherche !

Fin des " Fermes de contenu "Fin des " Fermes de contenu "Fin des " Fermes de contenu "

Depuis début 2011, et sous la pression des internautes exédés par les " résultats " imbéciles obtenus pour certaines recherches, Google n'apprécie plus du tout ce type de sites, même s'ils utilisent massivement la régie publicitaire de Google. Ces sites sont purement et simplement déréférencés (renvoyés dans le fin fond des résultats de recherches). Ce déréférencement a commencé avec la version de février 2011, appelée " Panda ", de l'algorithme de classement (Ranking) de Google (quelques cafouillages de Panda ont, au début, pénalisés par erreur des sites légitimes).

Exemples de " Fermes de contenu "Exemples de " Fermes de contenu "Exemples de " Fermes de contenu "

Exemples d'énormes " Fermes de contenu ". Ces fermes ont muté depuis l'algorithme Panda de Google, en février 2011. Ces sites sont construits pour suivre de près ce que les internautes recherchent et pour créer du contenu quelconque qui corresponde, apparemment, à ces recherches :
Autres " Fermes de contenu "

Un site qui ne se cache même pas d'être une ferme de contenu et comporte un formulaire pour inciter n'importe qui à écrire un sujet sur n'importe quoi.
Un site qui ne se cache même pas d'être une ferme de contenu et comporte
un formulaire pour inciter n'importe qui à écrire un sujet sur n'importe quoi.
(Site existant encore : dernière vérification le 25.04.2013)

Vidéo - " Fermes de contenu " et SEO (Optimisation pour Moteurs de Recherche)Vidéo - " Fermes de contenu " et SEO (Optimisation pour Moteurs de Recherche)Vidéo - " Fermes de contenu " et SEO (Optimisation pour Moteurs de Recherche)

SEO (Search Engine Optimisation - Optimisation pour Moteurs de Recherche).

Enregistrement d'un atelier débat, en anglais, lors du SMX (Search Marketing Expo) du 8 mars 2011 à San Jose (Californie). La vidéo est constituée, pour l'essentiel, de plans fixes (slides).

Modérateur : Matt McGee
Modérateur Q&R : Max Thomas, President de Thunder SEO

Orateurs :
Luke Beatty, Vice President & General Manager, Yahoo! Contributor Network, Yahoo!
Matthew Brown, Founder, AudienceWise
Byrne Hobart, Marketing Consultant, Blue Fountain Media
Gil Reich, VP of Product Management, Answers.com
Tim Ruder, Chief Revenue Officer, PerfectMarket

Chargement...

Atelier / débat en anglais, avec quelques slides

RéférencesRéférencesRéférences


RessourcesRessourcesRessources


Requêtes similairesRequêtes similairesRequêtes similaires