Assiste.com - Sécurité informatique - Vie privée sur le Web - Neutralité d'Internet Assiste.com - Sécurité informatique - Vie privée sur le Web - Neutralité d'Internet

Filtres bayésiens

Filtres bayésiens : Outils déterministes utilisant le théorème de Bayes sur les probabilités pour détecter les courriers indésirables (spam).

cr  01.01.2012      r+  21.08.2020      r-  20.04.2024      Pierre Pinard.         (Alertes et avis de sécurité au jour le jour)

En informatique, et essentiellement en communications de messageries Internet, les filtres bayésiens sont des filtres utilisés dans la lutte contre le spam, basés sur une méthode mathématique (probabiliste) de détection des courriers indésirables exploitant la distribution statistique de mots-clés et donnant d'excellents résultats et très peu de fausses détections.

Le client de messagerie de Mozilla (le courrielleur Thunderbird) utilise des filtres bayésiens (outil "junk"). Cette méthode a été popularisée par Paul Graham lors d'un premier communiqué d'août 2002, revu et corrigé depuis. On lira avantageusement ses communiqués et d'autres documents sur ce sujet :
http://www.paulgraham.com/spam.html
http://www.paulgraham.com/better.html

Dans le genre des filtres bayésiens d'e-mail, il y en a deux remarquables :

  • SpamAssassin dans le monde Unix/Linux (il existe une implémentation pour client Windows sous le nom de SAproxy (pour Bloomba | Eudora | Netscape | Outlook 2000 | Outlook 2002 | Outlook Express | Pegasus et autres)

  • SpamPal dans le monde Windows, qui dispose d'un plug-in de filtres bayésiens

SpamAssassin (SAproxy) et SpamPal utilisent des filtres à base de règles classiques et, surtout et simultanément, des filtres bayésiens (et d'autres technologies comme les listes noires (Outils de consultations en ligne des listes noires (blacklists)) de blocage d'adresses IPs de serveurs de messagerie, maintenues en temps réel - les RBL (Realtime Blocking Lists)).

Les filtres bayésiens nécessitent une phase d'apprentissage (au moins 1000 spams et 1000 courriers légitimes vérifiés par l'utilisateur) puis le taux de réussite peut alors atteindre, pour certains, plus de 99% et les fausses alarmes (faux positifs) un taux marginal).

Thunderbird (et Mozilla Mail, le client de messagerie de feu Mozilla Suite, devenu SeaMonkey), gratuits, sont d'excellents clients de messagerie pour mail et newsgroup (forums de discussion), bien supérieurs en tous points (fiabilité, robustesse, vitesse, confort, sécurité, etc.) à leur concurrent Outlook (dans le monde Windows). Thunderbird et Mozilla Mail utilisent des filtres à règles, classiques, et des filtres bayésiens.

Pour en savoir plus sur les filtres bayésiens, en français, lire, sur ce site, l'article : Filtres bayésiens - Livre blanc.




Les filtres bayésiens utilisés contre le spam sont une application simple et « grand public » du « théorème de Bayes » (Thomas Bayes – 1702 / 1761). Bien d'autres usages de ce théorème existent, plus profonds, puisqu'il s'agit de probabilités et statistiques. Un exemple en est donné dans la saison 04, épisode 04, de la série policière « Balthazar » (minute 45 :40 à 46:43 et explications 47:36 à 48:08).

]

Dossier (collection) : Spam et anti-spam

Dossier : Spam et anti-spam
Dossier : Fraude 419 et son lot de spam

Courriel
e-mail
Pièce jointe
Script
AVCheck
Client de messagerie
Webmail
Types « MIME »
MTA (Mail Transfer Agent)
Fraudes
Arnaques
Usurpation d'identité

Protégez votre adresse e-mail
SpamGournet - e-mail jetable recommandée
Services d'adresses e-mail jetables
e-mail abuse@domaine.tld
Adresses e-mail spéciales (adresses rôle)

Spam - Qu'est-ce que c'est ?
Spam - Origine du terme "Spam"
Spam - Propagation classique
Spam - Propagation virale
Spam - Constitution de fichiers d'adresses
Spam - Contourner les filtres anti-spam
Spam - Harvester (moisonneuses d'adresses eMail)
Spam - Phishing - pèche aux données secrètes
Spam Nigérien - Fraude 419
Spam - Volume du spam mondial 1
Spam - Volume du spam mondial 2
J'ai reçu un spam - Que dois-je faire ?
Spam - Détecter un canulard (hoax)
Spam - Détecter un phishing
Spam - Détecter un spam
Ingénierie sociale - Tirer les vers du nez
Monty Python's Flying Circus - Vidéo
Le virus PebCak
Le Safe CEx

Anti-spam actifs
Filtres bayésiens
Filtres bayésiens - Livre blanc

En marge du spam, le Mail-bombing
Mail-bombing
Mail-bomber (logiciels et outils de Mail-bombing)
Mail-bomb
Joe Job Attack