Petite mise en contexte :
J'utilise régulièrement une dizaine d'adresses mails. Parmi celles-ci, il y en a notamment une qui me sert de catch-all pour plusieurs domaines, et une autre utilisée en clair depuis plus de huit ans, notamment sur des newsgroups.
Tout ceci me permet de recevoir entre 100 et 250 SPAMs par jour.
Afin de filtrer tout cela, j'avais demandé à mon client mail (Kmail) d'utiliser SpamAssassin.
Grosse déception : celui ci ne détectait guère plus de 40 % du SPAM, et trouvait régulièrement des faux positifs, notamment sur des lettres d'informations en HTML.
Pendant plus d'un an, j'ai chassé les 60 % de SPAM restant avec des filtres perso. Mais il me restait toujours une dizaine de SPAM par jour qui échappaient aux différentes règles.
Il y a deux semaines, j'ai décidé de tester Bogofilter, en lieu et place de SpamAssassin.
Je lui ai donc donné en apprentissage les 30000 SPAMs qui trainaient dans un répertoire, et en temps que mails "OK", quelques milliers de mails issus de mailing-liste diverses.
Et là, très bonne surprise : suivant les jours, de 98 à 100% de mes SPAMs sont détectés par Bogofilter, et pas un seul faux positif en deux semaines !
Conclusion : Bogofilter, c'est bien !
SpamAssassin : http://spamassassin.apache.org/
Bogofilter : http://bogofilter.sourceforge.net/
# Rhâââ
Posté par Xavier Teyssier (site web personnel) . Évalué à 6.
s/à/au/
# Gourmand Bogofilter ?
Posté par Tonton Benoit . Évalué à 3.
Bogofilter fait-il mieux de ce coté ?
[^] # Re: Gourmand Bogofilter ?
Posté par Damien Gombault (site web personnel) . Évalué à 2.
Je crois qu'il y a la possibilité de faire fonctionner une partie de Spamassassin en daemon. Cela évite de devoir recharger les librairies Perl quand de nouveaux mails sont arrivés dans la boîte puis filtrés par Spamassassin.
Je crois que j'avais essayé, mais que finalement ça ne changeait pas grand chose.
Depuis que je suis passé à Bogofilter, je n'ai plus ce problème de lenteur. J'ai également constaté que Bogofilter m'offrait de meilleurs résultats que Spamassassin.
Cependant, je n'avais pas cherché très longtemps pour configurer Spamassassin afin d'obtenir les meilleures performances possibles au niveau du filtrage.
[^] # Re: Gourmand Bogofilter ?
Posté par jch . Évalué à 3.
Avec Bogofilter, je n'ai pas de gros problèmes de performances et il ne laisse pas passer grand chose. Par contre, les premiers temps, sûrement à cause de la faiblesse de l'échantillon que j'avais utilisé pour son entrainement initial, Bogofilter avait renvoyé deux ou trois faux positifs.
Celà dit, ces deux programmes ne sont pas identiques. Bogofilter est un filtre bayésien. Le filtre bayésien n'est qu'une des méthodes utilisées par Spamassassin pour vérifier les mails.
A notter aussi que Bogofiler est écrit en C (Spamassassin est en Perl) ce qui doit également aider.
Avec Bogofilter, j'ai l'impression que ce sont les accès à la base de données qui prenaient le plus de temps. Depuis que ma base de données (128Mo) est dans un ramdisk (sauvegardé toutes les 6 heures), la vérification des mails est instantannée.
Enfin, je trouve très surprenants les résultats de Spamassassin qu'a obtenu l'auteur de ce journal. Celui que j'avais vu à l'oeuvre était vraiment redoutable. A mon avis, il n'a pas entrainé le filtre bayésien de son Spamassassin (ou il ne l'a pas fait correctement).
[^] # Re: Gourmand Bogofilter ?
Posté par Prae . Évalué à 4.
C'est bizarre, à chaque fois que je vois un logiciel important développé en Perl, je suis toujours autant étonné par la charge CPU/RAM qui est utilisée (spamassassin, sympaML, etc...)
Certain crieront aux trolls, mais je me demande si Perl est un "bon" language finalement...
[^] # Re: Gourmand Bogofilter ?
Posté par Blackknight (site web personnel, Mastodon) . Évalué à 5.
Perso, je pense que Perl est un bon langage pour le KISS. Seulement certains l'utilisent aussi pour faire tout et n'importe quoi, il suffit de regarder sur CPAN. Et bien pour moi, c'est pas franchement la bonne solution, il y a quand même des langages plus adaptés que d'autres à certains développements. Clairement, je n'irais pas faire du code en C pour un programme qui va servir une fois à manipuler des fichiers système mais à l'inverse, coder un anti-spam en Perl me semble délirant.
Enfin, tout ça, c'est mon avis.
[^] # Re: Gourmand Bogofilter ?
Posté par Khâpin (site web personnel) . Évalué à 10.
----->[]
[^] # Re: Gourmand Bogofilter ?
Posté par gemegik . Évalué à 6.
[^] # Re: Gourmand Bogofilter ?
Posté par gc (site web personnel) . Évalué à 4.
[^] # Re: Gourmand Bogofilter ?
Posté par FlashCode (site web personnel, Mastodon) . Évalué à 1.
WeeChat, the extensible chat client
[^] # Re: Gourmand Bogofilter ?
Posté par Xavier Teyssier (site web personnel) . Évalué à 2.
J'ai également été surpris étant donné que j'ai souvent entendu parler en bien de ce filtre.
Pour l'entrainement, il s'est effectué avec les mêmes SPAMS que pour Bogofilter.
La seule différence, c'est que SpamAssassin a été nourris avec au fur et à mesure de leur arrivée, c'est à dire en quelques mois, alors que Bogofilter les a tous appris en une nuit.
[^] # Re: Gourmand Bogofilter ?
Posté par Bertrand Mathieu . Évalué à 1.
Ceci dit Spamassassin est capable de traiter une mbox d'un seul coup il me semble. L'appeler pour chaque message, un par un, ne doit pas aider à aller vite, là où on pourrait sûrement lui balancer la liste en une seule fois.
[^] # Re: Gourmand Bogofilter ?
Posté par Xavier Teyssier (site web personnel) . Évalué à 2.
A la louche, quand j'indique à SpamAssassin qu'un mail est un Spam, il prend presque 2 secondes.
Avec Bogofilter, il m'en traite quasiment 6 dans le même laps de temps.
# 40% seulement?
Posté par ArnY (site web personnel) . Évalué à 10.
As-tu vérifié:
- que ta version de spamassassin est bien la plus récente?
- que le filtre bayesien était bien activé?
- que l'apprentissage du filtre se faisait bien?
- que les règles de ton spamassassin étaient bien à jour?
Ici nous recevons plus de 250 000 mails par jour sur environ 5000 comptes, eviron 80-90 000 sont des spams et nous arrivons à obtenir un taux d'efficacité de plus de 99% (99,6% pour mon compte, aucun faux positif). Nous utilisons Spamassassin et CRM114, je mets régulièrement à jour les règles de SA en fonction des nouvelles vagues de spam et nous sommes que 5 ou 6 à corriger CRM114 en cas d'erreur.
Toi, avec tes 10 boites, tu dois pas recevoir un eventail de mails aussi hétérogène (et hétéroclite) que nous, et pourtant ton Spamassassin est vraiment à la ramasse...à mon avis, t'as du rater un truc dans la config.
[^] # Re: 40% seulement?
Posté par iug . Évalué à 1.
[^] # Re: 40% seulement?
Posté par Philippe F (site web personnel) . Évalué à 2.
De mon cote, c'est greylisting + spamassassin + bogofilter + junk mail filter de thunderbird.
Resultat a la louche :
- spamassassin pas super efficace sur mon compte a moi
- grey listing super efficace
- bogofilter super lent a l'apprentissage
- junk mail filter de thunderbird hyper efficace. Ca m'a plutot surpris.
[^] # Commentaire supprimé
Posté par Anonyme . Évalué à 3.
Ce commentaire a été supprimé par l’équipe de modération.
[^] # Re: 40% seulement?
Posté par Xavier Teyssier (site web personnel) . Évalué à 2.
Mais j'avoue n'avoir pas eu/pris le temps de chercher pourquoi.
Je peux juste dire que Spamassassin était bien à jour (Debian unstable mis à jour régulièrement), et que l'apprentissage avait bien lieu (pour un Spam identique revenant régulièrement, je voyais son score augmenter après chaque apprentissage).
Pour ce qui est de l'activation du filtre Bayésien, aucune idée.
Pour la mise à jour des règles... heu... c'est pas mis à jour avec l'appli ?
J'avoue n'avoir jamais vraiment plongé dans la configuration du truc.
MAIS : je n'ai pas non plus plongé dans la config de Bogofilter, qui marche très bien du premier coup.
Pour mon usage, Bogofilter est donc sur ce point là également mieux que SpamAssassin.
[^] # Re: 40% seulement?
Posté par Olivier Borowski (site web personnel) . Évalué à 1.
Depuis que je suis passé à bogofilter, la détection est bien plus efficace. Je le trouve plus extrémiste sur les notations, souvent 0% ou 100% de proba et ses réglages par défaut sont presque parfaits.
<hs>mon comparatif ressemble à une pub pour un shampooing : un filtre plus efficace et 72% de casse en moins!</hs>
Reste que kmail est très énervant à se bloquer quelques secondes à chaque réception de courrier en tâche de fond à cause de l'anti-spam. Ca fait pas très pro et est assez gênant quand on est en train de rédiger un mail.
[^] # Re: 40% seulement?
Posté par Ph Husson (site web personnel) . Évalué à 3.
spamassassin ne connaissait pas la définition d'un mail normal, et donc sortait plus ou moins n'importe quoi (bon plutot moins, mais plus par rapport à ce que j'ai maintenant)
[^] # Re: 40% seulement?
Posté par Guillaume D. . Évalué à 1.
2500 mail / jour, 95% de spam, 98% d'efficacité, 0 faux positifs....
c'est sur qu'il faut mettre les mais dans le cangouis, au minimum lui dire que tu recoit tes email en francais, ajouter des regles qui vont bien :...
ah, oui, c'est ici : http://linuxfr.org/comments/461562,1.html
a+
[^] # Re: 40% seulement?
Posté par tinodeleste . Évalué à 1.
[^] # Re: 40% seulement?
Posté par ploum (site web personnel, Mastodon) . Évalué à 2.
http://ploum.frimouvy.org/?113-on-va-bayesier-les-spammeurs
Mes livres CC By-SA : https://ploum.net/livres.html
[^] # Re: 40% seulement?
Posté par FRLinux (site web personnel) . Évalué à 2.
frlinux@golem:~$ apt-cache search crm114
crm114 - The Controllable Regex Mutilator and Spam Filter
Bon certes, c'est la version 20060704a-3 alors que la well tested est la 20060926 mais bon, c'est bien de voir un paquet :)
# Et avec Evolution
Posté par mizu . Évalué à 5.
J'ai loupé un truc ?
[^] # Re: Et avec Evolution
Posté par tiot (site web personnel) . Évalué à 3.
Sous Ubuntu j'avais ce problème, puis au bout d'un moment ça a marché sans que je comprenne vraiment pourquoi.
Après je suis passé à Debian et j'ai encore le même pbm... je me demande bien comment marche ce truc (heureusement que je reçois peu de spam).
[^] # Re: Et avec Evolution
Posté par Bertrand Mathieu . Évalué à 2.
- dans Evolution le plugin est bien activé (Spamassassin *ou* Bogofilter, mais pas les 2 en même temps)
- le paquet spamassassin ou bogofilter sont bien installés (oui même si ça peut paraître con c'est pas impossible)
- et dans le cas de spamassassin, que le démon est lancé (regarde le contenu du fichier /etc/default/spamassassin).
Enfin en lançant évolution depuis un terminal tu auras les messages de logs. J'espère que ça t'aidera :-)
[^] # Re: Et avec Evolution
Posté par mizu . Évalué à 1.
[^] # Re: Et avec Evolution
Posté par eon2004 . Évalué à 2.
[^] # Re: Et avec Evolution
Posté par Maclag . Évalué à 1.
Pour une raison inconnue, il fallait qu'il ait au moins quelques mails indiqués faux positifs. Problème: s'il ne fait pas du tout de filtrage, comment indiquer un faux positif???
Je te conseille cependant la procédure suivante:
- Déclare en spam quelques mails valides
- Une fois déplacés dans la boîte de spam, va les déclarer valides de nouveau
Pour moi ça a marché, et j'ai trouvé cette bidouille sur internet, mais je ne sais plus où, merci à son auteur en tout cas!!
[^] # Re: Et avec Evolution
Posté par Colin Leroy (site web personnel) . Évalué à 3.
[^] # Re: Et avec Evolution
Posté par JoeltheLion (site web personnel) . Évalué à 1.
[^] # Re: Et avec Evolution
Posté par Calim' Héros (site web personnel) . Évalué à 8.
[^] # Re: Et avec Evolution
Posté par JoeltheLion (site web personnel) . Évalué à 2.
[^] # Re: Et avec Evolution
Posté par Sylvain Sauvage . Évalué à 2.
# Kmail, Imap et Spambayes
Posté par Ririsoft . Évalué à 2.
J'utilise spambayes au lieu de spamassassin ou bogofilter.
Mon problème c'est qu'il ne marche pas bien avec l'imap : mes nouveaux mails qui arrivent dans ma boite imap ne sont pas filtrés.
Quelqu'un a-t-il eu ce genre de problème avec une boite mail imap et spamassassin ou bogofilter ?
Merci !
[^] # Re: Kmail, Imap et Spambayes
Posté par Ph Husson (site web personnel) . Évalué à 3.
# Faux positifs...
Posté par Calim' Héros (site web personnel) . Évalué à 2.
[^] # Re: Faux positifs...
Posté par Thomas Douillard . Évalué à 5.
En général on distingue très facilement le sujet d'un spam et un vrai mail, grâce à l'expéditeur, tout ça. Mais ça marche pas à tout les coups, j'ai dû laisser passer des vrais mails une ou deux fois.
Ça peut sauver la vie certaines fois.
[^] # Re: Faux positifs...
Posté par Calim' Héros (site web personnel) . Évalué à 2.
[^] # Re: Faux positifs...
Posté par eon2004 . Évalué à 3.
[^] # Re: Faux positifs...
Posté par Calim' Héros (site web personnel) . Évalué à 2.
J'utilise perso le Junkmail de TB qui me conviens vue le nombre de spam que je reçoit, je les vire apres control rapide (histoire de pas laisser passer des faux positifs)
[^] # Re: Faux positifs...
Posté par FRLinux (site web personnel) . Évalué à 2.
postfix : regles smtpd relativement brutale mais sensees
rbl : les plus connus sont dans ma liste
amavis : mix de clam, spamassassin, fuzzyocr, imageinfo, mailscanner
Enfin si tout va bien, tu auras le droit d'etre lu.
Apres une bonne periode de test, les spams vont directement dans /dev/null et je genere des stats de mon .logfile individuel pour voir si j'ai tue quelqu'un par erreur :)
Steph
# Quelle config de SpamAssassin ?
Posté par lolop (site web personnel) . Évalué à 2.
La détection de SPAMs atteint plus de 95%.
* j'ai d'abord tout une série de filtres maildrop qui renvoient les emails provenant de personnes/listes connu(e)s vers des dossiers ad-hoc (ça évite certains faux positifs).
* si ça n'est pas filtré par une règle, ça passe par SpamAssassin.
* j'utilise les règles de l'ingénieur qui est en charge de tout ce qui est courier électronique au labo (1), qui n'utilise pas les filtres bayaisiens (2).
* les courriels taggés spam sont stockés dans une joite à part, que je zieute rapidement avant de vider (pour éviter les faux positifs, ça arrive de temps en temps - généralement avec des emails commerciaux).
J'en suis globalement très content. Avec mes différentes adresses email, dnot certaines diffusées depuis longtemps sur l'Internet (newsgroups, forums, pages ouebe), j'ai généralement plus de 200 spams par jour, dont moins d'une dizaine dans ma inbox.
Il y a juste une liste de diffusion qui reçoit du spam (filtré avant l'application de SpamAssassin, donc non détecté), que je dois nettoyer à la main.
Bon, j'ai pas testé bogofilter.
A+
Laurent.
(1) http://www.limsi.fr/Individu/zabeth/spam/local.cf
(2) ça semble poser problème lorsque de nombreuses personnes reçoivent des emails avec des profils très différents.
Votez les 30 juin et 7 juillet, en connaissance de cause. http://www.pointal.net/VotesDeputesRN
[^] # Re: Quelle config de SpamAssassin ?
Posté par MrLapinot (site web personnel) . Évalué à 2.
Tu pourrais poster un exemple stp, je suis intéressé par cette partie ?
Merci d'avance.
[^] # Re: Quelle config de SpamAssassin ?
Posté par lolop (site web personnel) . Évalué à 4.
Votez les 30 juin et 7 juillet, en connaissance de cause. http://www.pointal.net/VotesDeputesRN
[^] # Re: Quelle config de SpamAssassin ?
Posté par FRLinux (site web personnel) . Évalué à 2.
Steph
# Trop fort !!
Posté par Yannick (site web personnel) . Évalué à 2.
J'utilise également Kmail, mais au démarrage celui ci met plusieurs minutes avant de me rendre la main, je me demandais ce qu'il foutait, mais j'ai la réponse maintenant. C'est à cause de SpamAssassin qui fait tout ramer.
Je viens de faire un apt-get bogofilter et je pense que ca mieux marcher à présent ! Excellente nouvelle quand je m'apprêtais à me débarasser de Kmail qui était trop lent..
Merci
# Les deux ?
Posté par Beurt . Évalué à 2.
Je suis à peu près dans la même situation que toi au niveau des boites mail et catch-all et reçoit à peu près autant de Spam.
Dans kmail, j'utilise spamassasin et bogofilter depuis mon passage en Mdv2006 (avant je n'utilisais que Bogofilter) et depuis je suis un homme sans Spam.
Par contre c'est leeeent ! (si bien que j'envisage de déporter tout ça sur un serveur mail... Mais bon j'ai pas trop le temps de me farcir une config postfix-imap-webmail auxquels je ne connais rien).
# Le filtrage anti-spam se fait pas à partir du client mail
Posté par Anonyme . Évalué à 1.
Pour l'efficacité respectives, je peux pas dire car j'utilise les deux, mais pour la lenteur de KMail y'a pas photo : installez au moins fetchmail et procmail et ça ira beaucoup mieux. Si vous avez un nom de domaine, mettez postfix pour avoir du greylisting, c'est redoutable contre les spams.
Un totu pour une mise en place de tout ça :
http://aurelienlp.free.fr/blog/index.php?2006/10/22/28-gesti(...)
« Comment gérer le mail pour un nom de domaine, regrouper les mails de plusieurs adresses sur une seule, éviter le spam et lire ses mails avec au choix un client lourd ou un webmail ? Réponse : en utilisant des outils UNIX éprouvés, comme Postfix, fetchmail, procmail, spamassassin... Qui ne font chacun qu'une tâche, mais qui la font bien. »
# J'ai franchi le pas...
Posté par mansuetus (site web personnel) . Évalué à 2.
J'ai installé spamassassin sur mon serveur, avec du cron pour relever les $HOME/.maildir/.spam_spam/
.spam_ham/
(à base de su mansuetus -c "sa_learn...")
J'avais un packet rulesdujour sous gentoo qui me mettait de nouvelles règles de temps en temps (enfin, je crois), j'ai configuré les filtres baysiens, fait apprendre sur 40 spams/jour pendant au moins 100 jours...
Et je filtrais en gros 60%
Donc je sais, je suis sous doué, mais là, j'ai installé bogofilter.
200 spams dans ma boite à spam (que je vide régulièrement...) pour lui donner un avant goût.
300 emails de mes divers boites dans la boite à ham pour lui donner un petit gout sucré.
et après 3 jours, je suis déjà à 85% - 90% trié, avec quelques faux positifs dans la première heure...
Merci pour cette news... Je commençais à désespérer pour les spams...
Suivre le flux des commentaires
Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.