Journal Spamassassin/Bogofilter : net avantage à second !

Posté par (page perso) .
Tags : aucun
0
9
nov.
2006
Petite mise en contexte :
J'utilise régulièrement une dizaine d'adresses mails. Parmi celles-ci, il y en a notamment une qui me sert de catch-all pour plusieurs domaines, et une autre utilisée en clair depuis plus de huit ans, notamment sur des newsgroups.

Tout ceci me permet de recevoir entre 100 et 250 SPAMs par jour.

Afin de filtrer tout cela, j'avais demandé à mon client mail (Kmail) d'utiliser SpamAssassin.

Grosse déception : celui ci ne détectait guère plus de 40 % du SPAM, et trouvait régulièrement des faux positifs, notamment sur des lettres d'informations en HTML.
Pendant plus d'un an, j'ai chassé les 60 % de SPAM restant avec des filtres perso. Mais il me restait toujours une dizaine de SPAM par jour qui échappaient aux différentes règles.

Il y a deux semaines, j'ai décidé de tester Bogofilter, en lieu et place de SpamAssassin.

Je lui ai donc donné en apprentissage les 30000 SPAMs qui trainaient dans un répertoire, et en temps que mails "OK", quelques milliers de mails issus de mailing-liste diverses.

Et là, très bonne surprise : suivant les jours, de 98 à 100% de mes SPAMs sont détectés par Bogofilter, et pas un seul faux positif en deux semaines !


Conclusion : Bogofilter, c'est bien !

SpamAssassin : http://spamassassin.apache.org/
Bogofilter : http://bogofilter.sourceforge.net/
  • # Rhâââ

    Posté par (page perso) . Évalué à  6 .

    Même avec une relecture, j'laisse passer une faute monstrueuse dans le titre. La honte !
    s/à/au/
  • # Gourmand Bogofilter ?

    Posté par . Évalué à  3 .

    J'utilise aussi Spamassassin avec kmail et pendant la vérification des mails Spamassassin bouffe 100% du CPU, normal ?

    Bogofilter fait-il mieux de ce coté ?
    • [^] # Re: Gourmand Bogofilter ?

      Posté par (page perso) . Évalué à  2 .

      Quand j'utilisais Spamassassin avec KMail, il mettait quand même pas mal de temps à analyser tous mes mails.

      Je crois qu'il y a la possibilité de faire fonctionner une partie de Spamassassin en daemon. Cela évite de devoir recharger les librairies Perl quand de nouveaux mails sont arrivés dans la boîte puis filtrés par Spamassassin.

      Je crois que j'avais essayé, mais que finalement ça ne changeait pas grand chose.


      Depuis que je suis passé à Bogofilter, je n'ai plus ce problème de lenteur. J'ai également constaté que Bogofilter m'offrait de meilleurs résultats que Spamassassin.
      Cependant, je n'avais pas cherché très longtemps pour configurer Spamassassin afin d'obtenir les meilleures performances possibles au niveau du filtrage.
    • [^] # Re: Gourmand Bogofilter ?

      Posté par . Évalué à  3 .

      Je n'ai jamais utilisé Spamassassin. Je l'avais vu fonctionner sur une machine bien plus récente que la mienne (P4 2 Ghz alors que je me servais d'un Duron 900) et ça m'avait dissuadé de l'installer, même si il ne laissait pratiquement passer aucun spam.

      Avec Bogofilter, je n'ai pas de gros problèmes de performances et il ne laisse pas passer grand chose. Par contre, les premiers temps, sûrement à cause de la faiblesse de l'échantillon que j'avais utilisé pour son entrainement initial, Bogofilter avait renvoyé deux ou trois faux positifs.

      Celà dit, ces deux programmes ne sont pas identiques. Bogofilter est un filtre bayésien. Le filtre bayésien n'est qu'une des méthodes utilisées par Spamassassin pour vérifier les mails.

      A notter aussi que Bogofiler est écrit en C (Spamassassin est en Perl) ce qui doit également aider.

      Avec Bogofilter, j'ai l'impression que ce sont les accès à la base de données qui prenaient le plus de temps. Depuis que ma base de données (128Mo) est dans un ramdisk (sauvegardé toutes les 6 heures), la vérification des mails est instantannée.

      Enfin, je trouve très surprenants les résultats de Spamassassin qu'a obtenu l'auteur de ce journal. Celui que j'avais vu à l'oeuvre était vraiment redoutable. A mon avis, il n'a pas entrainé le filtre bayésien de son Spamassassin (ou il ne l'a pas fait correctement).
      • [^] # Re: Gourmand Bogofilter ?

        Posté par (page perso) . Évalué à  4 .

        > A notter aussi que Bogofiler est écrit en C (Spamassassin est en Perl) ce qui doit également aider.

        C'est bizarre, à chaque fois que je vois un logiciel important développé en Perl, je suis toujours autant étonné par la charge CPU/RAM qui est utilisée (spamassassin, sympaML, etc...)

        Certain crieront aux trolls, mais je me demande si Perl est un "bon" language finalement...
        • [^] # Re: Gourmand Bogofilter ?

          Posté par (page perso) . Évalué à  5 .

          Certain crieront aux trolls, mais je me demande si Perl est un "bon" language finalement...

          Perso, je pense que Perl est un bon langage pour le KISS. Seulement certains l'utilisent aussi pour faire tout et n'importe quoi, il suffit de regarder sur CPAN. Et bien pour moi, c'est pas franchement la bonne solution, il y a quand même des langages plus adaptés que d'autres à certains développements. Clairement, je n'irais pas faire du code en C pour un programme qui va servir une fois à manipuler des fichiers système mais à l'inverse, coder un anti-spam en Perl me semble délirant.
          Enfin, tout ça, c'est mon avis.
          • [^] # Re: Gourmand Bogofilter ?

            Posté par (page perso) . Évalué à  10 .

            Il paraît même qu'il existe des jeux codés en Perl, et qui bouffent pas mal de ressources juste pour lancer des boules de couleurs...

            ----->[]
            • [^] # Re: Gourmand Bogofilter ?

              Posté par . Évalué à  6 .

              Il y a quand même du C compilé dans frozen-bubble, justement sur les parties qui nécessitent pas mal de calculs (les transitions dans fb1, je n'ai pas regardé le code de fb2 mais j'imagine que c'est du même acabit.)
              • [^] # Re: Gourmand Bogofilter ?

                Posté par (page perso) . Évalué à  4 .

                C'est pareil mais il y a en plus les effets graphiques du menu, un croppeur d'image, un algo de rotation d'images avec lissage bicubique (pour quand on tourne le canon), les bindings d'accès à SDL_Pango, et des overrides pour des bindings foireux ou manquants dans sdlperl.
            • [^] # Re: Gourmand Bogofilter ?

              Posté par (page perso) . Évalué à  1 .

              Et bien justement je trouve que pour un jeu en perl, il bouffe très peu de ressources. J'ai déjà vu un paquet de jeux en C qui utilisent le CPU à 100% pendant toute la durée du jeu...

              WeeChat, the extensible chat client

      • [^] # Re: Gourmand Bogofilter ?

        Posté par (page perso) . Évalué à  2 .

        Enfin, je trouve très surprenants les résultats de Spamassassin qu'a obtenu l'auteur de ce journal. Celui que j'avais vu à l'oeuvre était vraiment redoutable. A mon avis, il n'a pas entrainé le filtre bayésien de son Spamassassin (ou il ne l'a pas fait correctement).

        J'ai également été surpris étant donné que j'ai souvent entendu parler en bien de ce filtre.

        Pour l'entrainement, il s'est effectué avec les mêmes SPAMS que pour Bogofilter.
        La seule différence, c'est que SpamAssassin a été nourris avec au fur et à mesure de leur arrivée, c'est à dire en quelques mois, alors que Bogofilter les a tous appris en une nuit.
    • [^] # Re: Gourmand Bogofilter ?

      Posté par . Évalué à  1 .

      Sous Evolution je suis passé aussi de Spamassassin (en mode démon) à BogoFilter il y a quelque mois. Y a pas photo, Bogofilter est bien plus rapide pour trier les messages! J'ai également eu l'impression d'un meilleur filtrage, instantannément (alors que Spamassassin avait déjà bouffé plus d'un an de spam en apprentissage...).

      Ceci dit Spamassassin est capable de traiter une mbox d'un seul coup il me semble. L'appeler pour chaque message, un par un, ne doit pas aider à aller vite, là où on pourrait sûrement lui balancer la liste en une seule fois.
    • [^] # Re: Gourmand Bogofilter ?

      Posté par (page perso) . Évalué à  2 .

      Oui, j'ai oublié de le préciser dans le journal, mais question performance, y'a pas photo non plus.

      A la louche, quand j'indique à SpamAssassin qu'un mail est un Spam, il prend presque 2 secondes.
      Avec Bogofilter, il m'en traite quasiment 6 dans le même laps de temps.
  • # 40% seulement?

    Posté par (page perso) . Évalué à  10 .

    Tu ne t'es pas posé la question de savoir comment cela se faisait que Spamassassin qui est pourtant très utilisé était aussi peu efficace?

    As-tu vérifié:
    - que ta version de spamassassin est bien la plus récente?
    - que le filtre bayesien était bien activé?
    - que l'apprentissage du filtre se faisait bien?
    - que les règles de ton spamassassin étaient bien à jour?

    Ici nous recevons plus de 250 000 mails par jour sur environ 5000 comptes, eviron 80-90 000 sont des spams et nous arrivons à obtenir un taux d'efficacité de plus de 99% (99,6% pour mon compte, aucun faux positif). Nous utilisons Spamassassin et CRM114, je mets régulièrement à jour les règles de SA en fonction des nouvelles vagues de spam et nous sommes que 5 ou 6 à corriger CRM114 en cas d'erreur.

    Toi, avec tes 10 boites, tu dois pas recevoir un eventail de mails aussi hétérogène (et hétéroclite) que nous, et pourtant ton Spamassassin est vraiment à la ramasse...à mon avis, t'as du rater un truc dans la config.
    • [^] # Re: 40% seulement?

      Posté par . Évalué à  1 .

      D'après ce que j'ai ouïe dire, CRM 114 doit en être pour beaucoup dans tes performances.
      • [^] # Re: 40% seulement?

        Posté par (page perso) . Évalué à  2 .

        CRM114, j'avais regarde, ca a l'air plutot mortel a mettre en place.

        De mon cote, c'est greylisting + spamassassin + bogofilter + junk mail filter de thunderbird.

        Resultat a la louche :
        - spamassassin pas super efficace sur mon compte a moi
        - grey listing super efficace
        - bogofilter super lent a l'apprentissage
        - junk mail filter de thunderbird hyper efficace. Ca m'a plutot surpris.
    • [^] # Re: 40% seulement?

      Posté par (page perso) . Évalué à  3 .

      Il est aussi intéressant de tuner les scores de sa. Par exemple, par défaut, un mail détecté en filtre bayesien à 99% spam reçois seulement une cote de 3,5. Il y a actuellement pas mal de spam qui passe entre les mailles du filet de sa dans ce cas. J'ai donc mis un "score BAYES_99 5.00" dans mes préférences.

      Les rêgles statiques de base ne servent ainsi pratiquement qu'à filtrer l'inconnu. Je désactive également, l'apprentissage automatique.
    • [^] # Re: 40% seulement?

      Posté par (page perso) . Évalué à  2 .

      Si, j'ai été surpris qu'un soft avec cette réputation ne soit pas plus efficace.
      Mais j'avoue n'avoir pas eu/pris le temps de chercher pourquoi.

      Je peux juste dire que Spamassassin était bien à jour (Debian unstable mis à jour régulièrement), et que l'apprentissage avait bien lieu (pour un Spam identique revenant régulièrement, je voyais son score augmenter après chaque apprentissage).

      Pour ce qui est de l'activation du filtre Bayésien, aucune idée.
      Pour la mise à jour des règles... heu... c'est pas mis à jour avec l'appli ?

      J'avoue n'avoir jamais vraiment plongé dans la configuration du truc.

      MAIS : je n'ai pas non plus plongé dans la config de Bogofilter, qui marche très bien du premier coup.
      Pour mon usage, Bogofilter est donc sur ce point là également mieux que SpamAssassin.
      • [^] # Re: 40% seulement?

        Posté par (page perso) . Évalué à  1 .

        Spamassassin avec ses réglages par défaut sous opensuse 10.1 laissait passer pas mal de spam et génerait quelques faux positifs. Beaucoup de mails classiques avaient quelques dixaines de % de probabilité de spam (affiché sous kmail par un petit indicateur). L'apprentissage via les boutons "spam" "non spam" de kmail me prenait beaucoup de temps pour améliorer la chose.

        Depuis que je suis passé à bogofilter, la détection est bien plus efficace. Je le trouve plus extrémiste sur les notations, souvent 0% ou 100% de proba et ses réglages par défaut sont presque parfaits.

        <hs>mon comparatif ressemble à une pub pour un shampooing : un filtre plus efficace et 72% de casse en moins!</hs>

        Reste que kmail est très énervant à se bloquer quelques secondes à chaque réception de courrier en tâche de fond à cause de l'anti-spam. Ca fait pas très pro et est assez gênant quand on est en train de rédiger un mail.
      • [^] # Re: 40% seulement?

        Posté par (page perso) . Évalué à  3 .

        Si ca peut aider, j'avais aussi beaucoup de problemes, et j'ai découvert que c'etait parce que je déclarais les spams en tant que tel, mais pas les non spam !
        spamassassin ne connaissait pas la définition d'un mail normal, et donc sortait plus ou moins n'importe quoi (bon plutot moins, mais plus par rapport à ce que j'ai maintenant)
    • [^] # Re: 40% seulement?

      Posté par . Évalué à  1 .

      J'allais dire pareil.

      2500 mail / jour, 95% de spam, 98% d'efficacité, 0 faux positifs....

      c'est sur qu'il faut mettre les mais dans le cangouis, au minimum lui dire que tu recoit tes email en francais, ajouter des regles qui vont bien :...

      ah, oui, c'est ici : http://linuxfr.org/comments/461562,1.html

      a+
      • [^] # Re: 40% seulement?

        Posté par . Évalué à  1 .

        pour quelqu'un qui est abonné à pas mal de mailings lists, je suppose qu'il ne reçoit pas que des messages en francais, donc c'est pas une bonne idée. Il vaut mieux juste éliminer les charsets qu'on ne sait pas du tout lire soi-même... (je lis bien l'allemand, l'anglais, l'espagnol, j'ai un peu plus de mal avec le coréen, le chinois, ...)
      • [^] # Re: 40% seulement?

        Posté par (page perso) . Évalué à  2 .

        Un petit tuto de ma config spamassassin personnelle :

        http://ploum.frimouvy.org/?113-on-va-bayesier-les-spammeurs
    • [^] # Re: 40% seulement?

      Posté par (page perso) . Évalué à  2 .

      hum, de la balle, il est meme dans Debian sid :)

      frlinux@golem:~$ apt-cache search crm114
      crm114 - The Controllable Regex Mutilator and Spam Filter

      Bon certes, c'est la version 20060704a-3 alors que la well tested est la 20060926 mais bon, c'est bien de voir un paquet :)

  • # Et avec Evolution

    Posté par . Évalué à  5 .

    Tiens, d'ailleurs, moi j'ai jamais réussi à faire marcher l'anti-spam avec Evolution. A chaque fois que j'ai un spam dans la boîte, je clique sur 'Pourriel' mais les spams suivants ne sont pas bloqués.

    J'ai loupé un truc ?
    • [^] # Re: Et avec Evolution

      Posté par (page perso) . Évalué à  3 .

      J'ai du louper la même chose.

      Sous Ubuntu j'avais ce problème, puis au bout d'un moment ça a marché sans que je comprenne vraiment pourquoi.

      Après je suis passé à Debian et j'ai encore le même pbm... je me demande bien comment marche ce truc (heureusement que je reçois peu de spam).
    • [^] # Re: Et avec Evolution

      Posté par . Évalué à  2 .

      Vérifie que:
      - dans Evolution le plugin est bien activé (Spamassassin *ou* Bogofilter, mais pas les 2 en même temps)
      - le paquet spamassassin ou bogofilter sont bien installés (oui même si ça peut paraître con c'est pas impossible)
      - et dans le cas de spamassassin, que le démon est lancé (regarde le contenu du fichier /etc/default/spamassassin).

      Enfin en lançant évolution depuis un terminal tu auras les messages de logs. J'espère que ça t'aidera :-)
      • [^] # Re: Et avec Evolution

        Posté par . Évalué à  1 .

        OK, alors ça doit être le paquet bogofilter qui manque. C'est quand même bête de pas avoir tout ce qu'il faut pour filtrer les spams quand on installe Evolution (surtout quand ça fait partie intégrante d'une distribution).
        • [^] # Re: Et avec Evolution

          Posté par (page perso) . Évalué à  2 .

          Sous Mandriva 2007 ca marche au poil sans rien tripatouiller. Je suis d'ailleurs passé récemment de Thunderbird à Evolution (à cause de Gnome et du répertoire partagé entre ses applications), et bien Evolution filtre beaucoup mieux le spam. Quasiment jamais un mail de travers en 2mois (10 spams par jour). Avec Thunderbird, le taux de réussite était plutôt de 75%. Evolution a d'autres travers cependant...
    • [^] # Re: Et avec Evolution

      Posté par (page perso) . Évalué à  1 .

      J'ai eu le même problème sous Sylpheed-Claws avec Bogofilter, sans comprendre pourquoi.
      Pour une raison inconnue, il fallait qu'il ait au moins quelques mails indiqués faux positifs. Problème: s'il ne fait pas du tout de filtrage, comment indiquer un faux positif???
      Je te conseille cependant la procédure suivante:
      - Déclare en spam quelques mails valides
      - Une fois déplacés dans la boîte de spam, va les déclarer valides de nouveau

      Pour moi ça a marché, et j'ai trouvé cette bidouille sur internet, mais je ne sais plus où, merci à son auteur en tout cas!!
  • # Kmail, Imap et Spambayes

    Posté par . Évalué à  2 .

    Je vois que nous sommes entre gens bien ici (Kmail + antispam) alors je vais vous faire part de mon problème :

    J'utilise spambayes au lieu de spamassassin ou bogofilter.
    Mon problème c'est qu'il ne marche pas bien avec l'imap : mes nouveaux mails qui arrivent dans ma boite imap ne sont pas filtrés.

    Quelqu'un a-t-il eu ce genre de problème avec une boite mail imap et spamassassin ou bogofilter ?

    Merci !
    • [^] # Re: Kmail, Imap et Spambayes

      Posté par (page perso) . Évalué à  3 .

      C'est un bogue de kmail qui gère mal les filtres sur imap, je crois savoir que y a des solutions, mais comme je suis en pop je ne me suis jamais renseigné
  • # Faux positifs...

    Posté par (page perso) . Évalué à  2 .

    Comment détectez vous un faux positif? Vous lisez les spams pour vérifier?
    • [^] # Re: Faux positifs...

      Posté par . Évalué à  5 .

      Perso je jette un coup d'oeil rapide dans ma boite à spam régulièrement pour vérifier les nouveaux spam, et je marque le dossier "lu" pour distinguer les nouveaux des anciens facilement.

      En général on distingue très facilement le sujet d'un spam et un vrai mail, grâce à l'expéditeur, tout ça. Mais ça marche pas à tout les coups, j'ai dû laisser passer des vrais mails une ou deux fois.

      Ça peut sauver la vie certaines fois.
      • [^] # Re: Faux positifs...

        Posté par (page perso) . Évalué à  2 .

        Merci
        • [^] # Re: Faux positifs...

          Posté par (page perso) . Évalué à  3 .

          Faut ils laisser les spams dans le dossier "indésirables" ou peut on les supprimer ensuite sans que ça joue sur l'apprentissage?
          • [^] # Re: Faux positifs...

            Posté par (page perso) . Évalué à  2 .

            Je ne sais pas, ca depend de ce que tu utilise je pense, et si tu vire les spam et reinitialise l'apprentissage tu repars de zero, si tu gardes tes spam, c'est plus rapide.

            J'utilise perso le Junkmail de TB qui me conviens vue le nombre de spam que je reçoit, je les vire apres control rapide (histoire de pas laisser passer des faux positifs)
    • [^] # Re: Faux positifs...

      Posté par (page perso) . Évalué à  2 .

      Perso je filtre au niveau serveur, dans l'ordre ca donne :

      postfix : regles smtpd relativement brutale mais sensees
      rbl : les plus connus sont dans ma liste
      amavis : mix de clam, spamassassin, fuzzyocr, imageinfo, mailscanner

      Enfin si tout va bien, tu auras le droit d'etre lu.

      Apres une bonne periode de test, les spams vont directement dans /dev/null et je genere des stats de mon .logfile individuel pour voir si j'ai tue quelqu'un par erreur :)

      Steph
  • # Quelle config de SpamAssassin ?

    Posté par (page perso) . Évalué à  2 .

    J'utilise un petit serveur qui fait tourner fetchmail, postfix, maildrop, spamassasin (en démon), dovecot.
    La détection de SPAMs atteint plus de 95%.

    * j'ai d'abord tout une série de filtres maildrop qui renvoient les emails provenant de personnes/listes connu(e)s vers des dossiers ad-hoc (ça évite certains faux positifs).

    * si ça n'est pas filtré par une règle, ça passe par SpamAssassin.

    * j'utilise les règles de l'ingénieur qui est en charge de tout ce qui est courier électronique au labo (1), qui n'utilise pas les filtres bayaisiens (2).

    * les courriels taggés spam sont stockés dans une joite à part, que je zieute rapidement avant de vider (pour éviter les faux positifs, ça arrive de temps en temps - généralement avec des emails commerciaux).


    J'en suis globalement très content. Avec mes différentes adresses email, dnot certaines diffusées depuis longtemps sur l'Internet (newsgroups, forums, pages ouebe), j'ai généralement plus de 200 spams par jour, dont moins d'une dizaine dans ma inbox.
    Il y a juste une liste de diffusion qui reçoit du spam (filtré avant l'application de SpamAssassin, donc non détecté), que je dois nettoyer à la main.

    Bon, j'ai pas testé bogofilter.

    A+

    Laurent.


    (1) http://www.limsi.fr/Individu/zabeth/spam/local.cf

    (2) ça semble poser problème lorsque de nombreuses personnes reçoivent des emails avec des profils très différents.
    • [^] # Re: Quelle config de SpamAssassin ?

      Posté par (page perso) . Évalué à  2 .

      j'ai d'abord tout une série de filtres maildrop qui renvoient les emails provenant de personnes/listes connu(e)s vers des dossiers ad-hoc (ça évite certains faux positifs).


      Tu pourrais poster un exemple stp, je suis intéressé par cette partie ?

      Merci d'avance.
      • [^] # Re: Quelle config de SpamAssassin ?

        Posté par (page perso) . Évalué à  4 .

        J'utilise un stockage au format Maildir (à partir de ~/.Maildir). Voici des extraits de mon .mailfilter (nettoyés d'adresses persos, et raccourci) :
        # Pour avoir un suivi de ce que fait maildrop.
        logfile "mailfilter-log.txt"
        
        log "======="
        
        # ======================================================================
        # Emails personnes connues...
        
        
        # Truc.
        if ( /^From:.*truc@machin/ )
            {
            to "./Maildir/.Amis.Truc"
            }
        # Des gens du meme endroit...
        if (    ( /^From:.*une.personne@/ )                                  \
             || ( /^From:.*uneautre.personne@/ )                                  \
             || ( /^From:.*et.encore.une@/ )                                      \
             || ( /^From:.*@un.domaine.connu.fr/ )                                   \
           )
           {
           to "./Maildir/.LABOITE"
           }
        
        # Famille...
        if (    ( /^From:.*machin.pointal@laposte.net/ )                        \
             || ( /^From:.*machinpointal@free.fr/ )                            \
           )
            {
            to "./Maildir/.Famille.Machin"
            }
        if ( /^From:.*truc.pointal@free.fr/ )
            {
            to "./Maildir/.Famille.Truc"
            }
        
        # ======================================================================
        # Emails commerciaux (desires, suivi achats & Co).
        if ( /^From:.*@euro.apple.com/ )
            {
            to "./Maildir/.Commerce.Apple"
            }
        # *** CDiscount
        # Le :h indique de faire un matching sur l'en-tête.
        if (   ( /Superfourmi/:h )      \
            || ( /^From:.*cdiscount/ )          \
           )
            {
            to "./Maildir/.Commerce.CDiscount"
            }
        
        # ======================================================================
        # Comptes emails crees specialement
        # ======================================================================
        # Listes de diffusion.
        # *** DrDobbs
        if ( /^From:.*drdobbs/ )
            {
            to "./Maildir/.Dev.DrDobbs"
            }
        # *** Karrigell
        if (   ( /^To:.*karrigell/  )                   \
            || ( /^Subject:.*Karrigell/ )               \
           )
            {
            to  "./Maildir/.Dev.Karrigell"
            }
        # *** Python-fr
        if ( /^List-Id: <python.aful.org>/ )
            {
            to "./Maildir/.Python.PythonFr"
            }
        # *** Python-announce
        if (    ( /python-announce@python.org/:h )                      \
             || ( /python-announce-list.python.org/:h )                 \
             || ( /comp-lang-python-announce@moderators.isc.org/:h )    \
           )
            {
            to "./Maildir/.Python.PythonAnnounce"
            }
        # *** OmniORB
        if ( /^List-Id:.*omniorb-list.omniorb-support.com/ )
            {
            to "./Maildir/.Dev.OmniORB"
            }
        
        # ======================================================================
        # Renvois à partir du boulot.
        if (  /^From:.*pointal@limsi.fr/ )
            {
            to "./Maildir/.Renvois"
            }
        
        # ======================================================================
        # Mails explicitement destines a moi.
        if ( /^Subject:.*alire/ )
            {
            to "./Maildir"
            }
        
        # ======================================================================
        # Spams identifies en tant que tel par Spamassassin.
        xfilter "/usr/bin/spamc -f "
        if ( /^X-Spam-Flag:.*YES/ )
            {
            to "./Maildir/.Spam"
            }
        
        J'ai aussi, tout à la fin, les lignes suivantes, commentées:
        # ======================================================================
        # Filtrage contenu par anomy sanitizer (recherche MIME mal formé,
        # HTML/JavaScript vérolé, pièces jointes exécutables & Co).
        #ANOMY=/var/spool/anomy/
        #xfilter "/usr//bin/sanitizer.pl /etc/anomy-sanitizer.conf 2>>~/mailfilter-log.txt | cat"
        
        # Le :b indique de rechercher le texte dans le corps.
        #if ( /^*** Attached file dropped ***/:b )
        #    {
        #    xfilter "subjadd [?VIRUS?]"
        #    to "./Maildir/.SpamVirus"
        #    }
        
        
      • [^] # Re: Quelle config de SpamAssassin ?

        Posté par (page perso) . Évalué à  2 .

        J'ai un tuto sur le filtrage : http://frlinux.net/?section=reseau&article=106

        Steph
  • # Trop fort !!

    Posté par (page perso) . Évalué à  2 .

    Ouah, ca c'est de la news.

    J'utilise également Kmail, mais au démarrage celui ci met plusieurs minutes avant de me rendre la main, je me demandais ce qu'il foutait, mais j'ai la réponse maintenant. C'est à cause de SpamAssassin qui fait tout ramer.

    Je viens de faire un apt-get bogofilter et je pense que ca mieux marcher à présent ! Excellente nouvelle quand je m'apprêtais à me débarasser de Kmail qui était trop lent..

    Merci
  • # Les deux ?

    Posté par . Évalué à  2 .

    Pour ma part j'ai quelque chose de très proche du 100%...

    Je suis à peu près dans la même situation que toi au niveau des boites mail et catch-all et reçoit à peu près autant de Spam.
    Dans kmail, j'utilise spamassasin et bogofilter depuis mon passage en Mdv2006 (avant je n'utilisais que Bogofilter) et depuis je suis un homme sans Spam.

    Par contre c'est leeeent ! (si bien que j'envisage de déporter tout ça sur un serveur mail... Mais bon j'ai pas trop le temps de me farcir une config postfix-imap-webmail auxquels je ne connais rien).
  • # Le filtrage anti-spam se fait pas à partir du client mail

    Posté par Anonyme . Évalué à  1 .

    Je trouve dommage de se priver d'un bon filtre anti-spam parce qu'on le lance à partir de son client mail.

    Pour l'efficacité respectives, je peux pas dire car j'utilise les deux, mais pour la lenteur de KMail y'a pas photo : installez au moins fetchmail et procmail et ça ira beaucoup mieux. Si vous avez un nom de domaine, mettez postfix pour avoir du greylisting, c'est redoutable contre les spams.

    Un totu pour une mise en place de tout ça :
    http://aurelienlp.free.fr/blog/index.php?2006/10/22/28-gesti(...)
    « Comment gérer le mail pour un nom de domaine, regrouper les mails de plusieurs adresses sur une seule, éviter le spam et lire ses mails avec au choix un client lourd ou un webmail ? Réponse : en utilisant des outils UNIX éprouvés, comme Postfix, fetchmail, procmail, spamassassin... Qui ne font chacun qu'une tâche, mais qui la font bien. »
  • # J'ai franchi le pas...

    Posté par (page perso) . Évalué à  2 .

    Et franchement... Heureux....

    J'ai installé spamassassin sur mon serveur, avec du cron pour relever les $HOME/.maildir/.spam_spam/
    .spam_ham/
    (à base de su mansuetus -c "sa_learn...")


    J'avais un packet rulesdujour sous gentoo qui me mettait de nouvelles règles de temps en temps (enfin, je crois), j'ai configuré les filtres baysiens, fait apprendre sur 40 spams/jour pendant au moins 100 jours...

    Et je filtrais en gros 60%

    Donc je sais, je suis sous doué, mais là, j'ai installé bogofilter.
    200 spams dans ma boite à spam (que je vide régulièrement...) pour lui donner un avant goût.
    300 emails de mes divers boites dans la boite à ham pour lui donner un petit gout sucré.

    et après 3 jours, je suis déjà à 85% - 90% trié, avec quelques faux positifs dans la première heure...

    Merci pour cette news... Je commençais à désespérer pour les spams...

Suivre le flux des commentaires

Note : les commentaires appartiennent à ceux qui les ont postés. Nous n'en sommes pas responsables.