Journal Bogofilter pour filter le spam

Posté par  .
Étiquettes : aucune
0
27
mai
2004
J'aimerais tester bogofilter mais j'ai déjà une base sur spamassassin qui a plusieurs mois donc j'ai pas trop envi de me retapper l'apprentissage bayesien
Alors existe t-il un moyen simple de passer sa base sous spamassassin vers le format de bogofilter
j'ai essayé l'option upgrade (en me disant que le format de spamassassin étant assez proche), mais ça marche pas
j'ai vu diverses astuces basées sur l'utilisation d'un serveur mail, mais je n'en utilises pas donc j'aimerais juste une méthode directe de conversion, si c'est possible.

Je remercie d'avance ceux qui pourront m'aider.
  • # Conseil

    Posté par  . Évalué à -10.

    Plutot que ce logiciel, je te conseil K9 qui est vraiment très performant...

    Il ne se trompe absolument plus du tout au bout d'une semaine, et dès le départ fait très peu de faute....

    Bref du tout bon....

    K9 : http://keir.net/k9.html(...)
    • [^] # Sources ? Logiciel Libre ?

      Posté par  . Évalué à 2.

      D'une ca tourne pas sous linux de deux c est meme pas un logiciel libre....
    • [^] # Re: Conseil

      Posté par  . Évalué à 2.

      Tu as pris le risque de te faire moinsser et ça n'a pas loupé. Sur le site je n'ai vu qu'une archive zip (qui contient un exe) et un installer exe. Donc ça n'a pas l'air de tourner sur autre chose que Fenêtres.

      Alors sur un site nommé linuxfr, parler d'un soft qui ne tourne pas sous linux c'est audacieux :) Tu aurais au moins pu détailler les avantages de ce soft par rapport à l'offre de logiciels sous Linux, qu'on ait une bonne raison d'utiliser ton K9 (avec wine? vmware?)
  • # avec un repertoire de spam

    Posté par  . Évalué à 4.

    si tu as un repertoire plein de spam :

    bogofilter -s < spam/*

    et pour les bon mail (ham) :
    bogofilter -h < ham/*


    Dam
    • [^] # Re: avec un repertoire de spam

      Posté par  . Évalué à 1.

      bon ça je l'ai trouvé dans la doc, c'est un peu la base ;)
      le problème c'est que je garde pas mes mails (surtout les spams), et qu'une fois que spamassassin à appris sa lesson, je vire les mails
      donc là j'ai aucun mail (enfin sauf ceux que je veux garder mais il n'y a aucun spam dans le lot), mais une base spamassassin qui est plutot bien fournit et que j'aimerais porté vers le format de bogofilter pour que celui ci puisse l'utiliser sans avoir à repasser par un phase d'apprentissage
      Si j'ai pas été claire, faut surtout pas vous génez pour me demander de préciser :D
      • [^] # Re: avec un repertoire de spam

        Posté par  . Évalué à 2.

        j'utilise spamassassin et bogofilter, personnelement bogo est plus precis que spamassassin

        aussi il faut que tu reapprennes a bogo a moins qu'on te fille un dico deja genere, mais je ne suis pas sur que cela corresponde exactement a tes correspondances
      • [^] # Re: avec un repertoire de spam

        Posté par  . Évalué à 2.

        Ben comme c'est pas le meme systeme de filtrage ca me parrait difficile de convertir :
        spamassasin est basé sur des regles ecrites a la main (avec un scoring pour chaqu'une).
        bogofilter est basé sur un filtre bayesien (donc avec un aprentissage statistiques des mots rencontré).

        Donc voila.

        Tu peux faire marcher les deux en parallele en faisant aprendre ton bogofilter par ton spamassassin (un script est donné dans la doc bogofilter) et ensuite quand tu estime qu'il a bien bouffé, tu coupe spamassassin, mais sinon je ne vois pas.

        Dam
        • [^] # Re: avec un repertoire de spam

          Posté par  . Évalué à 3.

          spamassasin est basé sur des regles ecrites a la main (avec un scoring pour chaqu'une).

          mm pas seulement :) spamassassin utilise aussi les filtres bayesiens il peut aussi utiliser les bases de hash pyzor/razo et dcc.
        • [^] # Re: avec un repertoire de spam

          Posté par  . Évalué à 1.

          ok, je pensais que ça existait
          tant pis je vais faire tourner spamassassin et bogofilter en même temps sur mon kmail (ça devrait pas être trop dur avec les filtres

          par contre poue le script dont tu parles c'est celui que je cite plus haute et qui nécessite un MTA ;)

          Merci quand même pour vos réponses les gens
  • # Tu veux des spam ?

    Posté par  . Évalué à 3.

    Au pire, si tu as besoin de spam pour l'apprentissage de ton filtre, je peux t'en envoyer (j'en ai quelque chose comme 8000 de coté...). Mon bogofilter, après ça, ne se trompe vraiment pas souvent !
    • [^] # Re: Tu veux des spam ?

      Posté par  . Évalué à 4.

      Oui mais ce sont "tes" spams : tout le monde ne reçoit pas le même type de spam. Les filtres baysiens sont plus performants lorsqu'ils apprennent à partir des vrais courriers que l'utilisateur a reçu, pas à partir des spams de quelqu'un d'autre.

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.