Internet Reprise de Dspam par la communauté

Posté par (page perso) . Modéré par Nÿco.
Tags :
23
21
jan.
2009
Internet
Le 12 janvier 2009, la totalité du projet antispam Dspam a été cédé à sa communauté de développeurs et d'utilisateurs, ce qui inclut bien entendu les sources mais aussi le copyright, le logo ainsi que le contenu de l'ancien site internet.

Mais je vois poindre la question essentielle : qu'est-ce-que Dspam au juste ?

Dspam est, à l'instar de spamassassin, un logiciel antispam. Sa licence est la GNU GPL v2. Mais c'est ici que s'arrête la comparaison.

En effet Dspam est écrit en C (ce qui rend son filtrage très rapide), il base son filtrage sur des signatures et les statistiques tirées de celles-ci, ce qui lui permet d'"apprendre" et de s'adapter au type de spam que l'on reçoit. Il est bien sûr principalement destiné à se greffer sur un Mail Transfer Agent en tant que filtre de contenu, et nécessite un moteur de base de données telle que PostgreSQL, MySQL ou même SQLite (pour de très petites installations seulement). Dspam propose aussi une interface Web en CGI, et dispose d'un greffon ClamAV pour l'anti-virus. Comme dit plus haut, Dspam à été récemment repris par la communauté après quelques péripéties dont voici l'historique dans les grandes lignes¹ :
  • Dspam est créé par Jonathan Zdziarski en 2003 pour mettre en pratique son expertise en matière de lutte contre le spam² ;
  • En mai 2007 J. Zdziarski cède les droits de Dspam à la société Sensory Networks, et abandonne le développement de Dspam pour se concentrer sur la programmation sur l'iPhone d'Apple ;
  • S'ensuit une longue attente et une incompréhension de la part de la communauté d'utilisateurs envers Sensory Networks, principalement à cause du manque de communication et de support de la société ;
  • Devant cette apparente inaction de Sensory Networks, la décision est prise par les utilisateurs de Dspam de "forker" Dspam pour créer dspam-community, qui sera hébergée sur Sourceforge. Des négociations sont lancées entre les deux parties afin de récupérer le copyright de Dspam ;
  • Enfin, le 12 janvier 2009 le projet Dspam retombe entièrement entre les mains de la communauté d'utilisateurs.

Pour utiliser Dspam personnellement, je ne peux que vous le recommander et surtout vous inviter à participer à ce projet trop peu connu en regard de ses qualités.
  • # très bon outil

    Posté par (page perso) . Évalué à  8 .

    Pour utiliser dspam depuis bientôt 2 ans, je ne peux que le conseiller !
    Dans un premier temps je m'étais intéressé à spamassassin, qui est plus connu, et qui fonctionne bien lui aussi. Mais voilà, la bécane qui héberge mes emails est peu puissante (500Mhz et 256Mo ram), alors j'ai installé dspam.
    Tout d'abord en parallèle de spamassassin puisque c'est possible dans la mesure où dans ils n'utilisent pas les mêmes headers dans l'email :

    Spamassassin :
    X-Spam-Checker-Version: SpamAssassin 3.2.4 (2008-01-01) on plop
    X-Spam-Level:
    X-Spam-Status: No, score=-1.8 required=5.0 tests=AWL,BAYES_00,HTML_MESSAGE
    autolearn=ham version=3.2.4


    Dspam :
    X-DSPAM-Result: Whitelisted
    X-DSPAM-Processed: Fri Apr 18 14:38:44 2008
    X-DSPAM-Confidence: 0.9993
    X-DSPAM-Probability: 0.0000
    X-DSPAM-Signature: 4808b27423628362916074
    X-DSPAM-Factors: 27,
    Message-ID*mail.gmail.com>, 0.00027,
    X-Spam-Status*BAYES_00, 0.00028,
    ....
    (des espaces ont été dégagés par la mise en forme)

    D'ailleurs dans Kmail (au moins), on voit 2 petites barres de couleurs correspondant aux indices de confiance de dspam et spamassassin.

    Outre l'apport en légèreté par rapport à spamassassin (écrit en perl, et donc vraiment plus coûteux sur ma machine), j'ai été très impressionné par la vitesse d'apprentissage de dspam. Il a très vite pris le dessus sur spamassassin en nombre d'emails filtrés même s'il lui a fallu un peu plus de temps sur certains.

    Par contre, en 2 ans, ses fichiers de données ont qque peu pris du poids, et ce pour seulement à peine un quinzaine d'emails gérés.
    plop:/home/mat# du -sm /usr/local/var/dspam/
    1372 /usr/local/var/dspam/

    Peut-être est ce configurable, je n'en sais rien, mais pour l'instant je vis avec :)

    Si vous n'êtes pas convaincus, essayez le, ca prend pas longtemps, vous pouvez même l'essayer seulement sur votre compte en modifiant le .procmailrc
    :0fw: dspam.lock
    * < 256000
    | /usr/local/bin/dspam --stdout --deliver=innocent,spam --mode=teft --feature=no,wh --user $USER
    • [^] # Re: très bon outil

      Posté par (page perso) . Évalué à  2 .

      > Peut-être est ce configurable, je n'en sais rien, mais pour l'instant je vis avec :)

      dspam a un système de nettoyage automatique, qui permet d'ailleurs d'affiner les statistiques au fur et à mesure de l'évolution du contenu des messages de spam (ceux d'il y a deux ans sont généralement assez différents des actuels)

      J'utilise dspam quasiment depuis le début, après avoir viré spamassassin au bout de deux jours, car à l'époque il nécessitait une maintenance constante des règles si on voulait filtrer les spams, je ne sais pas si ça a changé...

      La documentation de dspam est son point faible, mais ça marche du tonnerre pour moi avec Postfix + DSpam + PostgreSQL, et deux adresses spam|nospam@domaine partagées par tous les utilisateurs d'un domaine (on enseigne à dspam en lui forwardant les messages sur l'adresse correspondante, ou bien depuis son interface web)

    • [^] # Re: très bon outil

      Posté par . Évalué à  2 .

      est-ce qu'il est possible d'obtenir des filtrages fins avec dspam en permettant de filtrer par exemple si un message contient dans son titre le mot "[SPAM]" ou "XXX", et de même pouvoir filtrer le contenu des messages, si cela contient les mots clés que l'on veut éviter (et pour lesquel on peut mettre le message à la poubelle), genre "online pharmacy" ?

      D'ailleurs serait-ce possible avec spamassassin ?

      Only wimps use tape backup: real men just upload their important stuff on megaupload, and let the rest of the world ~~mirror~~ link to it

      • [^] # Re: très bon outil

        Posté par (page perso) . Évalué à  4 .

        dspam, autant que je sache, c'est un filtre bayésien, donc tout son travail, c'est d'analyser les mots, l'ensemble des mots contenus dans le message.
      • [^] # Re: très bon outil

        Posté par (page perso) . Évalué à  4 .

        DSpam a un énorme avantage : tu l'installes (c'est chiant) et tu l'oublies (c'est cool).

        Il n'y a rien de spécial à configurer concernant les entêtes, tu peux juste ajuster le ou les algorithme(s) utilisé ou laisser les valeurs par défaut, mais il n'y a aucune règle à créer ni à maintenir, tout est fait une fois pour toutes, et c'est là que DSpam est fortiche : il s'adapte en temps réel au type de messages que tu reçois.

        Si tu reçois un message de spam, tu le forwardes à spam@tondomaine ou spam-tonnom@tondomaine, par contre si DSpam capture un message alors que ce n'est pas un spam, tu peux utiliser l'interface web pour lui signaler cette erreur : alors DSpam ré-apprend automatiquement le message en question comme non-spam, et c'est tout ce qu'il y a à faire.

        voici par exemples mes statistiques (depuis dernier reset) :


        Spam Good
        Since last reset 131 missed 71 missed
        8013 caught 40546 delivered
        98.391% caught 0.175% missed
        Total processed by filter 413 missed 168 missed
        8646 caught 41575 delivered
        From corpus 83 fed 108 fed


        On voit que j'ai signalé 83 (+131) et 108 (+71) spams à DSpam, et que ça lui a permis d'automatiquement reconnaître correctement près de 49000 messages.

        ça m'a coûté 131+71=202 forwards de mail, plus la configuration initiale de l'engin.
        • [^] # Re: très bon outil

          Posté par (page perso) . Évalué à  3 .

          Si tu reçois un message de spam, tu le forwardes à spam@tondomaine ou spam-tonnom@tondomaine, par contre si DSpam capture un message alors que ce n'est pas un spam, tu peux utiliser l'interface web pour lui signaler cette erreur : alors DSpam ré-apprend automatiquement le message en question comme non-spam, et c'est tout ce qu'il y a à faire.

          Il existe aussi le même mécanisme pour ce cas, il suffit pour celà de forwarder vers notspam@tondomaine.
        • [^] # Re: très bon outil

          Posté par (page perso) . Évalué à  2 .

          Si tu reçois un message de spam, tu le forwardes à spam@tondomaine ou spam-tonnom@tondomaine, par contre si DSpam capture un message alors que ce n'est pas un spam, tu peux utiliser l'interface web pour lui signaler cette erreur : alors DSpam ré-apprend automatiquement le message en question comme non-spam, et c'est tout ce qu'il y a à faire.

          Y a-t-il un mécanisme de cookie, pour éviter que n'importe qui ne puisse t'envoyer des messages pour fausser l'apprentissage de dspam ?
          • [^] # Re: très bon outil

            Posté par (page perso) . Évalué à  3 .

            Dans le cas du réaprentissage par "forward" vers spam@mondomaine ou notspam@mondomaine, il faut activer l'insertion des signatures de spam à la fin corps du message.

            Voici quelques précisions à ce propos:

            Quand un mail arrive et se fait scanner par dspam, celui-ci insère la signature correspondant à son analyse du spam.
            Quand le mail est forwardé vers dspam à nouveau via spam@mondomaine ou notspam@mondomaine, dspam tombe sur la signature et en tire les conséquences en "réaprenant" le mail en tant que spam si forwardé à spam@mondomaine, ou en tant que ham (non spam) si forwardé à notspam@mondomaine.

            A noter que cette signature peut aussi être insérée seulement dans les en-têtes des mails, mais dans ce cas on ne peut plus "entrainer" dspam en forwardant (car réécriture des en-têtes) mais via un plugin comme celui pour dovecot.
        • [^] # Re: très bon outil

          Posté par . Évalué à  -1 .

          Ouais, donc dans tout les cas tu doit lire les 49000 mail marqués spam pour vérifier si il n'y a pas de faux positifs.Trop utile.
        • [^] # Re: très bon outil

          Posté par . Évalué à  2 .

          ça m'a l'air intéressant, par contre si je ne suis pas trop embêté par le spam, j'ai un utilisateur qui a un compte archi "grillé", c'est à dire qu'on utilise son adresse électronique pour envoyer du spam à tout va. Du coup 90% des messages qu'il reçoit c'est avec des sujets comme "Undeliverable: Returned mail: see transcript for details", "Undeliverable: Minimize your expences on enhancing" et ça c'est très difficilement filtrable par l'anti spam. Et si on filtre avec spammassassin sur ce type de sujet, du coup cela risque de bloquer de vrais messages d'erreurs pour tous les autres qui n'ont pas ce problème.

          Du coup je vais essayer avec dspam si on peut gérer cela par utilisateur...

          Only wimps use tape backup: real men just upload their important stuff on megaupload, and let the rest of the world ~~mirror~~ link to it

          • [^] # Re: très bon outil

            Posté par . Évalué à  2 .

            enfin le contenu d'un mail "spam" avec comme sujet "undeliverable" n'est pas le même qu'un mail légitime!
            Déja si le mail est en html, tu peux le jeter sans trop de risque (tous les undeliverable que j'ai vu était envoyé en mode texte).
            • [^] # Re: très bon outil

              Posté par . Évalué à  2 .

              non, le problème justement n'est pas un spam qui se fait passer pour un "undeliverable", mais le message d'un vrai serveur (en mode texte) qui m'indique que l'adresse de courriel (usurpée) d'un de mes utilisateurs, n'a pas pu joindre une adresse inexistante sur leur serveur, alors que ce premier courriel a été envoyé par un spammeur.

              Alors que spammassassin semble bien identifier les spams, lorsque c'est la réponse d'un vrai serveur avec un contenu de spam, on dirait qu'il a plus de mal. D'ailleurs lorsque ces serveurs identifient que c'est du spam, c'est un peu idiot de renvoyer le message vu que dans la majorité des cas ce sont des adresses de personnes qui n'ont rien à voir dans l'histoire.

              Only wimps use tape backup: real men just upload their important stuff on megaupload, and let the rest of the world ~~mirror~~ link to it

    • [^] # Re: très bon outil

      Posté par . Évalué à  3 .

      Juste pour dire que je l'ai mis en place sur le serveur mail de mon entreprise depuis 2 ans, couplé a postfix, dovecot et clamav. Je l'utilise en remplacement de spamassassin parce que le serveur commencait réèlement à s'essoufler devant la masse de spam à rejeter. Et cet outil en complément de postgrey a permis de diminuer considérablement la charge du serveur.

      Je suis satisfait du résultat de l'antispam, car je n'ai eu que très peu de faux positifs et il n'y a que très de spam qui passe. Dans mon cas les résultats sont bien meilleurs que spamassassin, peut être parce qu'il est plus simple de lui apprendre quels mails sont des spams grâce au plugin avec dovecot (cité plus bas) qui est vraiment excellent.

      Un autre détail que je n'ai pas vu mentionné : le filtre de spam est adaptatif par compte mail, c'est a dire que ce qui est considéré comme du spam pour un utilisateur peut au contraire être considéré comme correct pour un autre utilisateur, ce qui me semble primordial en entreprise (les commerciaux et decaideurs aiment bien se prendre 200 mails de pubs et les techs ne veulent rien recevoir).


      Bref je conseille vivement dspam comme solution antispam.


      PS : pour ce qui est de l'espace disque pris, peut etre que cela vient de la configuration avec postfix (ou autre MTA), car au début quand je l'avait installé, il scannait également les mails sortants...
      • [^] # Re: très bon outil

        Posté par (page perso) . Évalué à  3 .

        Un autre détail que je n'ai pas vu mentionné : le filtre de spam est adaptatif par compte mail, c'est a dire que ce qui est considéré comme du spam pour un utilisateur peut au contraire être considéré comme correct pour un autre utilisateur, ce qui me semble primordial en entreprise (les commerciaux et decaideurs aiment bien se prendre 200 mails de pubs et les techs ne veulent rien recevoir).

        C'est vrai et c'est son comportement par défaut. mais il faut signaler tout de même que c'est un comportement configurable, et que l'on peut tout à fait obtenir une base de signature commune à tous les comptes mails ou seulement par groupe/domaine.

        Bref il est extrèmement configurable et peut s'adapter à beaucoup de besoins.
      • [^] # Re: très bon outil

        Posté par . Évalué à  1 .

        Le plugin dovecot fonctionne aussi avec spamassassin ou tout autre antispam. C'est vrai qu'il est très pratique :)
  • # Base de données

    Posté par (page perso) . Évalué à  5 .

    (...) et nécessite un moteur de base de données telle que PostgreSQL, MySQL ou même SQLite (pour de très petites installations seulement).

    Si tu as mis cette parenthèse, c'est que tu dois pouvoir répondre à la question ;-)
    En quoi SQLite n'est conseillable que pour des très petites installations?
    Quel type de test de performance a-t-il été fait pour en arriver à cette conclusion?

    Car bon, bien qu'il y ai "lite" dans le nom du produit, il me semble qu'il est très performant, y compris sur des bases de données assez grosses.
    • [^] # Re: Base de données

      Posté par . Évalué à  8 .

      Parce que SQL Lite est conçu pour travailler en local.
      Si plusieurs MTA font appel au filtrage et consultent une base centralisée, un RDBMS client/serveur est une meilleure solution.
    • [^] # Re: Base de données

      Posté par (page perso) . Évalué à  3 .

      Ma base de donnée dspam fait dans les 10go pour ~600 comptes mails filtrés. D'ailleurs je suis en train de passer de MySQL vers PostgreSQL car le premier commence à montrer ses limites (postfix fait aussi ses query de compte mails valides sur cette base).
      Je doute qu'un SQLite tienne ce genre de charge. Par contre pour une utilisation personnelle, je pense que ça devrais aller.

      Il ya aussi ce lien qui m'a fait écrire ce que j'ai écrit à propos de l'utilisation de SQlite pour Dspam:
      http://imil.net/wp/?p=200
      • [^] # Re: Base de données

        Posté par (page perso) . Évalué à  3 .

        10go ???????

        C'est énorme. je doute très fortement qu'il faille une base de cette taille à un anti-spam baysien pour être efficace.

        AHMA, il y a besoin de nettoyage.
      • [^] # Re: Base de données

        Posté par (page perso) . Évalué à  2 .

        10go pour ~600 comptes mails filtrés
        Questions : Comment faire quand tu as 30000 comptes ?
        • [^] # Re: Base de données

          Posté par (page perso) . Évalué à  3 .

          Tu achètes d'autres machines, ou une baie de stockage ? Avoir plein de serveurs, pour 30000 comptes, ça peut se comprendre.
          • [^] # Re: Base de données

            Posté par (page perso) . Évalué à  1 .

            Si c'est linéaire ça fait quand même 500 GO pour 30000 comptes. Soit environ 20 MO par compte : 20971520 caractères ascii. C'est proprement énorme.
            Si je dois économiser des serveurs par rapport à la charge d'un spamassassin mais qu'au final, il me faut autant voir plus de machine pour la base de données c'est proprement délirant.
            La question qui soutend derrière ça s'est la pertinence d'avoir à maintenir un service de base de données important pour le filtrage du spam.

            Une BDD de 500 GO c'est pas de la gniognote. Quand tu défragmente les tables ça prends pas 3 secondes. Quand ça se corrompt ...
            • [^] # Re: Base de données

              Posté par . Évalué à  1 .

              en même temps c'est filtrer du spam avec des règles à la con^W^W^Wheuristiques, c'est pas comme si c'était la facturation des clients.
        • [^] # Re: Base de données

          Posté par (page perso) . Évalué à  5 .

          Il est vrai que je n'aurais peut-être pas dû donner ce chiffre sans plus d'explications.

          Il y a trois mode d'"entrainement" de Dspam:

          - Teft : Train on Everything. Dspam créé une signature est les jetons(tokens) propres à chaque mot-clé qu'il analyse pour chaque message qu'il voit passer. Ce mode génère énormément de données.
          - TOE: Train On Error. Dspam ne créé ces données que lorsque qu'on lui informe qu'il s'est trompé (en lui forwardant un spam non détecté par exemple). Ce mode génère bien moins de données et donc n'est à utilisé que lorsque Dspam à assez de données pour travailler (~2500 spam et 2500 ham d'analysés).
          - TUM: Train Until Mature: Dspam créé ces données jusqu'à ce qu'il en aie assez pour chaque token pour affirmer que le mail est un spam ou non. Agit comme en Teft tant qu'il n'a pas assez de données pour chaque token.

          L'idéal avec ce fonctionnement est d'abord d'entrainer Dspam avec un corpus représentatif de 2500 spam et 2500 ham. Ainsi on dit a Dspam qu'on est sur de ce qu'on lui donne à analyser et celui-ci ne crée que les données relatives à ces 2500 spam et ham, et on peut le configurer en TOE.

          Or pour ma part n'ayant pas de corpus valable et ayant plein d'espace disque, j'ai configuré Dspam en Teft pour la plupart des compte et en TUM pour certain. Ceci afin d'accélérer l'entrainement de Dspam et ainsi arriver aux fatidiques 2500 spam et ham correctement détectés au premier passage. A ce moment là je pourrais passer en TOE.

          A noter qu'un script de nettoyage de la base de donné est fourni pour virer les tokens orphelins (<5 il me semble) vieux de plus de 90 jours. En Teft cela n'a que très peu d'effet (car des nouveau tokens orphelins sont créés à chaque instant, dspam en créant à chaque message), par contre en TOE celaà doit être efficace pour garder une taille de base constante une fois que Dspam à toutes les données dont il a besoins pour bien filtrer.

          D'ailleurs, il serait intéressant de connaitre la taille des bases de ceux qui ont entrainé Dspam avec un corpus et utilisent uniquement TOE.
  • # Et bogofilter ?

    Posté par (page perso) . Évalué à  3 .

    Dspam est, à l'instar de spamassassin, un logiciel antispam. (...) Dspam est écrit en C

    Quid de bogofilter ? Lui aussi écrit en C et très rapide. Il est souvent moins cité que spamassassin, mais je le trouve très efficace.
    Je me demandais quelles étaient les différences avec Dspam ?

    WeeChat, the extensible chat client

    • [^] # Re: Et bogofilter ?

      Posté par (page perso) . Évalué à  3 .

      J'utilise aussi bogofilter, que je trouve redoutable.

      J'ai l'impression que bogofilter est fait pour être un outil tout simple, plutôt pour une utilisation personnelle avec procmail, par exemple, là où dspam propose toute une solution d'administration.
  • # Tuer le spam à la racine!

    Posté par . Évalué à  1 .

    A quand de réelles mesures contre le spam, contre son émission je veux dire?

    On a bien pondu une "HADOPI" controversée pour lutter contre le téléchargement illégal.

    Le modèle de HADOPI pourrait s'appliquer parfaitement au spam, et sans que personne n'y trouve rien à redire.
    1) je signale un spam venant d'une adresse IP,
    2) de nombreuses personnes en font de même,
    3) après vérification du fait que cette adresse IP envoie un spam, on prévient son responsable que la ligne sera coupée au bout de trois avertissements.
    Spam une fois, spam deux fois, au troisième on coupe!

    Pas d'interception de communications privées, ce sont les spammés eux-mêmes qui signaleraient l'offense. Pas de bonne raison de spammer (du genre offre légale trop chère ou pas interopérable), aucun spammé ne défendra son droit à être spammé, et aucun spammeur n'osera nous dire qu'il a le droit de spammer.

    Une coopération à l'échelle internationale existe déjà pour lutter contre toutes sortes de crimes et délits, pourquoi ne pas y inclure le spam?

    Cette réflexion me vient à l'esprit chaque fois que je reçois un spam, et que je regarde l'IP qui l'a envoyé: pourquoi ce type garde un accès à Internet alors qu'il spamme, bon sang?? On cherche des ennuis pour moins que ça, de nos jours!

    THIS IS JUST A PLACEHOLDER. YOU SHOULD NEVER SEE THIS STRING.

    • [^] # Re: Tuer le spam à la racine!

      Posté par (page perso) . Évalué à  10 .

      je regarde l'IP qui l'a envoyé: pourquoi ce type garde un accès à Internet alors qu'il spamme, bon sang??

      La plupart du temps, ce n'est qu'un intermédiaire, et pas un spammeur lui-même. Il relaye probablement du spam car il a un OS en carton ou une sécurité faite avec les pieds (ou inexistante).

      Remonter au vrai spammeur est autrement plus difficile, pour pas dire impossible dans la plupart des cas...

      WeeChat, the extensible chat client

      • [^] # Re: Tuer le spam à la racine!

        Posté par . Évalué à  7 .

        La plupart du temps, ce n'est qu'un intermédiaire, et pas un spammeur lui-même. Il relaye probablement du spam car il a un OS en carton ou une sécurité faite avec les pieds (ou inexistante).

        Et alors ? Que ce soit lui l'origine ou pas, qu'il n'ait pas de système d'exploitation sécurisé le rend de facto nuisible sur Internet. Hop, on coupe !

        ­La faculté de citer est un substitut commode à l'intelligence -- Somerset Maugham

        • [^] # Re: Tuer le spam à la racine!

          Posté par (page perso) . Évalué à  3 .

          En quoi est-ce la fonction d'un relais de filtrer les spams ?

          Que faire des faux positifs ?
          En quoi le fait de relayer des spams donne une idée de la sécurisation d'un serveur dont la fonction est justement de faire relais ?
          • [^] # Re: Tuer le spam à la racine!

            Posté par (page perso) . Évalué à  2 .

            À mon avis, la fonction d'un relai est de fournir un interlocuteur. Exemple :
            1. Monsieur Michu envoie son courrier via <smtp.libre.fr>.
            2. Je reçois un spam qui est passé par <smtp.libre.fr>.
            3. J'écris à <abuse@libre.fr> pour leur signaler qu'un de leurs utilisateurs envoie du spam.
            4. Libre se débrouille avec Monsieur Michu pour le faire cesser (qu'il soit ou non directement responsable : ça ne me concerne pas).
            • [^] # Re: Tuer le spam à la racine!

              Posté par (page perso) . Évalué à  2 .

              Tu ne me parles pas d'un relais là, tu me parles du serveur SMTP qui a connaissance de l'envoyeur. Je suis bien d'accord qu'il devrait y avoir un "coût" à l'envoi de mail, pas forcément sur le relais.

              Par exemple, linuxfr te propose un relais de mail avec ton compte utilisateur, il reçoit des mails pour toi, sans connaissance des expéditeurs : dois-tu rater un mail parce qu'il aura été pris en faux positif, ou doit-il tout t'envoyer charge à toi d'avoir un anti-spam efficace ?
              • [^] # Re: Tuer le spam à la racine!

                Posté par (page perso) . Évalué à  3 .

                Je pensais aux relais SMTP, fournis par tous les FAI. Les comptes de messagerie avec redirection, ça n'a rien à voir avec le problème, je trouve.
                • [^] # Re: Tuer le spam à la racine!

                  Posté par (page perso) . Évalué à  2 .

                  Les comptes de messagerie avec redirection, ça n'a rien à voir avec le problème, je trouve.

                  c'est pourtant ce que fait Free... mettant tout le monde dans le même panier.
                  • [^] # Re: Tuer le spam à la racine!

                    Posté par (page perso) . Évalué à  2 .

                    Bon, alors je ne comprends pas de quoi il s'agit. Free fournit des adresses @free.fr qui sont renvoyées vers d'autres ?
                    • [^] # Re: Tuer le spam à la racine!

                      Posté par (page perso) . Évalué à  3 .

                      Non, appliquant ce que tu proposes (mais pas pour le bien de ses utilisateurs), Free blackliste des relais (et non des serveurs SMTP associés à des utilisateurs "connus"/contactables).

                      Cela empêche notamment le bon fonctionnement de listes de diffusions par exemple (ceux en @free.fr voient tous leurs mails envoyés vers /dev/null pendant la durée du blacklistage, ce qui fait que les utilisateurs reçoivent épisodiquement des mails et pendant de longues périodes, pas du tout).
                      • [^] # Re: Tuer le spam à la racine!

                        Posté par (page perso) . Évalué à  2 .

                        Ce que tu appelles relais, ce sont donc des redirections de messages, pas des relais au sens SMTP… Et bien, ça dépend du cas :
                        - si le domaine d'expédition a une politique SPF restrictive, renvoyer simplement le message est inacceptable ;
                        - pour les domaines qui n'ont pas de politique SPF, les messages ne devraient être refusés que s'il y a une bonne raison de bannir le serveur de redirection.

                        Dans le premier cas, il faut adapter les en-têtes, en fait, à la redirection : il y a des en-têtes pour ça, du type Resent:… Dans le second cas, le problème vient du fournisseur de messagerie du destinataire : s'ils appliquent une politique ultra-restrictive, c'est leur problème si ça fait des faux positifs.
        • [^] # Re: Tuer le spam à la racine!

          Posté par . Évalué à  2 .

          Tu as du trop regarder http://www.ca-va-couper.fr/ ...
    • [^] # Re: Tuer le spam à la racine!

      Posté par (page perso) . Évalué à  2 .

      Les adresses abuse@ existent depuis longtemps, précisément pour cela.

      Personnellement, j'utilise un bayésien pour filtrer le spam, et je signale à abuse@[fournisseur de la connexion] les abus qui ne sont pas détectables par le bayésien. Typiquement, des messages de sociétés qui font de la publicité abusive (donc, techniquement, du spam) mais sans parler de viagra et de casino en ligne, par exemple.
      • [^] # Re: Tuer le spam à la racine!

        Posté par (page perso) . Évalué à  1 .

        tu peux aussi passer par spamcop qui fera le boulot de prévenir les différents abuse et qui en plus maintient une liste des @IP spammeurs
        • [^] # Re: Tuer le spam à la racine!

          Posté par (page perso) . Évalué à  2 .

          J'ai plutôt une mauvaise opinion des RBL en général, donc quand je peux m'en occuper moi-même, je préfère. Quant à prévenir différents abuse@, il n'y en a qu'un seul à prévenir, celui du fournisseur qui a permis au message de partir : FAI dans le cas d'un envoi direct SMTP, fournisseur de messagerie dans le cas d'un webmail, n'est-ce pas ?
      • [^] # Re: Tuer le spam à la racine!

        Posté par . Évalué à  3 .

        Le problème est que les mails envoyés à abuse@... sont souvent redirigés vers /dev/null et donc ça ne sert pas à grand chose.
        • [^] # Re: Tuer le spam à la racine!

          Posté par (page perso) . Évalué à  3 .

          Ah, mais les gens qui ne lisent pas leurs messages d'abuse@ et dont les utilisateurs envoient du spam mériteraient clairement d'être complètement bloqués, pour le coup.
    • [^] # Re: Tuer le spam à la racine!

      Posté par (page perso) . Évalué à  5 .

      Une coopération à l'échelle internationale existe déjà pour lutter contre toutes sortes de crimes et délits, pourquoi ne pas y inclure le spam?

      Ce que tu proposes, c'est en gros les RBL.
      Ca existe déjà donc.
      Et on voit déjà leur limites (grosses entreprises légitimes qui se font blacklister, faux positifs à foison, et j'en passe).
      Ca revient au même que ce qu'on n'accepte pas avec HADOPI : couper la connexion d'une personne qui s'est fait pirater son PC / son Wifi et qui ne comprend rien à la chose.

      Alors, "nationaliser" la chose par des lois, hum, non, je n'y tiens pas trop.
      Tu as une autre idée, plus viable?
      • [^] # Re: Tuer le spam à la racine!

        Posté par (page perso) . Évalué à  3 .

        Je vous trouve dur avec les rbl.

        J'utilise énormément zen.spamhaus.org (qui certes n'est pas totalement gratuite) et je trouve qu'il y a de très bon résultats.
        Je l'utilise au niveau smtp donc les spam n'encombrent pas mes spools et le travail de l'antispam est réduit.
        La règle rbl_check de spamassassin est désastreuse dans certains cas. Mais je pense que l'utilisation des rbl dans ce contexte n'est pas appropriée.
        Les rbl doivent aider ta mta à décider si légitimement elle peut accepter ce mail ou pas.

        A ce propos je ne saurais que trop vous conseiller spamd :
        http://www.openbsd.org/cgi-bin/man.cgi?query=spamd&sekti(...)
        Il est assez rigolo de voir pf embourber un bot dans une lenteur affligeante.

        >grosses entreprises légitimes qui se font blacklister
        >faux positifs à foison, et j'en passe

        Il suffit de lire sa boite abuse, et de réagir vite lorsqu'un problème est avéré.
        Une grosse entreprise, si légitime soit elle qui écrit à une spamtrap est un spammeur comme un autre.
        C'est vraiment une question d'attitude.
        Free n'est jamais blacklisté. FranceTélécom ou OVH tout le temps.
        C'est juste un exemple.
        • [^] # Re: Tuer le spam à la racine!

          Posté par . Évalué à  1 .

          En quoi l'utilisation de rbl_check dans spamassassin est désastreuse ?

          Au contraire je trouve cela assez pratique car ça réduit le nombre de faux positifs dans la mesure où spamassassin utilise aussi d'autres règles pour définir s'il s'agit ou non d'un spam.
          • [^] # Re: Tuer le spam à la racine!

            Posté par (page perso) . Évalué à  2 .

            >En quoi l'utilisation de rbl_check dans spamassassin est désastreuse ?
            C'est du simple vécu.
            Essaye un filtrage avec et sans. Tu verra que seul le nombre de faux positifs diminue (je parle de la règle par défaut sans configuration particulière).

            Cette règle au mieux ne sert à rien. L'utilisation de sorbs en particulier manque de finesse. Je ne parle même pas de contrôler les mails en sortie.

            Brèf ça fait beaucoup de dns pour pas grand chose. Je me trompe peut-être mais c'est mon impression.

            au fait tant que j'y suis j'ai pondu ça l'autre jour si y en a que ça intéresse


            #!/usr/bin/perl -w

            use strict;
            use Net::DNS;

            my $ip = $ARGV[0];
            my $usage="Usage dnsblcheck ip";
            die $usage unless($ip);

            sub rev {
            my $ip = shift;
            my @tab = split(/\./,$ip);
            @tab = reverse(@tab);
            return join('.',@tab);
            }

            sub resolve {
            my ($ip, $blacklist) = @_ ;
            my $res = Net::DNS::Resolver->new;
            my $qs = rev($ip);
            $qs .= '.'.$blacklist;
            my $query = $res->query("$qs","A");
            if ($query) {
            ($query->answer)[0]->print;
            $query = $res->query("$qs","TXT");
            if ($query) {
            ($query->answer)[0]->print;
            }
            } else {
            print "Pas dans $blacklist \n";
            }
            }
            my @blacklists = qw/ list.dsbl.org
            bl.spamcop.net
            dynablock.easynet.nl
            blackholes.easynet.nl
            cbl.abuseat.org
            dnsbl.sorbs.net
            dnsbl.njabl.org
            zen.spamhaus.org
            spews.dnsbl.net.au
            relays.ordb.org
            proxies.blackholes.easynet.nl
            dsbl.org /;
            foreach(@blacklists){
            resolve $ip, $_;
            }
        • [^] # Re: Tuer le spam à la racine!

          Posté par (page perso) . Évalué à  4 .

          Il suffit de lire sa boite abuse, et de réagir vite lorsqu'un problème est avéré.
          Une grosse entreprise, si légitime soit elle qui écrit à une spamtrap est un spammeur comme un autre.
          C'est vraiment une question d'attitude.


          Ah oui, et quand tu es un petit abonné ADSL avec un IP dynamique ? Tu ne peux pas poster ? L'Internet, ce n'est pas réservé aux grandes entreprises…
          • [^] # Re: Tuer le spam à la racine!

            Posté par (page perso) . Évalué à  -2 .

            >Ah oui, et quand tu es un petit abonné ADSL avec un IP dynamique ? Tu ne >peux pas poster ? L'Internet, ce n'est pas réservé aux grandes entreprise

            Non tu ne peut pas envoyer des mail à partir d'une ip dynamique et c'est normal. Par contre en choissant un fournisseur d'accès, pas un proxy pour héberger un serveur connecté à l'internet, ou en définissant un smarthost ça marche plutôt bien.

            Et ce n'est pas spécialement plus cher.
            • [^] # Re: Tuer le spam à la racine!

              Posté par (page perso) . Évalué à  7 .

              Non tu ne peut pas envoyer des mail à partir d'une ip dynamique et c'est normal.

              Non, ce n'est pas normal, ou alors, c'est le fait d'attribuer aux abonnés des IP dynamiques qui est anormal. Il s'agit d'avoir une connexion à Internet, pas un accès à sens unique, que diable !

              Sinon, je ne comprends pas ta solution : me conseilles-tu de choisir un FAI à IP fixes ?
              • [^] # Re: Tuer le spam à la racine!

                Posté par (page perso) . Évalué à  -3 .

                >Sinon, je ne comprends pas ta solution : me conseilles-tu de choisir un FAI à IP fixes ?

                Tu peux avoir un FAI a IP fixe (ce n'est pas suffisant) ou utiliser un smarthost (serveur smtp).

                >Non, ce n'est pas normal, ou alors, c'est le fait d'attribuer aux abonnés des IP dynamiques qui est anormal

                Une IP identifie une ressource sur internet. Lorsque l'ip est sur une plage dynamique elle identifie une ressource de type "abonné adsl" donc une ou plusieurs machine clientes pas un serveur. Quelque chose qui n'est "pas un serveur" n'a pas a envoyer des mails.

                Cette chose n'est "pas un serveur" pas simplement par décret. Mais pour une raison simple : lorsque tu as une ip dynamique, tu as effectivement vraiment accès à internet. Mais puisque tu n'est pas identifiable, internet n'a pas accès à toi. Et ça c'est la base actuelle, l'esprit que tous les acteurs essayent d'insuffler au protocole smpt ; des mta qui se parlent et se repondent.
                • [^] # Re: Tuer le spam à la racine!

                  Posté par . Évalué à  5 .

                  > puisque tu n'est pas identifiable, internet n'a pas accès à toi

                  Au niveau IP, si... ce qui manque, c'est le reverse DNS (IP fixe, ou pas - ça ne change rien sur le fond)...

                  ... ce qui montre bien que le filtrage des IP qui ont un reverse non délégué par le FAI au client (ie les reverse en blabla.abo.blabla.truc) est un emplâtre sur une jambe de bois...

                  ... puisque cette "pratique" repose sur le simple décret, majoritaire, que "les connexions des particuliers n'ont pas à faire tourner des serveurs"...



                  Dire qu'on ne peut pas laisser les particuliers émettre des mails parce qu'ils n'ont pas de reverse DNS propre, c'est présenter les choses sous un drôle d'ordre... S'ils n'ont pas de reverse DNS propre, c'est justement parce que les FAI ne semblent majoritairement pas intéressés par l'utilisation de serveurs sur les lignes à bas-coût (et encore... par exemple, les neurones fumeux de chez Orange ont décidé de ne même pas donner la délégation du reverse sur les forfaits pro... apparemment, ils arguent que ce n'est pas gérable pour les particuliers - ça fait peur).
          • [^] # Re: Tuer le spam à la racine!

            Posté par . Évalué à  2 .

            Et alors? On peut parfaitement savoir qui avait quelle IP à quelle date (d'ailleurs on ne se gêne pas pour remonter à l'utilisateur le cas échéant).

            La question c'est: comment se fait-il qu'on va poursuivre le responsable d'une IP qui commet un acte délictieux sur le net.. sauf s'il s'agit d'un spam.

            Qu'il ne soit pas lui-même l'émetteur volontaire du spam n'y change strictement rien, il est responsable de sa connexion, point final.

            THIS IS JUST A PLACEHOLDER. YOU SHOULD NEVER SEE THIS STRING.

            • [^] # Re: Tuer le spam à la racine!

              Posté par (page perso) . Évalué à  4 .

              Peut-être parce qu'un acte dit délictueux est autrement dit un délit et tombe donc déjà sous le coup de la loi. Et sans doute pour cela que tu voulais pondre une nouvelle loi ?
              J'espère que tu es bien informé qu'il ne suffit pas de « pondre » une loi pour que tout change ? Encore faut-il que les volontés politiques et financières suivent derrière. Combien de lois pondues ces dernières années qui attendent toujours leurs premiers décrets d'applications (plusieurs années après) alors que d'autres les ont eu tout de suite (je te laisse deviner lesquelles).
              • [^] # Re: Tuer le spam à la racine!

                Posté par . Évalué à  2 .

                Le spam est un délit. Bon. Une loi le punit déjà.

                Tu m'expliques pourquoi je n'ai aucune chance d'obtenir une condamnation de M. Michou, si celui ci m'envoie un spam, et après que j'ai fait remonter l'information à l'adresse "abuse@" donnée par son whois?

                Remarque, on est dans un pays qui n'applique la loi que quand ça l'arrange, c'est vrai.

                THIS IS JUST A PLACEHOLDER. YOU SHOULD NEVER SEE THIS STRING.

                • [^] # Re: Tuer le spam à la racine!

                  Posté par (page perso) . Évalué à  4 .

                  Tu m'expliques pourquoi je n'ai aucune chance d'obtenir une condamnation de M. Michou, si celui ci m'envoie un spam, et après que j'ai fait remonter l'information à l'adresse "abuse@" donnée par son whois?

                  En tant que civil tu ne peux pas attaquer au pénal, ce rôle est réservé à l'état. Par contre tu peux très bien attaquer M. Michou et demander des dommages-intérêts.

                  Remarque, on est dans un pays qui n'applique la loi que quand ça l'arrange, c'est vrai.

                  Il y a une différence entre appliquer la loi et la respecter. La loi contre la vente liée n'est pas vraiment appliquée par le gouvernement, par contre en tant que citoyen tu peux faire respecter cette loi et obtenir le remboursement de ton OS.
                  • [^] # Re: Tuer le spam à la racine!

                    Posté par . Évalué à  3 .

                    Merci pour ces remarques pertinentes ;+)

                    Le problème, c'est que des "dommages et intérêts" pour un spam, ça ne va pas loin.

                    Ah, les "class actions" ça manque, dans ce pays..

                    THIS IS JUST A PLACEHOLDER. YOU SHOULD NEVER SEE THIS STRING.

                  • [^] # Re: Tuer le spam à la racine!

                    Posté par . Évalué à  2 .

                    En tant que civil tu ne peux pas attaquer au pénal, ce rôle est réservé à l'état.
                    Vrai, mais tu peux toujours porter plainte, avec un dossier civil. Si le travail est déjà maché, y'a pas trop de raison que le procureur classe la plainte.
                • [^] # Re: Tuer le spam à la racine!

                  Posté par (page perso) . Évalué à  5 .

                  Donc le spam est déjà puni par la loi (notamment la LCEN).
                  Pourquoi veux-tu une nouvelle loi ? Sans doute parce que la première est inefficace ?
                  En effet, comment veux-tu condamner des spammeurs dont les adresses IP d'origines ne sont pas en France ? En condamnant chaque citoyen coupable de ne pas avoir tenu à jour son système ? Et pourquoi ne pas condamner les éditeurs de logiciels pendant qu'on y est ?
                  • [^] # Re: Tuer le spam à la racine!

                    Posté par . Évalué à  2 .

                    Pour les spammeurs dont l'IP d'origine n'est pas en France, c'est certes délicat.
                    Ceci dit, ça devrait être possible, au moins au sein de l'Europe.
                    Quelque chose me dit que si une adresse IP envoie (par exemple) une lettre de menace jugée sérieuse, à la Présidence de la République, la coopération internationale fonctionnera. Peut-être pas jusqu'en Chine, certes.
                    Alors, pourquoi pas la même efficacité de la justice internationale?

                    Et condamner les citoyens coupables d'avoir relayé du spam pour cause de système pas à jour, je suis absolument pour. C'est de leur responsabilité qu'il s'agit. On condamne tous les jours des citoyens qui ont causé des dommages à autrui sans le vouloir, parce que leur chien à mordu quelqu'un, leur voiture freinait mal et a tué quelqu'un d'autre, leur cheminée est mal réglée et pollue le voisinage..
                    il n'y a aucune raison de faire un régime d'exception pour ceux dont l'ordinateur pollue des milliers de boîtes mails, surcharge les réseaux, fait perdre du temps à des milliers de personnes, et leur fait courir le risque de ne pas lire, voire de supprimer un message important.

                    THIS IS JUST A PLACEHOLDER. YOU SHOULD NEVER SEE THIS STRING.

                    • [^] # Re: Tuer le spam à la racine!

                      Posté par (page perso) . Évalué à  3 .

                      Et condamner les citoyens coupables d'avoir relayé du spam pour cause de système pas à jour, je suis absolument pour. C'est de leur responsabilité qu'il s'agit.

                      Ah? Une parsonne qui est à fond pour HADOPI et la riposte "graduée"!
                      (ben oui, si tu t'ai fait pirater ton accès Wifi, c'est ta responsabilité, hop 1 an sans Internet, ça t'apprendra à laisser ton WiFi ouvert)

                      On condamne tous les jours des citoyens qui ont causé des dommages à autrui sans le vouloir, parce que leur chien à mordu quelqu'un, leur voiture freinait mal et a tué quelqu'un d'autre, leur cheminée est mal réglée et pollue le voisinage..

                      Oui, et un juge passe par la, adapte la sanction à la gravité de la chose.
                      Et si il voit passer un spammer qui s'est fait pirater, il va voir l'impact : nul, et donc... Rien
                      Et si il ne voit pas passer (comme pour HADOPI), c'est un déni de justice.

                      Tu veux quoi au juste? Que tout le monde aille en prison car il a fait une petite faute d'inattention? Les prisons vont être surchargée! Que tout le monde aie son Internet coupé? Ca va faire bien descendre l'économie... (TOUT est à base d'email maintenant, donc sans Internet c'est dur).
                      • [^] # Re: Tuer le spam à la racine!

                        Posté par . Évalué à  1 .

                        Je suis contre HADOPI, pour deux raisons:

                        - le téléchargement dit "illégal" a de bonnes raisons d'être. On peut télécharger une oeuvre qui n'est pas disponible de façon légale, ou pour des raisons d'interopérabilité. On peut télécharger une oeuvre en VOST pour ne pas attendre deux ans avant qu'elle sorte en DVD DRMisé et hors de prix.
                        A contrario, je ne connais aucun spammeur qui ait une bonne raison de spammer. S'il y en a un, qu'il ne prenne même pas la peine de donner des arguments: il donne son adresse, on vient le lyncher, ça ira plus vite.

                        - il s'agit de l'interception de communication privée, entre (par exemple) The Pirate Bay, un seeder A et un leecher B. Alors que aucun d'entre eux ne se plaint de la communication.
                        A contrario, le signalement d'un spam est un acte volontaire de la part du spammé: il a reçu une communication qui porte atteinte à son usage de l'Internet, et veut que ça cesse. Exactement comme une tentative d'intrusion dans son système informatique. Si je reçois des tentatives d'exploitation de faille sur un serveur, et que ces tentatives nuisent à l'usage de ma connexion (par utilisation abusive de ma bande passante, surcharge du serveur), ça parait logique que je sois en droit d'engager des poursuites et d'obtenir une condamnation. Pourquoi agir différement s'il s'agit de spam, lequel consomme aussi de la bande passante, et induit au minimum une surcharge de travail humain?

                        Je n'ai jamais dit que je souhaitais la prison pour un spammeur involontaire. Entre la prison et laisser faire, il y a une marge. Tu trouves ça normal qu'on envoie une lettre menaçant de couper son accès à Internet, à quelqu'un qui télécharge (par exemple) le DivX d'un DVD qui a été rendu illisible sur son système, et que dans le même temps on n'informe même pas quelqu'un qui envoie des milliers de courriers indésirables chaque jour, qu'il fait chier des milliers de personnes et qu'il devrait arrêter avant que des mesures ne soient prises à son encontre?

                        THIS IS JUST A PLACEHOLDER. YOU SHOULD NEVER SEE THIS STRING.

                        • [^] # Re: Tuer le spam à la racine!

                          Posté par (page perso) . Évalué à  6 .

                          Les spammeurs d'internet ne font que remplir mon répertoire « SPAM » de ma boite mail, une fois par semaine j'ai un spam qui passe.

                          Par contre je n'aime pas voir ma boite au lettre bourré au raz bord de publicités, je n'aime pas les coups de fils (parfois plus de 3 dans la journée) pour me vendre une cuisine ou des fenêtre, je n'aime pas qu'on m'emmerde quand je marche dans la rue pour me donner des prospectus sur des forfaits à 50 € (youpi), je n'aime pas qu'on coupe 2 fois un film pour y insérer des pubs et je n'aime pas recevoir des spams SMS…

                          Bref, avant d'attaquer Mme Michu parce qu'elle a cliqué trop vite sur un lien, je pense qu'il y a d'autres « messages non sollicités » à faire disparaitre.
                          • [^] # Re: Tuer le spam à la racine!

                            Posté par . Évalué à  3 .

                            Pas faux, il y a beaucoup de nuisances publicitaires.
                            Les deux pauses de pub pendant le film, ça sert à payer les droits de diffusion, je le dis au cas où ça t'aurait échappé..
                            Il existe des autocollants "antispam" à mettre sur sa boîte aux lettres, pour être tranquille.
                            Le spam par SMS et téléphone coûte plus cher au spammeur que le spam par mail, mais en effet c'est une nuisance contre laquelle il faudrait se décider à lutter aussi.

                            THIS IS JUST A PLACEHOLDER. YOU SHOULD NEVER SEE THIS STRING.

                            • [^] # Re: Tuer le spam à la racine!

                              Posté par . Évalué à  3 .


                              Il existe des autocollants "antispam" à mettre sur sa boîte aux lettres, pour être tranquille.

                              Pour dire qu'on veut être tranquille ?

                              Chez moi, cet autocollant est régulièrement arraché !
                            • [^] # Re: Tuer le spam à la racine!

                              Posté par (page perso) . Évalué à  2 .

                              Les deux pauses de pub pendant le film, ça sert à payer les droits de diffusion, je le dis au cas où ça t'aurait échappé..
                              Sur le service public, c'est la redevance qui paye (maintenant) les droits.
  • # Pour info

    Posté par (page perso) . Évalué à  2 .

    J'utilise dspam en complément de postfix et de dovecot en Maildir et imap. J'ai crée un petit script cron qui agit sur deux dossiers, MissedSpam et NotSpam, pour l'apprentissage. Conclusion, c'est efficace, tout enrestant très simple pour les utilisateurs. Le script :
    #!/bin/sh
    
    # train-spam.sh
    # 
    # Description: Checks each user's /home/Domain/Maildir/.MissedSpam
    # directories to see if the user placed any "missed" spam 
    # messages which got through DSPAM to their INBOX.
    # If there are messages in this directory, then the script
    # invokes sa-learn to update the site-wide tokens to try
    # and improve the defenses for next time...
    #
    
    # learn_spam - Function which takes a directory and a user as
    #  arguments, and then feeds that directory to our anti-spam
    #  applications for further SPAM training.
    #
    # Arguments: 
    #  $1 - Directory name containing SPAM emails. Required
    #  $2 - User name. If it is not provided, $USER will be used.
    #
    # Example:
    #  learn_spam /home/domain/alank/Maildir/.MissedSpam/cur alank
    #
    function learn_spam {
    
        # loop through all emails in given directory
        for email in $(ls $1); do
    
            # process SPAM email using DSPAM
            /usr/bin/dspam --mode=teft --source=error --class=spam --feature=chained,noise --user $2 < $1/$email
            echo -n "."
    
            # move SPAM into trash
            mv $1/$email $3
    
        done # end of email loop
    
    } # end function learn_spam
    
    # learn_ham - Function which takes a directory and a user as
    #  arguments, and then feeds that directory to our anti-spam
    #  applications for further HAM training.
    #
    # Arguments: 
    #  $1 - Directory name containing HAM emails. Required
    #  $2 - User name. If it is not provided, $USER will be used.
    #
    # Example:
    #  learn_ham /home/domain/alank/Maildir/.NotSpam/cur alank
    #
    function learn_ham {
    
        # loop through all emails in given directory
        for email in $(ls $1); do
    
            # process HAM email using DSPAM
            /usr/bin/dspam --mode=teft --source=error --class=innocent --feature=chained,noise --user $2 < $1/$email
            echo -n "."
    
            # move HAM into inbox
            mv $1/$email $3
    
        done # end of email loop
    
    } # end function learn_ham
    #
    # Script starts here!
    #
    domain=$1
    
    # loop through all user home directories
    for file in $(ls /home/$domain); do
    
        # if there is a MissedSpam maildir 
        if [ -d /home/$domain/$file/Maildir/.MissedSpam/cur ]; then
        
            # then process any missed SPAM
            echo -n "Missed spam for $file:"
            learn_spam /home/$domain/$file/Maildir/.MissedSpam/cur $file /home/$domain/$file/Maildir/.Trash/cur 
            learn_spam /home/$domain/$file/Maildir/.MissedSpam/new $file /home/$domain/$file/Maildir/.Trash/new 
            echo ""
        
        fi # end if
    
        # if there is a NotSpam dir
        if [ -d /home/$domain/$file/Maildir/.NotSpam/cur ]; then
        
            # then process any falsely identified spam, i.e. HAM
            echo -n "False positives for $file:"
            learn_ham /home/$domain/$file/Maildir/.NotSpam/cur $file /home/$domain/$file/Maildir/cur 
            learn_ham /home/$domain/$file/Maildir/.NotSpam/new $file /home/$domain/$file/Maildir/new 
            echo ""
    
        fi # end if
        echo ""
    
    done # end for loop
    
    echo "Done!"
    
    Pour la partie cron :
    #!/bin/sh
    
    # use maildir folder for spam training
    date=`date +"%d/%m/%y %H:%M"`
    
    echo -e "\n---$date---" >>/var/log/dspam-train.log
    /usr/local/bin/dspam-maildir-train example.com >>/var/log/dspam-train.log
    /usr/local/bin/dspam-maildir-train mon-domaine.org >>/var/log/dspam-train.log
    
    exit 0
    
    
    C'est écris en quirty, mais c'est fonctionnel...
    • [^] # Re: Pour info

      Posté par . Évalué à  5 .

      À noter l'existence du plugin antispam [1] pour dovecot qui permet de spécifier un répertoire "spam" et qui, lorsqu'on y met un message, le classifie comme spam pour dspam (et autres .. ?) et qui, lorsqu'on en sort un message, le classifie comme non spam !

      (Avec prise en compte du cas particulier de la poubelle bien sûr :)

      [1] http://johannes.sipsolutions.net/Projects/dovecot-antispam
      • [^] # Re: Pour info

        Posté par (page perso) . Évalué à  4 .

        À noter l'existence du plugin antispam [1] pour dovecot qui permet de spécifier un répertoire "spam" et qui, lorsqu'on y met un message, le classifie comme spam pour dspam (et autres .. ?) et qui, lorsqu'on en sort un message, le classifie comme non spam !

        Je ne sais pas qui tu es mais si un jour je te vois, je t'embrasse :)
      • [^] # Re: Pour info

        Posté par . Évalué à  2 .

        Je confirm, je l'utilise ce plugin sur le serveur de mail de mon entreprise et c'est formidable... C'est vraiment a mon sens le moyen le plus simple de signaler un spam ou bien un faux positif. Meme la secrétaire a compris le truc... C'est beaucoup plus sympa que de devoir forwarder un mail a une adresse particuliere.
  • # Classement triple ?

    Posté par (page perso) . Évalué à  3 .

    dspam est-il capable de classer en trois catégories : spam, incertain et non-spam ?

    C'est une fonctionnalité que j'utilise avec bogofilter, et c'est très pratique pour éviter de devoir chercher les faux-positifs dans des centaines de messages.
    • [^] # Re: Classement triple ?

      Posté par . Évalué à  2 .

      Tu peux à l'aide de l'interface web, trier par note de spamitude, donc ne vérifier que les prétendus spam à petit score.

      Ensuite (là je suis moins sûr mais je crois que c'est ça), tu peux lui dire de ne délivrer les messages qu'en dessous d'un certain seuil, mais étant considéré comme spam.
  • # Quid de « Popfile » ?

    Posté par (page perso) . Évalué à  1 .

    Bonjour,

    J’utilise actuellement l’excellent Popfile. Si je suis très satisfait du résultat, je reconnais qu’il a besoin d’une maintenance régulière et que celle-ci n’est pas des plus ergonomiques…

    Comme l’a dit quelqu’un, les SPAM d’aujourd’hui ne sont pas les mêmes que ceux d’hier. L’ennui, c’est que l’apprentissage/rectification se fait via une IHM web (localhost:8080) et que pour un utilisateur de base (ma femme par exemple), la contrainte d’avoir à se souvenir de l’adresse ou de faire un raccourci (qu’elle ne fera pas d’elle-même), plus le fait que cet apprentissage se fait au sein d’une interface dont elle n’a pas l’habitude, font que cette rectification n’est pas assurée… Je suis en général le seul à prendre la peine de corriger Popfile ; et là, l’inconvénient de Popfile (une seule configuration pour tous) devient un avantage : je corrige pour nous deux.

    Étant donnée cette faiblesse de Popfile, supposons que je sois prêt à me contenter de deux catégories (Spam ou non, contrairement à Popfile, qui autorise autant de catégories qu’on le souhaite), comment DSPAM est-il en comparaison ? Mieux ou moins efficace que Popfile ?
    Et bogofilter, dont je n’avais pas entendu parler ?

    Yves.
    • [^] # Re: Quid de « Popfile » ?

      Posté par (page perso) . Évalué à  2 .

      Avec dspam tu as aussi une interface web de gestion, et tu peux aussi le configurer pour un apprentissage global, tu corrige le filter et la correction est valable pout tout le monde (ca s'appelle les "global users" dans dspam).

      Par contre ne connaissant ni popfile ni bogofilter, je me garderais de faire de plus amples comparaisons.

Suivre le flux des commentaires

Note : les commentaires appartiennent à ceux qui les ont postés. Nous n'en sommes pas responsables.