Faire un don ! | | style | statistiques | contactez-nous | plan | lettre d'information

Journal : Antispam pour blog et forum

Posté par Victor STINNER (page perso, ) le 22 avril 2008
Las du spam sur mon blog et sur le forum de ma société, j'ai écrit un antispam. Il utilise diverses règles générant une note globale pour le message : analyse des URLs, de mots clés, de l'adresse de courriel, de la longueur du message, etc. Pour commencer, une note négative est attribuée (ex: -5). Ensuite, chaque règle rajoute ou soustrait des points à la note globale.

Exemple de spam :
Par : swingers ads
Site Web : http://sexy.ads6x.com

Adult personal ads from swingers and swappers, couples, singles, bi,
http://sexy.ads6x.com >swingers ads and wives amateur couples Swingers Club

Et la sortie du programme antispam :
./antispam.py --verbose -c haypocalc.conf sexy
Match word (+2.0): sexy
Match word (+1.0): adult
Match word (+2.0): sexy
Match word (+1.0): amateur
Match URL (+1.5): http://sexy.ads6x.com
Match URL (+1.5): http://sexy.ads6x.com
Match email domain (+1.0): @gmail.com
sexy score: +7.00 ***SPAM***

L'antispam est écrit en Python et distribué sous licence GPL :
http://haypo.hachoir.org/trac/wiki/antispam

L'algorithme est expliqué sur la page web du projet en anglais. J'ai écrit un article en français qui présente l'algorithme, ses qualités et défauts :
http://www.haypocalc.com/blog/index.php/2008/03/10/137-un-no(...)

Pour l'intégration à Dotclear, punbb, etc. : c'est faisable, mais ces logiciels sont difficiles à patcher. Je ne distribue donc pas de patch automatique. Je peux tenter d'expliquer comment l'intégrer pour les gens intéressés. Pour les autres, regardez le dossier plugin. Niveau dépendance, il faut pouvoir exécuter Python 2.4.

> Lire le journal (49 commentaires, moyenne: 3,1).  

Vous avez demandé le commentaire #924939.

A propos de lutte anti-spam

Posté par MiniMoi () le 23/04/2008 à 00:52. (lien). Évalué à 6.

Je discutais justement de spam avec un collegue qui a essaye de s'heberger lui-meme son serveur mail pendant des annees (ainsi que pour des amis a lui). Il me disait qu'il est a present impossible ou presque de lutter efficacement contre le spam, et que c'est la raison pour laquelle il est passe a GMail, parce que leur filtres sont entraines sur des millions de comptes.

Qu'en pensez-vous ?
Il me semblait aussi que les reseaux bayesiens ne sont plus l'approche la plus efficace, et qu'il faut de plus en plus se tourner vers des methodes de machine learning avancee, comme les SVM ou les kernel method (dans ce cas il faut un gros ensemble d'entrainement, c'est surement pour cela que GMail contient un bouton pour reporter le spam ou les faux positifs http://www.youtube.com/watch?v=8FVme_xIRYk )

  • [^]Re: A propos de lutte anti-spam

    Posté par modr123 () le 23/04/2008 à 01:01. (lien). Évalué à 2.

    la white list est plus efficace a mon avis
    accepter les elails et mettre un motif dans le titre du mail
    je pense a mailfilter qui est pas mal en plus il ne telecharge que les entetes

    --
    pour protester contre la dadvsi , je n'achete plus de produit soumis au droit d'auteur ou voisins
    • [^]Re: A propos de lutte anti-spam

      Posté par seginus () le 23/04/2008 à 07:50. (lien). Évalué à 5.

      Le problème est que cette solution ne peut convenir qu'à un particulier. En effet, en tant que professionnel, avoir du spam non signalé est bien moins grave que d'avoir des mails que l'on aurait du recevoir finissant dans le spam.

    [^]Re: A propos de lutte anti-spam

    Posté par nyquist () le 23/04/2008 à 08:19. (lien). Évalué à 3.

    Le greylisting est a moi avis très efficace (aujourd'hui).

    J'ai déjà pu le voir employer avec succès sur des serveurs a fort traffic et le nombre de mails (et donc la charge du serveur*) traités ont très fortement diminué. C'est autant de mail en moins à passer à l'antivirus et à spamassassin.

    Ce n'est pas l'arme ultime mais combiné avec une whitelist, une blacklist et spamassassin (ou un autre) ça devient assez efficace.



    * : Biensur la charge de travail des serveurs smtp eux ont augmenté...

    [^]Re: A propos de lutte anti-spam

    Posté par ahuillet (page perso, ) le 23/04/2008 à 08:20. (lien). Évalué à 2.

    Il me disait qu'il est a present impossible ou presque de lutter efficacement contre le spam

    Tiens donc, je suis exactement de l'avis contraire... spamassassin avec le filtrage bayesien est certes très lent, mais détecte pratiquement tout mon spam sans faux positifs. Je ne sais pas évaluer le taux de faux négatifs mais il est très bas.

    • [^]Re: A propos de lutte anti-spam

      Posté par Jean-Philippe Garcia Ballester (Jabber id, page perso, ) le 23/04/2008 à 09:11. (lien). Évalué à 1.

      Tout à fait d'accord, j'ai un spamassassin sur ma machine avec une bonne grosse dose de spam par jour, et très peu ne passent, genre 2-3 par jour sur plusieurs dizaines de spams.

      • [^]Re: A propos de lutte anti-spam

        Posté par Victor STINNER (page perso, ) le 23/04/2008 à 11:54. (lien). Évalué à 2.

        J'utilise les services d'OVH pour recevoir mon courrier que je récupère en POP3. Au début, je faisais confiance à leur antispam, mais depuis le début de l'année, je recevais de plus en plus en spam. Je pense qu'ils ont baissé la sensibilité des spams à cause d'emails légitimes bloqués.

        Je suis donc passé à SpamAssassin. Après 2 semaines d'apprentissage, je reçois 20 spams (détectés comme spam) par jour, et 2 ou 3 spams non détectés comme spam par semaine (il y en a de moins en moins). Au moins là je contrôle le filtrage (clic sur le bouton Pourriel dans Kmail : envoi du message au script d'apprentissage SpamAssassin).

        • [^]Re: A propos de lutte anti-spam

          Posté par d-jo (page perso, ) le 26/04/2008 à 11:02. (lien). Évalué à 2.

          >Je pense qu'ils ont baissé la sensibilité des spams à cause d'emails légitimes bloqués.

          Ou simplifié les filtres a cause d'un volume a traiter de plus en plus important.

    [^]Re: A propos de lutte anti-spam

    Posté par Aurélien Le Provost - Ribaltch (page perso, ) le 28/04/2008 à 03:50. (lien). Évalué à 1.

    Il me disait qu'il est a present impossible ou presque de lutter efficacement contre le spam […] Qu'en pensez-vous ?
    Je ne suis pas d'accord. J'ai mon propre serveur mail, avec le mail d'un domaine et des adresses externes regroupées sur un même compte. Je compte sur les doigts d'une main les faux négatifs, et je n'ai jamais eu de faux positifs, juste quels mails légitimes qui atterissent de temps en temps dans le dossier « Suspects ».

    La procédure que j'ai suivi : http://www.aurelp.fr.eu.org/blog/index.php?2006/10/22/28-mai(...)

    --
    Encryption is not magic pixie dust to sprinkle on things to make them more secure.