Las du spam sur mon blog et sur le forum de ma société, j'ai écrit un antispam. Il utilise diverses règles générant une note globale pour le message : analyse des URLs, de mots clés, de l'adresse de courriel, de la longueur du message, etc. Pour commencer, une note négative est attribuée (ex: -5). Ensuite, chaque règle rajoute ou soustrait des points à la note globale.
Exemple de spam :
Et la sortie du programme antispam :
L'antispam est écrit en Python et distribué sous licence GPL :
http://haypo.hachoir.org/trac/wiki/antispam
L'algorithme est expliqué sur la page web du projet en anglais. J'ai écrit un article en français qui présente l'algorithme, ses qualités et défauts :
http://www.haypocalc.com/blog/index.php/2008/03/10/137-un-no(...)
Pour l'intégration à Dotclear, punbb, etc. : c'est faisable, mais ces logiciels sont difficiles à patcher. Je ne distribue donc pas de patch automatique. Je peux tenter d'expliquer comment l'intégrer pour les gens intéressés. Pour les autres, regardez le dossier plugin. Niveau dépendance, il faut pouvoir exécuter Python 2.4.
Exemple de spam :
Par : swingers ads
Site Web : http://sexy.ads6x.com
Adult personal ads from swingers and swappers, couples, singles, bi,
http://sexy.ads6x.com >swingers ads and wives amateur couples Swingers ClubEt la sortie du programme antispam :
./antispam.py --verbose -c haypocalc.conf sexy
Match word (+2.0): sexy
Match word (+1.0): adult
Match word (+2.0): sexy
Match word (+1.0): amateur
Match URL (+1.5): http://sexy.ads6x.com
Match URL (+1.5): http://sexy.ads6x.com
Match email domain (+1.0): @gmail.com
sexy score: +7.00 ***SPAM***L'antispam est écrit en Python et distribué sous licence GPL :
http://haypo.hachoir.org/trac/wiki/antispam
L'algorithme est expliqué sur la page web du projet en anglais. J'ai écrit un article en français qui présente l'algorithme, ses qualités et défauts :
http://www.haypocalc.com/blog/index.php/2008/03/10/137-un-no(...)
Pour l'intégration à Dotclear, punbb, etc. : c'est faisable, mais ces logiciels sont difficiles à patcher. Je ne distribue donc pas de patch automatique. Je peux tenter d'expliquer comment l'intégrer pour les gens intéressés. Pour les autres, regardez le dossier plugin. Niveau dépendance, il faut pouvoir exécuter Python 2.4.
> Lire le journal (49 commentaires, moyenne: 3,1).
Vous avez demandé le commentaire #924939.



A propos de lutte anti-spam
Je discutais justement de spam avec un collegue qui a essaye de s'heberger lui-meme son serveur mail pendant des annees (ainsi que pour des amis a lui). Il me disait qu'il est a present impossible ou presque de lutter efficacement contre le spam, et que c'est la raison pour laquelle il est passe a GMail, parce que leur filtres sont entraines sur des millions de comptes.
Qu'en pensez-vous ?
Il me semblait aussi que les reseaux bayesiens ne sont plus l'approche la plus efficace, et qu'il faut de plus en plus se tourner vers des methodes de machine learning avancee, comme les SVM ou les kernel method (dans ce cas il faut un gros ensemble d'entrainement, c'est surement pour cela que GMail contient un bouton pour reporter le spam ou les faux positifs http://www.youtube.com/watch?v=8FVme_xIRYk )
[^]Re: A propos de lutte anti-spam
la white list est plus efficace a mon avis
accepter les elails et mettre un motif dans le titre du mail
je pense a mailfilter qui est pas mal en plus il ne telecharge que les entetes
pour protester contre la dadvsi , je n'achete plus de produit soumis au droit d'auteur ou voisins
[^]Re: A propos de lutte anti-spam
Le problème est que cette solution ne peut convenir qu'à un particulier. En effet, en tant que professionnel, avoir du spam non signalé est bien moins grave que d'avoir des mails que l'on aurait du recevoir finissant dans le spam.
[^]Re: A propos de lutte anti-spam
Le greylisting est a moi avis très efficace (aujourd'hui).
J'ai déjà pu le voir employer avec succès sur des serveurs a fort traffic et le nombre de mails (et donc la charge du serveur*) traités ont très fortement diminué. C'est autant de mail en moins à passer à l'antivirus et à spamassassin.
Ce n'est pas l'arme ultime mais combiné avec une whitelist, une blacklist et spamassassin (ou un autre) ça devient assez efficace.
* : Biensur la charge de travail des serveurs smtp eux ont augmenté...
[^]Re: A propos de lutte anti-spam
Il me disait qu'il est a present impossible ou presque de lutter efficacement contre le spam
Tiens donc, je suis exactement de l'avis contraire... spamassassin avec le filtrage bayesien est certes très lent, mais détecte pratiquement tout mon spam sans faux positifs. Je ne sais pas évaluer le taux de faux négatifs mais il est très bas.
[^]Re: A propos de lutte anti-spam
Tout à fait d'accord, j'ai un spamassassin sur ma machine avec une bonne grosse dose de spam par jour, et très peu ne passent, genre 2-3 par jour sur plusieurs dizaines de spams.
[^]Re: A propos de lutte anti-spam
J'utilise les services d'OVH pour recevoir mon courrier que je récupère en POP3. Au début, je faisais confiance à leur antispam, mais depuis le début de l'année, je recevais de plus en plus en spam. Je pense qu'ils ont baissé la sensibilité des spams à cause d'emails légitimes bloqués.
Je suis donc passé à SpamAssassin. Après 2 semaines d'apprentissage, je reçois 20 spams (détectés comme spam) par jour, et 2 ou 3 spams non détectés comme spam par semaine (il y en a de moins en moins). Au moins là je contrôle le filtrage (clic sur le bouton Pourriel dans Kmail : envoi du message au script d'apprentissage SpamAssassin).
[^]Re: A propos de lutte anti-spam
>Je pense qu'ils ont baissé la sensibilité des spams à cause d'emails légitimes bloqués.
Ou simplifié les filtres a cause d'un volume a traiter de plus en plus important.
[^]Re: A propos de lutte anti-spam
Il me disait qu'il est a present impossible ou presque de lutter efficacement contre le spam […] Qu'en pensez-vous ?Je ne suis pas d'accord. J'ai mon propre serveur mail, avec le mail d'un domaine et des adresses externes regroupées sur un même compte. Je compte sur les doigts d'une main les faux négatifs, et je n'ai jamais eu de faux positifs, juste quels mails légitimes qui atterissent de temps en temps dans le dossier « Suspects ».
La procédure que j'ai suivi : http://www.aurelp.fr.eu.org/blog/index.php?2006/10/22/28-mai(...)
Encryption is not magic pixie dust to sprinkle on things to make them more secure.