Journal spam

Posté par  .
Étiquettes : aucune
0
21
juin
2003
bonjour,

depuis un certain temps, je recois pas mal de spam en plusieurs exemplaire
a 1 jour ou plusieur semaine d'intervalle.
je commence a en avoir une belle collection.
je pense que ca n'est pas tres dure de dire a mon mua (ou procmail) de > /dev/null
tout les mail qui sont deja dans ma collection de spam.
et pour que cette collection ne prenne pas trop de place sur mon dd,
autant ne stoquer que le md5sum des messages.

Cette solution anti-spam en attrapera sans doute beaucoup moins que bogofilter ou spamd, parcequ'il faut deja que qqn ai enregistre le spam dans la collection.
mais elle a l'avantage d'etre sans faux positif puisque le referencement est manuel.

avant de coder ce petit truc,
je m'interoge sur le protocole a utiliser
1) comment enregister un spam dans la collection ?
pour que ca puisse etre fait depuis n'importe quel mua, j'ai pense au simple forward vers une adresse de collecte (mais dans ce cas, il faudra virer les > ou n'importe quel autre caractere de separation)
2) comment verifier qu'un mail ou plusieur mail est dans la collection de spam ?
j'ai pense : on envois les md5 au serveur, et il retourne la liste des md5 qui coresponde a du spam (on n'envois pas le body tout entier, parce que un msg c'est prive et on ne fait pas forcement confiance au serveur), en tout cas, il faut que ca puisse etre ajoute simplement a un mua.
3) comment ajouter un spam dans la collection ?

en fait, si vous avez des idees, pour que que ce protocole ne permete pas l'ajout de faux spam, ca m'interesse beaucoup.

je pense utiliser gnuPG pour signer tous les ajouts de md5sum dans la collection,
ensuite lorsque on verifirais qu'un msg est un spam ou pas, on aurais la liste des users qui l'on enregistre en temps que spam avec un petit fichier de conf qui liste les personnent de confiance, ca devrais suffire pour decider de l'etat d'un message.

bref, bref, que pensez vous de ce systeme ?
  • # Re: spam

    Posté par  (Mastodon) . Évalué à 2.

    regard un peu la doc de spamassassin pour commencer.
  • # Re: spam

    Posté par  . Évalué à 5.

    Quitte à faire un truc un poil lourd, je préfère le concept de la gestion manuelle :

    Tu lis le mail et si c'est un spam => Touche suppr

    - Zéro faux positifs
    - Un seul usager de confiance, toi
    - Pas d'algo compliqué
    - Pas de mal de tête


    Non je déconne mais ... je trouve que ton système implique trop d'actions de l'utilisateur. Pour ma part si le traitement de spam n'est pas automatisé, alors il n'est pas utilisable.

    M
    • [^] # Re: spam

      Posté par  . Évalué à 2.

      justement, l'idee c'est de faire en sorte que le traitement soi automatise,
      ca veux dire binder une touche dans le mua qui corresponde a enregistre le mail comme spam puis le supprimer.
      a la reception des mails, procmail verifie si le message est un spam ou pas.
      c'est automatique la non ?
  • # Re: spam

    Posté par  (site web personnel) . Évalué à 5.

    Pour ce qui est de bogofilter, j'ai eu un seul mail correct classé comme spam sur plus de 1000. C'était au début, lorsque la base de spam etait encore peu fournie. Ca fait maintenant 3 semaines que je n'ai plus eu d'erreur (sur un mois d'utilisation).
    A mon avis mieux vaux regarder du coté des logiciels existants et leurs réglages fins plutot que de se lancer dans la mise au point d'un truc extremement lourd. Mais ce n'est que mon avis ;)
    A+
  • # Re: spam

    Posté par  (site web personnel) . Évalué à 3.

    Il y aura toujours au moins un caractère de différence (le champ date de réception, par exemple), donc les sommes de contrôle MD5 ne correspondront jamais. Il faut d'abord commencer à réfléchir à quelles parties du message sont constantes. Mais ensuite, tu risques de t'apercevoir qu'aucun message n'est complètement identique à l'autre (ben tiens), à quelques octets près que ton oeil ne distingue pas.

    Je reçois en moyenne 18 spams par jour, pour l'instant Suppr (ou la touche D) me suffit.
    • [^] # Re: spam

      Posté par  (site web personnel) . Évalué à 1.

      C'est vrai qu'en jetant un coup d'oeil a des spams on s aperçoit que souvent ils incluent dans le corps du texte un certain nombre de mots sans signification générés aléatoirement. Ce qui va sans nul doute compliquer les comparaisons de mail jusqu'a devoir envisager des méthodes moins exactes ( genre bogo/spamassassin)

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.