Bonjour
Je me penche sur les filtres bayesiens afin de les intégrer à un de mes programmes. Mais je ne trouve que de la foc sur les filtres anti-spam! Quelqu'un aurait (le summum!) le code source d'un filtre bayesien en perl? A defaut, des explications sur l'algorithme utilisé.
# Re: filtre bayesien: explications et code source
Posté par Nicolas Delsaux (site web personnel) . Évalué à 1.
# Re: filtre bayesien: explications et code source
Posté par TazForEver . Évalué à 1.
# Re: filtre bayesien: explications et code source
Posté par youri_b . Évalué à 2.
http://christophe.delord.free.fr/fr/popf/index.html(...)
et en ruby :
http://linuxfr.org/~cedric_foll/4308.html(...)
# Re: filtre bayesien: explications et code source
Posté par Cédric Foll . Évalué à 1.
on découpe un texte en mots.
on possède 2 bases de données.
La base de donnée A pour les textes de classe A, la base de données B pour les textes de classe B.
1)phase d'apprentissage.
Pour chacun des textes de classe A, on ajoute le texte dans la base s'il n'y est pas. On augmente son occurence si il y est déjà.
On fait une db qui fonctionne comme un hash Perl. Elle contient pour tous les mots trouvés, le nb de fois ou on les a vu.
On fait pareil avec les mots de la base B.
2) On cherche à classer un texte.
On découpe le texte en mots. Pour chaque mot on associe la proba d'appartenance en appliquant la loie de Baye (voir tes cours de terminal).
Suivre le flux des commentaires
Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.