Suite à l'idée de faire un antispam pour bluesky, j'ai fait un antispam, et ça marche, mais absolument pas comme j'avais prévu.
Comment les meilleures idées théoriques sont poutrées par des idées cons
Théoriquement, le plan était simple :
- je faisais des corpus de mots clés HAM/SPAM ;
- je les normalisais ;
- je faisais les cosinus similarités des « word counter » (compteur de lemmes) entre le texte et les mots clés et j'en déduisais si c'était HAM ou (…)