Journal : De la classification des posts (Pertinent ou non pertinent)
Posté par alenvers () le 13 juin 2006
Bonjour,
Il me semble que le thème des +/- est récurrent sur le tracker http://linuxfr.org/tracker/ .
Le cas qui nous intéresse est un problème de classification :
- Est-ce qu'un message est pertinent ou ne l'est-il pas ?
- Est-ce un troll ou pas ?
- Est-ce humoristique ou pas ?
- ...
Un grand nombre de nous utilisons tous les jours pour nos mails ce type de classification : spam ou pas spam. Donc, pourquoi ne pas utiliser cela sur les posts ?
Que pensez-vous d'utiliser un(des) filtre(s) bayesien ? Différentes classes (pertinent, troll, humour, ...) ? Est-ce que vous pensez qu'un tel filtre serait effectif sur les posts ?
Des exemples de code en GPL sont disponibles un peu partout http://www.xhtml.net/php/PHPNaiveBayesianFilter . Donc, l'implémentation ne devrait pas être une énorme tâche (le plus dur étant d'installer un templeet avec linuxfr au-dessus, au vu de la minceur de la doc ;-).
Anthony.
Il me semble que le thème des +/- est récurrent sur le tracker http://linuxfr.org/tracker/ .
Le cas qui nous intéresse est un problème de classification :
- Est-ce qu'un message est pertinent ou ne l'est-il pas ?
- Est-ce un troll ou pas ?
- Est-ce humoristique ou pas ?
- ...
Un grand nombre de nous utilisons tous les jours pour nos mails ce type de classification : spam ou pas spam. Donc, pourquoi ne pas utiliser cela sur les posts ?
Que pensez-vous d'utiliser un(des) filtre(s) bayesien ? Différentes classes (pertinent, troll, humour, ...) ? Est-ce que vous pensez qu'un tel filtre serait effectif sur les posts ?
Des exemples de code en GPL sont disponibles un peu partout http://www.xhtml.net/php/PHPNaiveBayesianFilter . Donc, l'implémentation ne devrait pas être une énorme tâche (le plus dur étant d'installer un templeet avec linuxfr au-dessus, au vu de la minceur de la doc ;-).
Anthony.
> Lire le journal (88 commentaires, moyenne: 2,7).
Vous avez demandé le commentaire #721884.



Bof
>spam ou pas spam.
Bof, parce qu'un avis différent de la majorité ne doit pas être noté comme spam. C'est un avis différent, c'est tout.
Pour les filtres bayesiens, ca pourrait marché, mais ca transformera DLFP en bot Ubuntiste adepte de MSN.
je propose :
- qu'on supprime le [inutile]
- qu'on réévalue le seuil de 0 à +10 de la barre de filtrage.
- Les trolleurs seront ceux qui ne se feront jamais [intéressanté] sur [X] messages, interdiction de poster des journaux 1er pages... pendant X temps. (à voir, perso, ca ne me dérange pas)
- Une interface d'alerte qui envoie un mail/message aux admins/modérateurs pour le blacklistage immédiat des gros boulets révisionnistes.
Il est temps d'en finir avec ses histoires de [-], de [+] et autres conneries du genre je ne suis pas d'accord avec toi, je te moinsse.
Faire un patch ??? euh... bon, finalement, le système actuel n'est pas mal. :-D
PS: oui, se faire moinsser la gueule, ce n'est pas agréable, mais ce n'est pas la fin du monde non plus. :-D
OO watching you !!!
[^]Re: Bof
Un filtre baysien est basé sur les mots, alors que l'humour, la pertinence et le caractère provocateur sont basés sur l'interprétation qui est faite des mots. Autrement dit, le bot ne pourra pas marcher. Pour évaluer ce qui est drole, il faudrait qu'il sache rire, pour reconnaitre ce qui est pertinent et ce qui est provocant, il faudrait qu'il sache tout. Dur dur...
Le système actuel n'est pas parfait, mais il marche globalement plutot bien. D'ailleurs, chaque fois que je suis sur un forum quelconque, je regrette de ne pas pouvoir moinsser ou plusser des commentaires pour améliorer le rapport signal bruit du thread. Et j'imagine que je ne suis pas le seul !
[^]Re: Bof
il te manque l'expression "bon compromis" ;)
[^]Re: Bof
"Chose due"
Pan ! Pan !
Ne pas utiliser : traplinuxfrnico@univ-nantes.Fr
[^]Re: Bof
Je suis d'accord avec le fait de vouloir moinsser ou plusser sur d'autre forum et je trouve le système plutôt sympatique.
Après moi, ce que je trouve un peu dommage, c'est d'avoir mit une barrière. Je ne me souviens d'ailleurs plus pourquoi elle avait était mise en place, ni pourquoi les XP sont devenus invisibles.
Je trouve que ce serait intéressant de n'avoir plus de frontière à ce niveau. On pourrait faire des statistiques dessus et voir ainsi ce que les dlfpiens préfères : les commentaires vraiment intéligents, les blagues intélectuelles, les blagues à deux francs six sous...
Par contre, dans ce cas, si les XPs continuent à pouvoir interdire certaines actions sur le site, il faudrait peut-être conserver une limite inférieur, pour que certain ne se retrouve pas dans l'impossiblité de s'exprimer uniquement parce qu'une partie de la population ne l'apprécient pas.
Voilà, c'était ma petite contribution au nième journal sur le système de modération du site.
PS : désolé pour les fautes d'orthographe, mais je m'entraine à en faire pour devenir journaliste.
[^]Re: Bof
Comme je poste beaucoup, je peux te donner mon expérience personnelle :
- Les commentaires vraiment intelligents.
Bon, là je suis peut-être pas un bon exemple mais je jure que parfois j'essaie. Un commentaire bien construit, bien argumenté, écrit correctement et à propos monte généralement entre +3 et +6.
En fait, il est beaucoup "pertinenté" mais aussi très fort "inutilisé" quand les gens sont visiblement pas d'accord.
- Les blagues intellectuelles.
Elles disparaissent très vite à -1, -2 car la majorité ne comprennent pas que c'est une blague intellectuelle et prenne le commentaire au premier degré (degré auquel il est plus que souvent effectivement hors-propos ou inutile)
- Les blagues à deux balles
Généralement elles atteignent +10 en moins d'une demi-heure
Bien sûr il y a toute la nuée de commentaire "banals" qui nagent entre 0 et 3 mais pour ton étude ethnologique, ces informations peuvent t'être utiles.
[^]Re: Bof
>- Les commentaires vraiment intelligents.
>Bon, là je suis peut-être pas un bon exemple mais je jure que parfois
>j'essaie. Un commentaire bien construit, bien argumenté, écrit
>correctement et à propos monte généralement entre +3 et +6.
Et ne parlons même pas des commentaires techniques dans les forums qui montent parfois de 1 (le posteur de la question, je suppose). Par contre, une blague à 2 cents ou un RTFM sont votés respectivement +++++++++++ et ----------------- dans ces mêmes forums.
[+] [^]Re: Bof
et les blagues belges tu les classes où ? ;-)
#define MAGIC 0xdefaced /* I should've patented this number -cliph */
[^]Re: Bof
La demi heure est passée, mais tu te rapproches du chiffre fatidique (+9 en ce moment). On en concluera ce qu'on en voudra.
[^]Re: Bof
Je rajouterai :
- les commentaires de ceux qui se plaignent de s'être fait moinsser
Qui souvent se retrouvent à beaucoup de +, même si le commentaire d'origine n'était pas vraiment pertinent. Bah oui, ça fait rebelle de ne pas faire comme ce que les autres ont fait... Parfois ils se retrouvent aussi à beaucoup de -, histoire de confirmer que le commentaire était vraiment inutile.
[^]Re: Bof
>Un filtre baysien est basé sur les mots, alors que l'humour,
Sans blague.
>Autrement dit, le bot ne pourra pas marcher.
Ben non, un filtre bayesien pour le spam permet de pondérer une liste noir avec une liste blanche. Ainsi,
J'ai un trollomètre expérimentale baysien pour pycoincoin, et il marche bien sur la tribune. Surtout si le nom du posteur rentre dans le score.
De part cette expérience, je pense que les commentaires de DLFP peuvent être trié par un filtre baysien.
L'inconvénient étant l'apprentissage et le tri de la liste des mots. Si on se base sur le score actuel des posts, on va créer un profil de filtre de l'opinion de l'utilisateur moyen. (D'ou l'idée humoristique du bot Ubuntiste)
>Le système actuel n'est pas parfait, mais il marche globalement plutot bien.
Il marche tellement bien qu'il y a des journaux, des demandes de modifs et des coups gueules en permance (même si ca s'était calmé)
Franchement, le rapport signal/bruit serait aussi bien traité avec comme seul option un vote [intéressant].
Mais à la vue de ma note du commentaire précédent. Ca n'a pas l'air de faire l'unanimité :-)
OO watching you !!!
[^]Re: Bof
>Il marche tellement bien qu'il y a des journaux, des demandes de
>modifs et des coups gueules en permance (même si ca s'était calmé)
En illustration, scores des journaux en première page :
1) Ce journal, 2.9 <- le plus mauvais
2) Le meilleur Score 6.6 http://linuxfr.org/~Gaetan_63/21807.html
Les questions que je me pose :
- Est-ce que 1) est pire que 2) ?
- 2) vaut peut-être 6.6 en humour mais pour ce qui est du reste ?
- Classer en bayesien Troll/pas troll, dans le sujet/hors sujet me semble possible. Mais pour ce qui est des autres critères est-ce exploitable (pertinent/inutile, humour/sérieux - surement pour l'humour réccurrent) ?
[^]Re: Bof
regarder les notes des journaux est une connerie monumentale : n'importe quel zèbre (exemple, Gary Nigger & GNAA) peut s'amuser à poster n'importe quoi et ça assurera quelques -10 en rafale.
Windows has no users. It has hostages.
[^]Re: Bof
Quel que soit le système mis en place, il y aura toujours des raleurs (c'est une constante humaine).
Quand on trouve le juste milieu, il y a toujours les extrèmes (des deux cotés : changer en plus dur ou en plus laxiste) qui ne sont pas contents quand meme, car on n'a pas pris leur position extrème.
Si tu trouves comment concilier les extrèmes, tu deviendras le roi du monde car toute démocratie a ce problème, pas seulement linuxfr...
[^]Re: Bof
>>spam ou pas spam.
>
> Bof, parce qu'un avis différent de la majorité ne doit pas être noté comme spam.
> C'est un avis différent, c'est tout.
Euh, parce que dans le système actuel, tu pense que "inutile" est synonyme de "pas d'accord" ?
Quand tu cliques sur "inutile" en bas d'un commentaire, c'est que tu souhaites que ce commentaire disparaisse du site. C'est quoi la différence avec considérer que c'est un spam ?
[^]Re: Bof
>Euh, parce que dans le système actuel, tu pense que "inutile" est synonyme de "pas d'accord" ?
Ce n'est pas mon cas, mais c'est ce qui est reproché au système actuel.
>Quand tu cliques sur "inutile" en bas d'un commentaire, c'est que tu souhaites que ce commentaire disparaisse du site.
Sur Da Bisounours Page, c'est ce qui devrait se passer, mais ce n'est pas le cas. Regarde mes commentaires, par exemple, lors du journal sur la cigarette, j'avais un avis qui divergait de la majorité. résultat : des [-]
Perso, je m'en contrefous, mais croire que les utilisateurs cliquent sur [inutile] que pour les messages grossiers/spam/... c'est un peu de l'angélisme.
OO watching you !!!
[^]Re: Bof
>>Quand tu cliques sur "inutile" en bas d'un commentaire, c'est que tu souhaites que ce commentaire disparaisse du site.
>Sur Da Bisounours Page, c'est ce qui devrait se passer, mais ce n'est pas le cas. Regarde mes commentaires, par exemple, lors du journal sur la cigarette, j'avais un avis qui divergait de la majorité. résultat : des [-]
Ça ne contredit pas ce qu'il a dit. Il n'a pas précisé la raison pour laquelle l'utilisateur veux faire disparaitre le message.
[ Répondre ] Ce commentaire est-il impertinent ou utile ?
[^]Re: Bof
>Il n'a pas précisé la raison pour laquelle l'utilisateur veux faire disparaitre le message.
Ben, ca serait bien de précisé alors. C'est quoi pour vous un message qui mérite de disparaître ??? (les messages haineux/raciste... bien sur.)
Un message sur l'orthographe d'une news ???
Un message qui pose une question ???
Un message hors-sujet ???
Je suis curieux de voir vos réponses.
OO watching you !!!
[^]Re: Bof
ah mais euh ... c'est précisé. Le message disparait parce qu'il est jugé inutile. (et pour être clair, oui, un message dans le sujet et correct dans la forme peut tout à fait être inutile).
[^]Re: Bof
Je suis d'accord que les gens utilisent mal le pertinent/inutile, mais justement, l'auteur du journal propose de le renommer en un truc plus clair (spam/pas-spam), et tu n'es pas d'accord. Faudrait savoir ...
[^]Re: Bof
>Faudrait savoir ...
Mais je sais :-)
[+]/[-] [pertinent] ou [inutile] [spam]/[pas-spam]
C'est kif kif.
Pour moi, il devrait y n'avoir que [pertinent]. cf mon post plus haut.
OO watching you !!!
[^]Re: Bof
non, c'est pas kif-kif du tout.
Windows has no users. It has hostages.
[^]Re: Bof
Pourquoi ? inutile ce n'est pas clair pour toi ?
spam / pas spam tu ne clarifies rien, tu changes le sens. Et moi ce qui m'intéresse effectivement c'est de lire ce qui est utile/pertinent. Le coté "ce n'est pas du spam" je m'en fiche un peu hein ...
[^]Re: Bof
Le système de notes actuel a pour but d'être plus précis qu'une distinction message/bruit. En théorie, un message à 10 est plus pertinent qu'un message à 5, lui même plus pertinent qu'un message à 1. À mon avis on peut voter "inutile" sur un message à 10, si l'on pense qu'il est modérément intéressant, sans pour autant vouloir le masquer (et soyons réaliste, aucun message monté à 10 n'a été descendu à -1 après).
[^]Re: Bof
Si, celui-ci : http://linuxfr.org/comments/716427.html#716427ta gueule ploum