Faire un don ! | | style | statistiques | contactez-nous | plan | lettre d'information

: Les pénibles du net

Posté par Benoît Sibaud (Jabber id, page perso, ). Modéré le 14 juin 2003.
Il s'agit du titre d'un petit texte que j'ai commis sur les différents agacements rencontrés sur le net.

Au menu :
- les sites web pourraves, sur le respect des standards et des utilisateurs
- le polluriel (spam), avec notamment un test de l'antispam bayésien Bogofilter, et des explications sur la collecte d'adresses
· les virus et binaires en folie, ou ce que l'on trouve comme cochoncetés dans sa boîte aux lettres, avec un passage sur les solutions libres (dont Clam Antivirus)
· la sécurité informatique c'est pour les autres, où l'on parle d'éditeurs et d'utilisateurs qui négligent le sujet
· en vrac, un point rapide sur divers autres agacements

> Lire la dépêche (141 commentaires, moyenne: 2).  

Vous avez demandé le commentaire #223193.

Publicité

Posté par boubou (page perso, ) le 14/06/2003 à 14:07. (lien). Évalué à 11.

Pour ceux qui ne connaissent pas le filtrage de spam par méthodes probabilistes (plus généralement la classification bayésienne), le prochain numéro de MISC (le 9) comportera un article de votre serviteur expliquant les méthodes mathématiques sous jacentes...

  • [^]Re: Publicité

    Posté par Barbapapa () le 14/06/2003 à 15:48. (lien). Évalué à 0.

    Juste une question à deux balles. On le trouve en kiosque Misc ? Parce ce que je l'ai cherché chez tous les marchands de journaux près de chez moi et rien.

    • [^]Re: Publicité

      Posté par boubou (page perso, ) le 14/06/2003 à 15:58. (lien). Évalué à 3.

      Oui, oui, ça se trouve, mais il faut que ton dépositaire de presse soit approvisionné par le distributeur de misc. Sauf erreur de ma part, ce n'est les NMPP et donc tous les dépositaires ne l'ont pas. A paris, il vaut mieux taper dans les kioskiers. En général, ils l'ont. S'ils ont linux mag, ils auront presque obligatoirement misc.

      [^]Re: Publicité

      Posté par Stone Tramo () le 14/06/2003 à 17:49. (lien). Évalué à 3.

      Si t'es en belgique, faut bien chercher, le mois passé, j'ai trouvé le n° 2

      • [^]Re: Publicité

        Posté par ploum (page perso, ) le 14/06/2003 à 19:06. (lien). Évalué à 0.

        ben moi la semaine passé j'ai acheté le Linux mag alors que mon voisin achetait le misc avec l'analyse des documents Word qui venait de sortir. Donc en belgique c'est possible..

    [^]Re: Publicité

    Posté par tene (page perso, ) le 14/06/2003 à 19:08. (lien). Évalué à 2.

    Et pour ceux qui lisent l'anglais et ne veulent pas attendre: http://www.paulgraham.com/spam.html(...) je suis en train de tester mon implémentation et ça marche pas mal du tout... ça se rammasse la gueule sur les mails ne contenant rien sauf une image (qui est la pub), mais sinon c'est très impressionnant.

    • [^]Re: Publicité

      Posté par boubou (page perso, ) le 15/06/2003 à 10:50. (lien). Évalué à 8.

      Oui, sauf que l'article de Paul Graham contient un certain nombre de conneries, en particulier sur l'aspect mathématique sur lequel je me focalise. J'ai d'ailleurs un petit encadré sur Graham dans mon article de MISC. De plus, Graham est très injustement considéré comme "l'inventeur" du filtrage de SPAM, ce qui est grossièrement faux, comme il le reconnaît lui-même dans son dernier article (Better Bayesian Filtering). Quant à son algorithme, qui n'est pas Bayésien malgré ses affirmations, il est battu par d'autres, en particulier les variantes implémentées dans Bogofilter.

      • [^]Re: Publicité

        Posté par boubou (page perso, ) le 16/06/2003 à 07:32. (lien). Évalué à 1.

        Je suppose que les personnes qui votent -1 à mon commentaire sont des experts de la classification bayésienne ? Parce que franchement, il y a des fois où on se pose de sérieuses questions sur les motivations des votes. Quand je pense qu'en racontant n'importe quoi j'ai parfois un score largement positif...

        • [^]Re: Publicité

          Posté par tene (page perso, ) le 16/06/2003 à 23:35. (lien). Évalué à 1.

          Ptêt parce que ton commentaire ne dit pas grand chose, juste que graham dit des conneries, je serais très intéressé par les connaitre ces conneries, surtout si ça peut améliorer mon filtre antispam! Je vais être "obligé" d'acheter ton article ou tu peux m'expliquer?

          ps: euh sinon en dehors de flatter son ego, ça sert à quoi les scores? ;)

          • [^]Re: Publicité

            Posté par boubou (page perso, ) le 17/06/2003 à 09:14. (lien). Évalué à 2.

            Je vais être "obligé" d'acheter ton article ou tu peux m'expliquer?

            Disons que tu vas être obligé. Sérieusement, il te suffit de faire une recherche sur le web pour trouver des critiques. Tu peux aussi lire la doc de bogofilter qui contient des pointeurs vers des critiques de ce que raconte Paul Graham. En gros, les formules que proposent Graham sont fausses, au sens où elles ne tiennent pas compte du taux de spam dans ta boite. Graham fait implicitement l'hypothèse que la probabilité de recevoir un spam est aussi grande que celle de recevoir un courrier normal, ce qui est grossièrement faux en général. Voilà la connerie principale. Ensuite, Graham utilise de nombreuses bidouilles heuristiques (par exemple son histoire de pondération des mots) qui sont inutiles quand on maîtrise vraiment le cadre statistique de la classification bayésienne. Si tu veux des détails, tu peux lire mon article ou faire quelques recherches sur google.

            ps: euh sinon en dehors de flatter son ego, ça sert à quoi les scores? ;)

            A rien, on est d'accord. Je trouve ça amusant et un peu ennervant de voir que certaines personnes scorent un commentaire pour lequel elles sont vraisemblablement incompétentes (d'autant qu'il y a un consensus autour de ce que je dis (qui n'a rien d'original) dans la communauté statistique).

            • [^]Re: Publicité

              Posté par tene (page perso, ) le 17/06/2003 à 15:13. (lien). Évalué à 1.

              Maintenant, je situe mieux, je chercherai si j'obtiens de mauvais résultat...

              Si tu veux des détails, tu peux lire mon article ou faire quelques recherches sur google.

              ... ou si je trouve ton article, tu crois que c'est imaginable en Belgique?

              • [^]Re: Publicité

                Posté par boubou (page perso, ) le 18/06/2003 à 09:30. (lien). Évalué à 1.

                tu crois que c'est imaginable en Belgique?

                D'après diamond, oui. La diffusion a normalement été grandement améliorée pour le numéro 8. Donc ça devrait le faire pour le numéro 9. Sinon, il reste le site de misc (http://www.miscmag.com/(...) )