Faire un don ! | | style | statistiques | contactez-nous | plan | lettre d'information

Journal : des idées pour éviter la création automatique de compte par des bots ?

Posté par gnap gnap (page perso, ) le 16 février 2006
Je cherche des idées pour éviter la création automatique de compte par des bots.

J'ai déjà un peu creusé la question https://gna.org/task/?func=detailitem&item_id=2876

Si quelqu'un à une proposition qui m'a échappé, ça me plairait, parce que je sêche.

L'idée, c'est d'éviter
- toute solution à base d'images qui ne marchera forcément pas pour un certain nombre d'utilisateur
- toute solution qui demande des interventions manuelles d'admins
- toute solution trop temporaire que les robots peuvent apprendre à faire en très peu de temps, car ça signifierait passer son temps à perfectionner le truc, comme à propos du spam, une escalade dans le déploiement d'astuces

Franchement, je sèche.

> Lire le journal (152 commentaires, moyenne: 2,9).  

Vous avez demandé le commentaire #683060.

Quelques propositions

Posté par Ludovic F (Jabber id, page perso, ) le 16/02/2006 à 10:51. (lien). Évalué à 6.

- Le classique mail de confirmation
- Présenter un texte et demander le mot x du paragraphe y.
- Pour valider l'inscription il faut cocher une case qui change d'intitulé: "Je suis un robot" / "Je ne suis pas un robot".

Bref quelques pistes simples :-)

  • [^]Re: Quelques propositions

    Posté par gnap gnap (page perso, ) le 16/02/2006 à 11:10. (lien). Évalué à 2.

    - Il y a déjà le courriel de confirmation, mais ce n'est pas dur de contourner ce problème.
    - Le mot x du paragraphe y est envisagé (suivre le lien) mais ça ne doit pas être dur du tout d'abord au bot à comprendre cela
    - L'idée de la boite est effectivement simple à mettre en oeuvre ; mais aussi facile à contourner :(

    • [^]Re: Quelques propositions

      Posté par Obsidian () le 16/02/2006 à 17:23. (lien). Évalué à 8.

      Tu as du mal parce que ton problème, c'est le Test de Turing, tout simplement :

      http://fr.wikipedia.org/wiki/Test_de_Turing

      Le problème majeur est que derrière le bot, il y a l'intelligence humaine qui l'a écrit, et que c'est elle qu'il faut combattre en réalité.

      Suis le lien proposé, tu verras que beaucoup de gens s'y sont cassé la tête avant toi, et tu y trouveras probablement beaucoup d'astuces qui te permettront d'avoir la paix au moins pour un temps.

      Maintenant, je pense qu'il ne faut pas chercher de solution « absolue ». Soit c'est pour éviter les quelques bots qui pourraient passer de temps en temps sur ton site et dans ce cas, une solution élémentaire suffit, soit tu es littéralement envahi et dans ce cas, il faut essayer de savoir pourquoi. Si c'est parce que ton site est ultra-célèbre, alors effectivement il faut soit faire travailler l'utilisateur, soit investir dans de plus gros moyens.

      Le courrier postal pourrait être l'un d'eux, étant donné le délai imposé et la nécessité d'avoir un opérateur pour saisir les informations ou faire du scan/OCR. Si tu en es là, il vaut mieux porter plainte :-)

      Pour l'accessibilité, je pense que tu peux alterner fichiers sonores et fichiers visuels selon l'agent utilisé. Même si l'on veut prendre en compte les centaines de millions d'utilisateurs sous lynx/links :), il est toujours possible de télécharger l'image et de l'ouvrir avec un éditeur séparé.

      Un aveugle qui surfe sur le web utilise automatiquement un agent sonore (ou alors une table braille, mais là encore, il est toujours possible de télécharger le fichier sonore et de le diffuser ailleurs).

      Pour les fichiers sonores, tu peux demander aux gens de reconnaître un morceau de musique par exemple. La musique a l'avantage de s'affranchir des langues. Problème : Il faudra utiliser du classique si tu ne veux pas payer une somme forfaitaire à la SACEM pour avoir le droit de le faire, ce qui peut être envisagé : La dernière fois que j'avais regardé, ce n'était pas si inabordable que çà ...

      Bonne chance.

      • [^]Re: Quelques propositions

        Posté par Yusei (page perso, ) le 16/02/2006 à 22:43. (lien). Évalué à 3.

        En fait, c'est même un peu plus compliqué que le test de Turing, parce que ça doit être automatisé. Dans la version classique du test de Turing, c'est un humain qui interroge l'entité, et qui doit déterminer si l'entité est humaine, et pour l'instant un humain n'a pas trop de mal à le faire. Mais demander à une machine de déterminer si son interlocuteur est humain, c'est plus dur.

        • [^]Re: Quelques propositions

          Posté par blobmaster () le 16/02/2006 à 23:04. (lien). Évalué à 4.

          Mais si c'est très simple !
          Il suffit de d'abord faire une machine qui passe le test de Turing et puis après tu l'utilises pour vérifier que les machines des autres ne le passe pas.
          Mouais...
          Je crois que tu as raison. Il faudrait une sorte de test de Turing à l'envers. Un test que seul les machines pourraient réussir ce qui prouverais que ce n'est pas un humain.
          On appelerait cela :
          le test de Gnirut
          poposition de test de Gnirut :
          Quelle est la troisième couleur du drapeau français ?
          Quelle est la couleur d'une feuille de papier ?
          Quelle était la couleur du cheval d'Henri IV ?
          Quelle est la couleur du coton ?
          Quelle est la couleur de la crème fraîche ?

          Que bois la vache ?

          • [^]Re: Quelques propositions

            Posté par Nitchevo () le 16/02/2006 à 23:13. (lien). Évalué à 5.

            De l'eau, je suis un bot ;-)

            Bon ceci dit il existe beaucoup de tâches où un robot peut être plus habile qu'un homme.
            Imaginons un site avec un questionnaire unique et deux forums: un formulaire permet de s'inscrire si l'internaute réussi le test il est inscrit au forum des bots et s'il échoue il est inscrit au forum des êtres humains.
            En outre l'inscription au forum des bots permet d'éviter les essais successifs et donc les attaques pifométriques.

            [^]Re: Quelques propositions

            Posté par Fabien Engels (page perso, ) le 17/02/2006 à 02:29. (lien). Évalué à 4.

            Quelle est la troisième couleur du drapeau français ?
            rouge ...

            ça serait pas plutot la deuxième ? :D

            • [+] [^]Re: Quelques propositions

              Posté par Clem Yeats (page perso, ) le 17/02/2006 à 12:59. (lien). Évalué à -1.

              Ca depend ... de gauche a droite ou de droite a gauche ??

              hein quoi ? je sors.. ? ben pourquoi.... --> [ ]

              [^]Re: Quelques propositions

              Posté par blobmaster () le 17/02/2006 à 17:59. (lien). Évalué à 3.

              Je me suis trompé.
              Peut-être est-ce parce que je suis Breton ?

              Je précise que les Bretons savent compter. Ce n'est que moi qui ai du mal.

              Et je suis pas daltonien.

        [^]Re: Quelques propositions

        Posté par theocrite (Jabber id, page perso, ) le 17/02/2006 à 00:40. (lien). Évalué à 5.

        Pour les fichiers sonores, tu peux demander aux gens de reconnaître un morceau de musique par exemple. La musique a l'avantage de s'affranchir des langues. Problème : Il faudra utiliser du classique si tu ne veux pas payer une somme forfaitaire à la SACEM pour avoir le droit de le faire



        Moi je vois un autre problème. À moins de te restreindre à deux ou trois morceaux, tu vas avoir beaucoup de mal à trouver des morceaux pour un large public.

        Il n'y a pas une semaine, j'ai vu quelqu'un confondre un morceau de Tchaikovski[1] et la Marseillaise.

        Pour rigoler Blind test :
        Une liste de musiques, combien ne connaissent pas ces airs ? Il ne doit pas y en avoir beaucoup. Qui peut mettre un titre à chacunes ?
        http://upload.wikimedia.org/wikipedia/commons/9/99/Wolfgang_(...)
        http://upload.wikimedia.org/wikipedia/en/b/bd/Rondo_Alla_Tur(...)
        http://upload.wikimedia.org/wikipedia/commons/3/38/Die_Holle(...) (attendre au moins 40s)
        http://upload.wikimedia.org/wikipedia/commons/3/3c/01_-_Viva(...)
        http://upload.wikimedia.org/wikipedia/en/9/91/Ride_of_the_Va(...)
        http://upload.wikimedia.org/wikipedia/en/a/ac/Blue_danube.og(...)
        http://upload.wikimedia.org/wikipedia/commons/5/5b/Ludwig_va(...)
        http://upload.wikimedia.org/wikipedia/commons/a/ab/Toreador_(...)

        Il en manque encore plein dans le genre (Ode to joy, für Elise(Beethoven), Swan lake, The sleeping beauty(Tchaikovski), air (Bach), The entertainer, Stille-Nacht(Gruber), Funiculì, Funiculà (Denza), Champagne, Kaiser Walser (Strauss II), Radetzky March (Strauss I) etc...)[2].

        Bien évidemment que tout le monde connait (ou presque). Et pour cause, on est entouré de musique classique : dans les pubs (n'oubliez pas, le principal...), dans les ascenseurs, sur sonneries de mobiles, sur les répondeurs téléphonniques, sur les attentes téléphoniques (vous avez demandé l'élysée, ne quittez pas), dans les boites à musiques, dans les dessins animés[3], dans les boites à musique, etc.
        Mais pour mettre un nom dessus, c'est une autre paire de manche.



        [1] http://upload.wikimedia.org/wikipedia/en/d/d0/Tchaikovsky_-_(...)
        Entre 6'25 et 7'00
        [2] Attention pas le droit de répondre "ode à la joie", "lettre à Élise", "lac des cygnes", "l'arnaque", "douce nuit/silent night" ou encore "la valse de l'empreur" sans quoi tu perds l'avantage de s'affranchir des langues.
        [3] The sleeping beauty / La belle au bois dormant... Mooooooon aaaaaamouuuuuur, je t'ai vu au beau milieu d'un rêve.

        --
        Le libre vaincra, tout est déjà joué.
        • [^]Re: Quelques propositions

          Posté par Yusei (page perso, ) le 17/02/2006 à 10:30. (lien). Évalué à 3.

          Faut pas demander le compositeur ou leur titre, faut demander dans quelle pub ça apparaît.

          - Boum boum boum Sweet dreams are made of thi-is Boumboum
          - Marylin Manson
          - Sale robot !
          - Eurythmics ?
          - Sale robot !
          - Volkswagen
          - Gagné !

          [^]Re: Quelques propositions

          Posté par Obsidian () le 17/02/2006 à 14:43. (lien). Évalué à 2.

          L'avantage du fichier musical ou vocal est qu'il peut être très largement altéré tout en restant parfaitement audible et intelligible pour l'être humain, et ce à chaque nouveau chargement de la page.

          Si un bot veut essayer de reconnaître tous les morceaux à coup sûr (ou à 85% de probabilité), il lui faudra faire beaucoup de transformées de Fourrier et avoir un catalogue de titre de tueur.

          Après, de ton coté, il faut aussi prévoir un système de réponse un minimum intelligent, genre un field à remplir mais avec une certaine tolérance aux fautes d'orthographes et aux erreurs en tous genres.

          Si tu implémentes le Test de Turing mais avec un bouton radio à deux options pour la réponse, cela n'a évidement plus d'intérêt.

          • [^]Re: Quelques propositions

            Posté par gnap gnap (page perso, ) le 18/02/2006 à 19:48. (lien). Évalué à 3.

            Deux problèmes majeurs à mon sens d'un tel système :
            - c'est pas bon pour les sourds
            - c'est pas bon pour ceux qui n'ont pas le son (pas d'enceinte sur leur PC de boulot, pas de casque et pas la possibilité de géner avec du bruit sur des enceintes)

            Rédhibitoire.

            • [^]Re: Quelques propositions

              Posté par Obsidian () le 20/02/2006 à 10:56. (lien). Évalué à 2.

              Mais si on met des images, tu va te plaindre aussi parce que les aveugles ou les déficients visuels ne peuvent pas les voir.

              Il faut que tu te rende compe de ce que tu demandes. Si quelqu'un arrive à mettre au point ton système idéal, il en fera une publication dans une revue scientifique, pas dans un journal sur LinuxFR ...

    [^]Je suis un robot

    Posté par JereMe () le 16/02/2006 à 11:11. (lien). Évalué à 6.

    - je peux répondre aux emails
    - je sais chercher le mot x du paragraphe y
    - je suis con, mais j'ai tout mon temps, donc une réussite de 1/2 me va parfaitement. Puis sinon, je lis le texte "Je suis un robot" / "Je ne suis pas un robot".

    [^]Re: Quelques propositions

    Posté par Maxime AD (page perso, ) le 16/02/2006 à 12:07. (lien). Évalué à 0.

    Argh... Tout sauf le mail de confirmation de grâce ^^.

    Personnellement, ça m'énerve de toujours devoir confirmer mon inscription, je préfère encore les images illisibles. Mais pour les non-voyants, ce n'est pas la meilleure solution (Ni pour ceux qui surfent sur Internet avec Lynx).

    • [^]Re: Quelques propositions

      Posté par Matthieu Moy (page perso, ) le 16/02/2006 à 13:14. (lien). Évalué à 4.

      Et bon, un robot qui sait créer une adresse jetable.org ou autre, ça doit pas être si compliqué que ça.

    [^]Re: Quelques propositions

    Posté par kobayazen (page perso, ) le 16/02/2006 à 13:16. (lien). Évalué à 2.

    pourquoi ne pas faire jouer au navigateur une suite de fichiers audios representant chacun une lettre et demander ensuite à l'utilisateur de taper le mot correspondant dans son formulaire...
    ca pourrait marcher jusqu'à ce que les bots aient des oreilles :)

    • [^]Re: Quelques propositions

      Posté par Infernal Quack (Jabber id, page perso, ) le 16/02/2006 à 13:58. (lien). Évalué à 5.

      Et les sourds ?

      • [^]Re: Quelques propositions

        Posté par totof2000 () le 16/02/2006 à 14:18. (lien). Évalué à 2.

        Tu leur met la même chose en image.
        Et les sourds aveugles dans ce cas?

        • [^]Re: Quelques propositions

          Posté par beagf (page perso, ) le 22/02/2006 à 10:41. (lien). Évalué à 1.

          Tu leru met du texte qu'ils peuvent lire avec une tablette braille...

          OK ---> [ ]

        [^]Re: Quelques propositions

        Posté par mathieu mathieu (Jabber id, page perso, ) le 16/02/2006 à 14:37. (lien). Évalué à 6.

        et puis selon la langue, la lettre se prononce différement!

      [^]Re: Quelques propositions

      Posté par finss (page perso, ) le 16/02/2006 à 14:00. (lien). Évalué à 4.

      et moi qui n'ai pas le son ( fucking ALC260 pas encore géré ... ) je fais comment ?