Faire un don ! | | style | statistiques | contactez-nous | plan | lettre d'information

Journal : des idées pour éviter la création automatique de compte par des bots ?

Posté par gnap gnap (page perso, ) le 16 février 2006
Je cherche des idées pour éviter la création automatique de compte par des bots.

J'ai déjà un peu creusé la question https://gna.org/task/?func=detailitem&item_id=2876

Si quelqu'un à une proposition qui m'a échappé, ça me plairait, parce que je sêche.

L'idée, c'est d'éviter
- toute solution à base d'images qui ne marchera forcément pas pour un certain nombre d'utilisateur
- toute solution qui demande des interventions manuelles d'admins
- toute solution trop temporaire que les robots peuvent apprendre à faire en très peu de temps, car ça signifierait passer son temps à perfectionner le truc, comme à propos du spam, une escalade dans le déploiement d'astuces

Franchement, je sèche.

> Lire le journal (152 commentaires, moyenne: 2,9).  

Vous avez demandé le commentaire #682660.

ascii art?

Posté par peyo (page perso, ) le 16/02/2006 à 11:13. (lien). Évalué à 9.

je pencherais sur un truc en ascii art dans l'idée des codes dans des images(qui reste une parade solide). les librairies manquent pas en plus : choix aléatoire des caractères ou choix dans une liste...
Donc écrire un mot en ascii mélangé dans un fond et demander à l'utilisateur de le saisir.

  • [^]Re: ascii art?

    Posté par Yusei (page perso, ) le 16/02/2006 à 11:56. (lien). Évalué à 10.

    L'ASCII-art ne résoud pas le problème posé par les images: un aveugle aura l'air malin quand son synthétiseur vocal va lui lire "slash backslash pound dollar slash point trait euro virgule point d'exclamation" :)

    • [^]Re: ascii art?

      Posté par peyo (page perso, ) le 16/02/2006 à 13:12. (lien). Évalué à 7.

      ha vi j'avais pas pensé aux aveugles ^^
      enfin l'idée c'est de pouvoir faire faire quelquechose à un humain qu'un robot est incapable de faire. Du coup j'avais deux idées. la première : l'oeil, c'est un de nos avantages sur la mechanique et l'electronique. Mais on abandonne à cause des aveugles.
      La seconde : la littérature. Proposer plusieurs phrases dont une seule veut dire quelque chose :

      1- manger d'un bon appétit
      2- B.Gates est un excellent programmeur

      Quelle phrase est absurde ?

      Il faur une bdd avec des phrases qui veulent dire qqchose et avec des phrases qui veulent rien dire.

      (Gnap tu voudrais détailler plus tes contraintes techniques)

      • [^]Re: ascii art?

        Posté par TilK () le 16/02/2006 à 13:44. (lien). Évalué à 3.

        Donc un bot a une chance sur deux de se tromper, il n'a que doubler le nombre de demande...

        • [^]Re: ascii art?

          Posté par peyo (page perso, ) le 16/02/2006 à 14:18. (lien). Évalué à 1.

          j'en ai mis deux mais possible d'en mettre 15 avec une seule sensée.

          • [^]Re: ascii art?

            Posté par Éric (Jabber id, page perso, ) le 17/02/2006 à 12:52. (lien). Évalué à 3.

            Yep, 15, donc une chance sur 15 pour le robot.
            Il faut avoir plusieurs jeux de 15 sinon il suffirait de donner une fois la réponse au robot pour qu'il passe à vie. Il faut que le nombre de jeux soit assez important pour qu'on ne puisse pas initialiser le robot avec certaines réponses et qu'il ait un taux de réussite trop important.

            Résultat, tu vas probablement coder dans les 200 ou 300 entrées (donc 4500 propositions, bonjour le boulot). Quelqu'un qui y passe un minimum de temps initialisera son robot avec une trentaine de couples question/réponse. Son robot aura donc 1/10 de réussite, plus 1/15 sur les réponses inconnues. Ca reste encore un robot qui réussira facilement (le robot il s'en fout de recommencer plein de fois jusqu'à réussir). Pour peu que le robot apprenne de ses erreurs pour ne pas reproposer les mauvaises réponses, le joli robot va passer ton test à très courte échéance.

            Pour que le test soit efficace il faut que les couples question/réponse soient générés automatiquement et aléatoirement, qu'ils ne soient justement pas pris dans une base de données (à moins d'en avoir une super grande).
            C'est justement ça le problème. Faire à la main une question que le robot ne peut pas résoudre c'est simple. Le problème c'est faire générer au robot un couple question/réponse vérifiable qu'un autre robot ne pourra pas résoudre.

            • [^]Re: ascii art?

              Posté par Mr F (page perso, ) le 17/02/2006 à 16:00. (lien). Évalué à 2.

              Je pense que tu as mis le doigt sur le point critique qui fait que ce genre d'option n'est pas viable.

              A partir du moment ou tu as une question avec un certain nombre de réponses, c'est très simple de coder un robot capable d'apprendre de lui même.

              Sur une question A, il effectuera les 15 réponses et, lorsqu'il aura la bonne réponse, la mémorisera. Ce n'est qu'une question de temps avant qu'il n'est parcouru toutes les réponses et toutes les question afin, ensuite, d'avoir un taux d'inscriptions de 100%; En gros, plus la moulinette tournera, plus les inscriptions seront rapides (si l'on considère que l'on veut 1000 inscriptions, par exemple).

              Bien sûr, on pourra toujours rallonger ce temps en désactivant une IP à la 100ieme inscription par exemple, mais c'est quand même assez lourd, beaucoup d'entreprises étant natté. Et il suffit d'utiliser un robot utilisant des proxy ouvert pour déjouer ce genre de protection.

              La seule vrai bonne solution reste la solution de l'image indéchiffrable par un robot à recopier, c'est simple et efficace. Pour le mal voyant, il suffit d'avoir une seconde alternative basé sur le son. Avec ce couple de solutions, je pense que c'est la seule arme ultime. le reste finira obligatoirement par plier.

              [^]Re: ascii art?

              Posté par Dario Spagnolo (page perso, ) le 18/02/2006 à 16:50. (lien). Évalué à 1.

              Et si on demande à l'utilisateur de choisir la phrase qui a plus de sens entre :

              1. [...] chrétiens qui prévalut lorsque la croyance fondamentale, très opposée et foncièrement égoïste [...]

              2. [...] passion de : unanime l'harmonie mais s'effacer et dans doit singulière l'exigence est que l'ego [...]

              3. un autre assemblage de mots semblable au numéro 2

              4. un autre assemblage de mots semblable au numéro 2

              5. un autre assemblage de mots semblable au numéro 2

              Toutes les phrases sont extraites, au hasard, de "une page au hasard" ( http://fr.wikisource.org/wiki/Special:Random ) sur fr.wikisource.org. Une seule d'entre elles a été laissée telle quelle, les 4 autres ont subi un mélange aléatoire des mots qui les composent.

              A la première mauvaise réponse, l'IP est bloquée pendant 15 minutes, à la deuxième, pendant 5 heures, à la troisième pendant 2 jours.

              Avantages :

              1. Pas besoin de préparer la base de données. On se base sur wikisource.

              2. Utilisable par aveugles et sourds

              3. Le bot ne peut pas apprendre les bonnes et les mauvaises réponses

              Inconvénient : il suffit de faire un bot capable de reconnaitre la bonne syntaxe française. Est-ce que c'est pensable de le faire ?

              --
              Voici donc comment meurt la liberté, sous un tonnerre d'applaudissements...
              • [^]Re: ascii art?

                Posté par Thomas Douillard () le 18/02/2006 à 18:08. (lien). Évalué à 2.

                Ca dépends sans doute de la complexité des phrases, mais il doit exister des analyseurs syntaxique plutôt corrects, faut voir ce qui se fait de plus récent dans le traitement automatique du langage naturel. J'ai vu des algos pour faire ça en maîtrise, et j'imagine que c'était pas les travaux les plus récents.

                En jouant avec la sémantique de la phrase (générer des phrases syntaxiquement correctees mais n'ayant pas de sens) on peut sans doute arriver a des résultats plus intéressants, bien qu'il y ait pas mal de travaux de ce côté là en TALN je pense (ce que semble confirmer une rapide recherche google). Je connais pas vraiment l'efficacité des méthodes, mais à mon avis il doit y avoir moyen de les piéger relativement facilement.

                • [^]Re: ascii art?

                  Posté par Thomas Douillard () le 18/02/2006 à 18:43. (lien). Évalué à 2.

                  Pour la génération de phrases aléatoire, des softs comme polygen le font, à partir d'une grammaire. Après, pour générer des phrases vraiment sensées, c'est plus tendu ;) Effectivement, aller les piocher dans un base ça peut être une bonne solution, même si la base devrait pas être dispo sur le net.

                [^]Re: ascii art?

                Posté par Éric (Jabber id, page perso, ) le 18/02/2006 à 18:16. (lien). Évalué à 2.

                > Toutes les phrases sont extraites, au hasard, de "une page au
                > hasard" ( http://fr.wikisource.org/wiki/Special:Random ) sur
                > fr.wikisource.org. Une seule d'entre elles a été laissée telle quelle,
                > les 4 autres ont subi un mélange aléatoire des mots qui les
                > composent.

                Tiens, ça pourrait presque marcher ça. Il doit y avoir moyen de biaiser (tenter de rechercher la phrase sur google, y mettre un analyseur syntaxique), mais ça doit être le test le moins mauvais que j'ai vu jusqu'ici