Journal : des idées pour éviter la création automatique de compte par des bots ?
Posté par gnap gnap (page perso, ) le 16 février 2006
Je cherche des idées pour éviter la création automatique de compte par des bots.
J'ai déjà un peu creusé la question https://gna.org/task/?func=detailitem&item_id=2876
Si quelqu'un à une proposition qui m'a échappé, ça me plairait, parce que je sêche.
L'idée, c'est d'éviter
- toute solution à base d'images qui ne marchera forcément pas pour un certain nombre d'utilisateur
- toute solution qui demande des interventions manuelles d'admins
- toute solution trop temporaire que les robots peuvent apprendre à faire en très peu de temps, car ça signifierait passer son temps à perfectionner le truc, comme à propos du spam, une escalade dans le déploiement d'astuces
Franchement, je sèche.
J'ai déjà un peu creusé la question https://gna.org/task/?func=detailitem&item_id=2876
Si quelqu'un à une proposition qui m'a échappé, ça me plairait, parce que je sêche.
L'idée, c'est d'éviter
- toute solution à base d'images qui ne marchera forcément pas pour un certain nombre d'utilisateur
- toute solution qui demande des interventions manuelles d'admins
- toute solution trop temporaire que les robots peuvent apprendre à faire en très peu de temps, car ça signifierait passer son temps à perfectionner le truc, comme à propos du spam, une escalade dans le déploiement d'astuces
Franchement, je sèche.
> Lire le journal (152 commentaires, moyenne: 2,9).
Vous avez demandé le commentaire #683060.



Quelques propositions
- Le classique mail de confirmation
- Présenter un texte et demander le mot x du paragraphe y.
- Pour valider l'inscription il faut cocher une case qui change d'intitulé: "Je suis un robot" / "Je ne suis pas un robot".
Bref quelques pistes simples :-)
[^]Re: Quelques propositions
- Il y a déjà le courriel de confirmation, mais ce n'est pas dur de contourner ce problème.
- Le mot x du paragraphe y est envisagé (suivre le lien) mais ça ne doit pas être dur du tout d'abord au bot à comprendre cela
- L'idée de la boite est effectivement simple à mettre en oeuvre ; mais aussi facile à contourner :(
[^]Re: Quelques propositions
Tu as du mal parce que ton problème, c'est le Test de Turing, tout simplement :
http://fr.wikipedia.org/wiki/Test_de_Turing
Le problème majeur est que derrière le bot, il y a l'intelligence humaine qui l'a écrit, et que c'est elle qu'il faut combattre en réalité.
Suis le lien proposé, tu verras que beaucoup de gens s'y sont cassé la tête avant toi, et tu y trouveras probablement beaucoup d'astuces qui te permettront d'avoir la paix au moins pour un temps.
Maintenant, je pense qu'il ne faut pas chercher de solution « absolue ». Soit c'est pour éviter les quelques bots qui pourraient passer de temps en temps sur ton site et dans ce cas, une solution élémentaire suffit, soit tu es littéralement envahi et dans ce cas, il faut essayer de savoir pourquoi. Si c'est parce que ton site est ultra-célèbre, alors effectivement il faut soit faire travailler l'utilisateur, soit investir dans de plus gros moyens.
Le courrier postal pourrait être l'un d'eux, étant donné le délai imposé et la nécessité d'avoir un opérateur pour saisir les informations ou faire du scan/OCR. Si tu en es là, il vaut mieux porter plainte :-)
Pour l'accessibilité, je pense que tu peux alterner fichiers sonores et fichiers visuels selon l'agent utilisé. Même si l'on veut prendre en compte les centaines de millions d'utilisateurs sous lynx/links :), il est toujours possible de télécharger l'image et de l'ouvrir avec un éditeur séparé.
Un aveugle qui surfe sur le web utilise automatiquement un agent sonore (ou alors une table braille, mais là encore, il est toujours possible de télécharger le fichier sonore et de le diffuser ailleurs).
Pour les fichiers sonores, tu peux demander aux gens de reconnaître un morceau de musique par exemple. La musique a l'avantage de s'affranchir des langues. Problème : Il faudra utiliser du classique si tu ne veux pas payer une somme forfaitaire à la SACEM pour avoir le droit de le faire, ce qui peut être envisagé : La dernière fois que j'avais regardé, ce n'était pas si inabordable que çà ...
Bonne chance.
[^]Re: Quelques propositions
En fait, c'est même un peu plus compliqué que le test de Turing, parce que ça doit être automatisé. Dans la version classique du test de Turing, c'est un humain qui interroge l'entité, et qui doit déterminer si l'entité est humaine, et pour l'instant un humain n'a pas trop de mal à le faire. Mais demander à une machine de déterminer si son interlocuteur est humain, c'est plus dur.
[^]Re: Quelques propositions
Mais si c'est très simple !
Il suffit de d'abord faire une machine qui passe le test de Turing et puis après tu l'utilises pour vérifier que les machines des autres ne le passe pas.
Mouais...
Je crois que tu as raison. Il faudrait une sorte de test de Turing à l'envers. Un test que seul les machines pourraient réussir ce qui prouverais que ce n'est pas un humain.
On appelerait cela :
le test de Gnirut
poposition de test de Gnirut :
Quelle est la troisième couleur du drapeau français ?
Quelle est la couleur d'une feuille de papier ?
Quelle était la couleur du cheval d'Henri IV ?
Quelle est la couleur du coton ?
Quelle est la couleur de la crème fraîche ?
Que bois la vache ?
[^]Re: Quelques propositions
De l'eau, je suis un bot ;-)
Bon ceci dit il existe beaucoup de tâches où un robot peut être plus habile qu'un homme.
Imaginons un site avec un questionnaire unique et deux forums: un formulaire permet de s'inscrire si l'internaute réussi le test il est inscrit au forum des bots et s'il échoue il est inscrit au forum des êtres humains.
En outre l'inscription au forum des bots permet d'éviter les essais successifs et donc les attaques pifométriques.
[^]Re: Quelques propositions
Quelle est la troisième couleur du drapeau français ?
rouge ...
ça serait pas plutot la deuxième ? :D
[+] [^]Re: Quelques propositions
Ca depend ... de gauche a droite ou de droite a gauche ??
hein quoi ? je sors.. ? ben pourquoi.... --> [ ]
[^]Re: Quelques propositions
Je me suis trompé.
Peut-être est-ce parce que je suis Breton ?
Je précise que les Bretons savent compter. Ce n'est que moi qui ai du mal.
Et je suis pas daltonien.
[^]Re: Quelques propositions
Moi je vois un autre problème. À moins de te restreindre à deux ou trois morceaux, tu vas avoir beaucoup de mal à trouver des morceaux pour un large public.
Il n'y a pas une semaine, j'ai vu quelqu'un confondre un morceau de Tchaikovski[1] et la Marseillaise.
Pour rigoler Blind test :
Une liste de musiques, combien ne connaissent pas ces airs ? Il ne doit pas y en avoir beaucoup. Qui peut mettre un titre à chacunes ?
http://upload.wikimedia.org/wikipedia/commons/9/99/Wolfgang_(...)
http://upload.wikimedia.org/wikipedia/en/b/bd/Rondo_Alla_Tur(...)
http://upload.wikimedia.org/wikipedia/commons/3/38/Die_Holle(...) (attendre au moins 40s)
http://upload.wikimedia.org/wikipedia/commons/3/3c/01_-_Viva(...)
http://upload.wikimedia.org/wikipedia/en/9/91/Ride_of_the_Va(...)
http://upload.wikimedia.org/wikipedia/en/a/ac/Blue_danube.og(...)
http://upload.wikimedia.org/wikipedia/commons/5/5b/Ludwig_va(...)
http://upload.wikimedia.org/wikipedia/commons/a/ab/Toreador_(...)
Il en manque encore plein dans le genre (Ode to joy, für Elise(Beethoven), Swan lake, The sleeping beauty(Tchaikovski), air (Bach), The entertainer, Stille-Nacht(Gruber), Funiculì, Funiculà (Denza), Champagne, Kaiser Walser (Strauss II), Radetzky March (Strauss I) etc...)[2].
Bien évidemment que tout le monde connait (ou presque). Et pour cause, on est entouré de musique classique : dans les pubs (n'oubliez pas, le principal...), dans les ascenseurs, sur sonneries de mobiles, sur les répondeurs téléphonniques, sur les attentes téléphoniques (vous avez demandé l'élysée, ne quittez pas), dans les boites à musiques, dans les dessins animés[3], dans les boites à musique, etc.
Mais pour mettre un nom dessus, c'est une autre paire de manche.
[1] http://upload.wikimedia.org/wikipedia/en/d/d0/Tchaikovsky_-_(...)
Entre 6'25 et 7'00
[2] Attention pas le droit de répondre "ode à la joie", "lettre à Élise", "lac des cygnes", "l'arnaque", "douce nuit/silent night" ou encore "la valse de l'empreur" sans quoi tu perds l'avantage de s'affranchir des langues.
[3] The sleeping beauty / La belle au bois dormant... Mooooooon aaaaaamouuuuuur, je t'ai vu au beau milieu d'un rêve.
Le libre vaincra, tout est déjà joué.
[^]Re: Quelques propositions
Faut pas demander le compositeur ou leur titre, faut demander dans quelle pub ça apparaît.
- Boum boum boum Sweet dreams are made of thi-is Boumboum
- Marylin Manson
- Sale robot !
- Eurythmics ?
- Sale robot !
- Volkswagen
- Gagné !
[^]Re: Quelques propositions
L'avantage du fichier musical ou vocal est qu'il peut être très largement altéré tout en restant parfaitement audible et intelligible pour l'être humain, et ce à chaque nouveau chargement de la page.
Si un bot veut essayer de reconnaître tous les morceaux à coup sûr (ou à 85% de probabilité), il lui faudra faire beaucoup de transformées de Fourrier et avoir un catalogue de titre de tueur.
Après, de ton coté, il faut aussi prévoir un système de réponse un minimum intelligent, genre un field à remplir mais avec une certaine tolérance aux fautes d'orthographes et aux erreurs en tous genres.
Si tu implémentes le Test de Turing mais avec un bouton radio à deux options pour la réponse, cela n'a évidement plus d'intérêt.
[^]Re: Quelques propositions
Deux problèmes majeurs à mon sens d'un tel système :
- c'est pas bon pour les sourds
- c'est pas bon pour ceux qui n'ont pas le son (pas d'enceinte sur leur PC de boulot, pas de casque et pas la possibilité de géner avec du bruit sur des enceintes)
Rédhibitoire.
[^]Re: Quelques propositions
Mais si on met des images, tu va te plaindre aussi parce que les aveugles ou les déficients visuels ne peuvent pas les voir.
Il faut que tu te rende compe de ce que tu demandes. Si quelqu'un arrive à mettre au point ton système idéal, il en fera une publication dans une revue scientifique, pas dans un journal sur LinuxFR ...
[^]Je suis un robot
- je peux répondre aux emails
- je sais chercher le mot x du paragraphe y
- je suis con, mais j'ai tout mon temps, donc une réussite de 1/2 me va parfaitement. Puis sinon, je lis le texte "Je suis un robot" / "Je ne suis pas un robot".
[^]Re: Quelques propositions
Argh... Tout sauf le mail de confirmation de grâce ^^.
Personnellement, ça m'énerve de toujours devoir confirmer mon inscription, je préfère encore les images illisibles. Mais pour les non-voyants, ce n'est pas la meilleure solution (Ni pour ceux qui surfent sur Internet avec Lynx).
[^]Re: Quelques propositions
Et bon, un robot qui sait créer une adresse jetable.org ou autre, ça doit pas être si compliqué que ça.
[^]Re: Quelques propositions
pourquoi ne pas faire jouer au navigateur une suite de fichiers audios representant chacun une lettre et demander ensuite à l'utilisateur de taper le mot correspondant dans son formulaire...
ca pourrait marcher jusqu'à ce que les bots aient des oreilles :)
[^]Re: Quelques propositions
Et les sourds ?
[^]Re: Quelques propositions
Tu leur met la même chose en image.
Et les sourds aveugles dans ce cas?
[^]Re: Quelques propositions
Tu leru met du texte qu'ils peuvent lire avec une tablette braille...
OK ---> [ ]
[^]Re: Quelques propositions
et puis selon la langue, la lettre se prononce différement!
[^]Re: Quelques propositions
et moi qui n'ai pas le son ( fucking ALC260 pas encore géré ... ) je fais comment ?
\_o< Coin ! Coin !
[+] [^]Re: Quelques propositions
Tu retournes sous windows.