Hi,
Tout ceux qui ont un blog le savent... Il se fait spammer en permanence par des robots qui fakent les referents, postent des faux commentaires ou lancent des trackballs foireux. Bref, ça pourrit le site...
Ceci dit, ces robots ont le même comportement qu'un internaute (ils consultent les pages) et ceci implique dont moultes requêtes SQL et autres conneries...
Bref, un lecteur l'autre jour a posté sur mon blog une fonction [1] qui permet à b2evolution (la fonction peut etre mise dans d'autres applis, c'est pas spécifiquement lié à b2) qui va vérifier que l'ip de la machine n'est pas une xeme machine vérolée (je résume, en fait, elle va utiliser les DNS blacklists) et utilisée par les spammeurs. Si c'est le cas, un die() vient finir la génération et évite ainsi toute la génération du blog...
Je l'ai donc testé sur mon blog et les 3/4 autres que j'héberge et le MRTG de l'utilisation CPU (récupéré via Sysstat) m'indique une diminution de plus de moitié de l'utilisation CPU moyenne [2] (passage de 25 % => 8/9).
Voila le graphe (les piques sont du à Awstats donc aucun rapport) :
http://sylvestre.ledru.info/blog/media/5/graph_utilisation_cpu.png(...)
Le pire, c'est que le MySQL n'est même pas sur le même serveur...
Mon post qui en parle plus en détail : http://sylvestre.ledru.info/blog/sylvestre/2005/09/03/le_spam_tue(...)
[1] http://forums.b2evolution.net/viewtopic.php?p=23293#23293(...)
[2] Celeron 2.4 avec 512 mo de ram
# heu...
Posté par Sylvain Rampacek (site web personnel) . Évalué à 2.
car même si les robots tournent tout le temps, je trouve la courbe un peu trop lisse pour une journée !
regarde par exemple celle de linuxfr : https://linuxfr.org/images/load/load.png(...) , elle n'est pas régulière sur la journée !
et pour avoir un petit site web privé hébergé sur mon serveur pour quelques utilisateurs, la courbe est vite similaire à celle de linuxfr...
enfin, ça peut être ça quand même, mais regarde quand même !
[^] # Re: heu...
Posté par Sylvestre Ledru (site web personnel) . Évalué à 4.
Sinon, pour la courbe, ca vient sans doute du fait que beaucoup de gens se connectent au serveur d'autres pays dans d'autres fuseaux horaires ...
[^] # Re: heu...
Posté par Sylvestre Ledru (site web personnel) . Évalué à 2.
j'ai vérifié (tu peux voir que les horaires coincident) et je confirme que c'est bien ca qui tue le cpu :
http://sylvestre.ledru.info/bordel/graph_utilisation_cpu_2.png(...)
Quel merde les spammeurs quand meme ...
[^] # Re: heu...
Posté par Sylvain Rampacek (site web personnel) . Évalué à 2.
en gros, tu es attaqué en continue !
ton site a combien de visites par jours ? par rapport aux spammeurs, quel est la proportion ?
# Dans le même genre, mais pour Dotclear
Posté par skuld . Évalué à 8.
Il existe un peu la même chose pour Dotclear, le plugin Blocage par Référent dont je suis le papa : http://goddess-gate.com/index.php/2005/08/08/119-plugin-blocage-par(...)
</pub_éhontée>
[^] # Re: Dans le même genre, mais pour Dotclear
Posté par Anonyme . Évalué à 2.
et pour le moment c'est uniquement le referent? ou on peut ajouter une adresse ip
voila merci
[^] # Re: Dans le même genre, mais pour Dotclear
Posté par skuld . Évalué à 4.
Sinon, c'est vraiment un blocage par référent uniquement (comme son nom l'indique). Le problème du blocage par IP,c'est que ce ne sont pas forcement les mêmes qui passent, alors que les référents on tout un point commun qui permet un blocage plus efficace.
Et surtout, si une personne vérolée est en IP dynamique, et que cette IP fini par être attribuée à quelqu'un d'autre qui n'a rien à voir avec tout ça, il va se retrouvé interdit de blog alors qu'il n'y est pour rien.
# Ralentissement
Posté par TilK . Évalué à 2.
En ragardant ton code, j'ai vu que tu faisais 4 DSN LookUp pour déterminer si c'est un spammeur. Est ce que ceci ne provoque pas trop de ralentissement ?
On pourrait avoir les temps moyens de génération de page avec et sans cette feature ?
En tout cas, ca m'a l'air plutot sympa :)
[^] # Re: Ralentissement
Posté par Sylvestre Ledru (site web personnel) . Évalué à 1.
Ceci dit, je m'indiquais un peu mais j'ai regardé et je voyais pas vraiment la diff et ca concerne deja à la base seulement les gens qui arrivent avec un referent, ca limite quand meme assez le nombre ...
# mon experience
Posté par Erwan . Évalué à 2.
Je pense que dotclear n'a pas de problemes car il est encore peu connu, alors que b2evo est un fork du celebre b2. Blogger je ne sais pas comment ils font pour eviter le spam, mais meme en autorisant les commentaires anonymes je n'ai jamais eu de problemes. Avec b2evo c'etait l'horreur, malgre la blacklist centralisee.
Note a part: c'est vrai que passer d'un outil de blog heberge soi-meme a blogger peut paraitre bizarre (d'habitude c'est peut-etre l'inverse), mais sous-traiter l'administration de mon blog m'a rendu la vie bien plus facile. Plus a surveiller les alertes de securite, faire les mises-a-jour, passer par un upload ftp pour changer le template, pas de quota en espace et en bande-passante... C'est simple et ca marche !
[^] # Re: mon experience
Posté par skuld . Évalué à 2.
Ahem... : http://goddess-gate.com/share/blockreferer/referers_log.txt(...) (spam par référent).
Pour les spams par trackback, c'est plus calme, je dois en avoir un ou deux par semaine
Pour les spams par commentaires, j'ai eu la chance de ne pas en avoir.
[^] # Re: mon experience
Posté par Erwan . Évalué à 2.
[^] # Re: mon experience
Posté par skuld . Évalué à 1.
[^] # Re: mon experience
Posté par Erwan . Évalué à 2.
* Un bon site dynamique a un cache, donc ca n'augmente pas la charge de facon significative
* C'etait loin de me faire atteindre mon quota de bande passante (avec blogger j'en ai plus de toutes facons)
Donc bref, ils peuvent toujours spammer par referant, je m'en tape completement.
Cela dit ils feraient mieux de passer leur temps a faire des choses efficacent (bon, malheureusement le spam email rapporte :( ) plutot que d'essayer d'augmenter leur pagerank de facon debile et inutile.
Suivre le flux des commentaires
Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.