Journal Blog & Spam

Posté par (page perso) .
Tags : aucun
0
8
sept.
2005
Hi,

Tout ceux qui ont un blog le savent... Il se fait spammer en permanence par des robots qui fakent les referents, postent des faux commentaires ou lancent des trackballs foireux. Bref, ça pourrit le site...
Ceci dit, ces robots ont le même comportement qu'un internaute (ils consultent les pages) et ceci implique dont moultes requêtes SQL et autres conneries...
Bref, un lecteur l'autre jour a posté sur mon blog une fonction [1] qui permet à b2evolution (la fonction peut etre mise dans d'autres applis, c'est pas spécifiquement lié à b2) qui va vérifier que l'ip de la machine n'est pas une xeme machine vérolée (je résume, en fait, elle va utiliser les DNS blacklists) et utilisée par les spammeurs. Si c'est le cas, un die() vient finir la génération et évite ainsi toute la génération du blog...
Je l'ai donc testé sur mon blog et les 3/4 autres que j'héberge et le MRTG de l'utilisation CPU (récupéré via Sysstat) m'indique une diminution de plus de moitié de l'utilisation CPU moyenne [2] (passage de 25 % => 8/9).
Voila le graphe (les piques sont du à Awstats donc aucun rapport) :
http://sylvestre.ledru.info/blog/media/5/graph_utilisation_cpu.png(...)
Le pire, c'est que le MySQL n'est même pas sur le même serveur...

Mon post qui en parle plus en détail : http://sylvestre.ledru.info/blog/sylvestre/2005/09/03/le_spam_tue(...)

[1] http://forums.b2evolution.net/viewtopic.php?p=23293#23293(...)
[2] Celeron 2.4 avec 512 mo de ram
  • # heu...

    Posté par (page perso) . Évalué à  2 .

    es-tu bien sûr que cette baisse d'utilisation processeur soit bien lié à ça ?

    car même si les robots tournent tout le temps, je trouve la courbe un peu trop lisse pour une journée !

    regarde par exemple celle de linuxfr : https://linuxfr.org/images/load/load.png(...) , elle n'est pas régulière sur la journée !
    et pour avoir un petit site web privé hébergé sur mon serveur pour quelques utilisateurs, la courbe est vite similaire à celle de linuxfr...

    enfin, ça peut être ça quand même, mais regarde quand même !
    • [^] # Re: heu...

      Posté par (page perso) . Évalué à  4 .

      Certain, quand j'ai vu ca, j'ai coupé et remis la fonction, c'est clairement ca qui change tout ... J'etais surpris moi aussi ..
      Sinon, pour la courbe, ca vient sans doute du fait que beaucoup de gens se connectent au serveur d'autres pays dans d'autres fuseaux horaires ...
    • [^] # Re: heu...

      Posté par (page perso) . Évalué à  2 .

      Bon
      j'ai vérifié (tu peux voir que les horaires coincident) et je confirme que c'est bien ca qui tue le cpu :
      http://sylvestre.ledru.info/bordel/graph_utilisation_cpu_2.png(...)
      Quel merde les spammeurs quand meme ...
      • [^] # Re: heu...

        Posté par (page perso) . Évalué à  2 .

        c'est vraiment impressionnant oui !!

        en gros, tu es attaqué en continue !
        ton site a combien de visites par jours ? par rapport aux spammeurs, quel est la proportion ?
  • # Dans le même genre, mais pour Dotclear

    Posté par . Évalué à  8 .

    <pub_éhontée>
    Il existe un peu la même chose pour Dotclear, le plugin Blocage par Référent dont je suis le papa : http://goddess-gate.com/index.php/2005/08/08/119-plugin-blocage-par(...)
    </pub_éhontée>
    • [^] # Re: Dans le même genre, mais pour Dotclear

      Posté par . Évalué à  2 .

      mais non je me demandais si il existais la meme chose pour dot clear. je dirais ce qui manque c'est ton fichier que tu utilise, pour accellerer la mise en place.

      et pour le moment c'est uniquement le referent? ou on peut ajouter une adresse ip

      voila merci
      • [^] # Re: Dans le même genre, mais pour Dotclear

        Posté par . Évalué à  4 .

        pour le fichier que j'utilise : http://goddess-gate.com/share/blockreferer/referers.txt(...)

        Sinon, c'est vraiment un blocage par référent uniquement (comme son nom l'indique). Le problème du blocage par IP,c'est que ce ne sont pas forcement les mêmes qui passent, alors que les référents on tout un point commun qui permet un blocage plus efficace.

        Et surtout, si une personne vérolée est en IP dynamique, et que cette IP fini par être attribuée à quelqu'un d'autre qui n'a rien à voir avec tout ça, il va se retrouvé interdit de blog alors qu'il n'y est pour rien.
  • # Ralentissement

    Posté par . Évalué à  2 .

    Petite question :
    En ragardant ton code, j'ai vu que tu faisais 4 DSN LookUp pour déterminer si c'est un spammeur. Est ce que ceci ne provoque pas trop de ralentissement ?
    On pourrait avoir les temps moyens de génération de page avec et sans cette feature ?

    En tout cas, ca m'a l'air plutot sympa :)
    • [^] # Re: Ralentissement

      Posté par (page perso) . Évalué à  1 .

      C'est pas mon code a proprement parler :)
      Ceci dit, je m'indiquais un peu mais j'ai regardé et je voyais pas vraiment la diff et ca concerne deja à la base seulement les gens qui arrivent avec un referent, ca limite quand meme assez le nombre ...
  • # mon experience

    Posté par (page perso) . Évalué à  2 .

    Pour avoir utilise dotclear, b2evolution puis blogger, je n'ai eu de probleme de spam qu'avec b2evo.

    Je pense que dotclear n'a pas de problemes car il est encore peu connu, alors que b2evo est un fork du celebre b2. Blogger je ne sais pas comment ils font pour eviter le spam, mais meme en autorisant les commentaires anonymes je n'ai jamais eu de problemes. Avec b2evo c'etait l'horreur, malgre la blacklist centralisee.

    Note a part: c'est vrai que passer d'un outil de blog heberge soi-meme a blogger peut paraitre bizarre (d'habitude c'est peut-etre l'inverse), mais sous-traiter l'administration de mon blog m'a rendu la vie bien plus facile. Plus a surveiller les alertes de securite, faire les mises-a-jour, passer par un upload ftp pour changer le template, pas de quota en espace et en bande-passante... C'est simple et ca marche !
    • [^] # Re: mon experience

      Posté par . Évalué à  2 .

      Je pense que dotclear n'a pas de problemes


      Ahem... : http://goddess-gate.com/share/blockreferer/referers_log.txt(...) (spam par référent).
      Pour les spams par trackback, c'est plus calme, je dois en avoir un ou deux par semaine
      Pour les spams par commentaires, j'ai eu la chance de ne pas en avoir.
      • [^] # Re: mon experience

        Posté par (page perso) . Évalué à  2 .

        En tout cas je n'avais pas de problemes quand je l'utilisais (ca fait une paye). Pour les referents, c'est vrai que je ne les affichais jamais.
        • [^] # Re: mon experience

          Posté par . Évalué à  1 .

          Je ne les affiche pas non plus (à part dans mes stats, qui ne sont visible que dans l'interface d'admin). Mais si les spammeurs pouvaient être définis par un comportement rationnel, ce serait facile :)
          • [^] # Re: mon experience

            Posté par (page perso) . Évalué à  2 .

            En fait ca ne me derange pas car :
            * Un bon site dynamique a un cache, donc ca n'augmente pas la charge de facon significative
            * C'etait loin de me faire atteindre mon quota de bande passante (avec blogger j'en ai plus de toutes facons)

            Donc bref, ils peuvent toujours spammer par referant, je m'en tape completement.

            Cela dit ils feraient mieux de passer leur temps a faire des choses efficacent (bon, malheureusement le spam email rapporte :( ) plutot que d'essayer d'augmenter leur pagerank de facon debile et inutile.

Suivre le flux des commentaires

Note : les commentaires appartiennent à ceux qui les ont postés. Nous n'en sommes pas responsables.