Journal Carrefour, sites de cul, sites à spywares, même combat

Posté par  .
Étiquettes : aucune
0
31
août
2005
il y a certaines techniques pour gonfler les résultats d'un site dans Google, Voila et autres moteurs de recherche qu'on pourrait croire réservés aux sites de cul et autres nids à spyware et autres arnaques. bref, des escrocs visant des simples d'esprit.

et puis voila que Google me sort cette page Carrefour fort bien placée sur une recherche "prix essence" :

www.carrefour.fr/grande-surface/comparatif-prix-essence.htm

(on passera sur les adwords stupidissimes à droite :

Prix Essence
Mis à prix à partir de 1¤! aff
Inscription gratuite & sans risque.
www.eBay.fr

qui se passent de commentaires. on peut aussi acheter des nègres, j'ai vu. ce n'est pas nouveau)

or, cliquer sur cette page renverra systématiquement sur la page d'accueil du site : www.carrefour.fr

après quelques secondes - et l'invocation de notre ami wget - n'importe qui peut constater que :

* la page existe bel et bien, ce n'est pas une redirection sur un 404 ou au niveau du serveur (302)
* elle contient des bouts de texte pas totalement sans queue ni tête, mais quand même bien bizarres. ça parle de Chavignols fermiers AOC Filière Qualité Carrefour et que la garantie des produits achetés chez Carrefour porte sur les pièces et la main-d'oeuvre (mais sur le Chavigol fermier ou sur l'essence ?), qu'elle est valable sur l'ensemble du territoire national, l'assistance téléphonique est disponible de 7 jours sur 7, de 8 heures à 22 heures...
* le texte "comparatif prix essence" apparait répété plusieurs fois, comme un cheveu sur la soupe, au milieu de la page mais en dehors des phrases précédentes ou de tout contexte,
* il y a plusieurs liens vers des pages similaires (et similairement nommées) :
http://www.carrefour.fr/grande-surface/comparer-prix-carburant.htm(...) title="comparer prix carburant comparer" prix carburant, idem pour complement alimentaire, complément alimentaire (avec accent, donc), complement alimentaire anti age, (version "anti age"), Commerce alimentaire...
...et toujours sans aucun contenu utilisable puisque redirection d'office puisque :
* il y a un bout de javascript à la fin de la page :
http://www.carrefour.fr/grande-surface/script-www/rw.js(...)
* celui ci est odieusement maquillé (obscurci), on se demande franchement pourquoi :
var a="ment"; a+=".loca"; a+="tion"; a+=".rep"; a+="lace";
var b="http"; b+="://";
var cookie="ww"; cookie+="w.carre"; cookie+="four.fr";
eval( "docu"+a+"('"+b+cookie+"')" );

fichtre et diantre, pourquoi donc ? si ce n'est espérer échapper à quelqu'un ou quelque chose qui chercherait à détecter une redirection du style document.location.replace(www.carrefour.fr), je me demande bien quel intéret cela présente puisqu'une partie du but du jeu est que je me la prenne dans les dents. donc c'est bien pour tromper les moteurs de recherche
* un esprit au courant des détails remarquera que le code HTML de la page est particulièrement adapté aux moteurs de recherche, avec des tags h1, h2, strong... qu'on voit très rarement utilisés comme ça dans des vraies pages d'un vrai site. idem pour les conventions de nommage de toutes ces pages artificielles

des escrocs visant des simples d'esprit ? mais non, c'est Carrefour et nous c'est leurs gentils clients, j'ai dû me tromper...

qu'on ne me dise pas que le but du jeu est de "tromper" Google et les autres moteurs de recherche : ces résultats bidons et gonflés ont pour but de me tromper, moi, car la page retournée est, encore une fois, la page d'accueil de Carrefour. et pas un contenu en rapport avec "prix essence", et d'ailleurs je serais tombé sur des Chavignols fermiers, je ne pense pas que les voitures modernes carburent à ça...
  • # Félicitations

    Posté par  . Évalué à 3.

    Et tu viens d'augmenter le google rank de cette page en mettant le lien sur un site comme linuxfr :)
    • [^] # Re: Félicitations

      Posté par  . Évalué à 3.

      je crois qu'au bilan, ils seront nettement perdants vu le reste...
      • [^] # Re: Félicitations

        Posté par  (site web personnel) . Évalué à 4.

        tu parles, y'a des millions de sites qui font ça (des pages satellites) pour améliorer le positionnement dans les moteurs de recherches

        https://damien.pobel.fr

        • [^] # Re: Félicitations

          Posté par  . Évalué à 2.

          C'est d'ailleur déconseilé par google
          http://www.google.fr/intl/fr/webmasters/guidelines.html(...)
          • [^] # Re: Félicitations

            Posté par  . Évalué à 10.

            En fait, il faudrait le signaler à Google, ça serait marrant que Google commence à bannir des grands groupes comme Carrefour.

            Surtout que si Google se donne le culot de faire ça, vue sa suprématie, les gens, et surtout les grands groupes, réflechiraient à deux fois avant de faire ça. C'est comme dans la vraie vie, il faut faire des exemples avec certains pour calmer les autres.
        • [^] # Re: Félicitations

          Posté par  . Évalué à 10.

          que des sites de merde nazie nécrophiles \o/

          sérieusement, je sais bien que le moindre mongolien affilié à un site de sonneries pour mobiles va tenter ce genre de bourrage de site, mais si une entreprise qui a pignon sur rue comme Carrefour utilise ces mêmes ficelles pour chercher à apparaitre ou s'imposer sur n'importe quel mot clef ET ne pas fournir de contenu derrière ces fausses pages, je ne vois pas comment je peux lui faire confiance pour lui confier mon adresse email ou faire des achats en ligne chez eux : ils viennent déjà de me tromper en parfaite connaissance de cause, de me prendre pour le dernier des couillons, pourquoi ne pas continuer ?

          quelle différence entre ces indélicats qui vont pourrir Google et des vendeurs de tisanes ou de médicaments contrefaits qui viennent pourrir des commentaires de blog ? aucune. ah, si, on va me sortir quelque chose du style "ils font ça sur leur propre site, c'est chez eux, ils y font ce qu'ils veulent, c'est la faute aux moteurs ensuite si ils se font avoir". je me gausse : la volonté délibérée de tromper est là, et accepter cette logique serait d'ailleurs légitimer toute publicité mensongère.


          allez, juste pour le fun, voici un peu plus subtil : 01net.com, cliquez sur une paire d'articles au hasard, regardez le code HTML, en bas de chaque page, vous aurez plus de 50 liens avec des termes à la mode, dans un bloc mis en commentaire, comme http://www.01net.com/logiciel_linux.html(...)

          en y allant avec wget - pour échapper à une redirection similaire à celle du site de Carrefour - on tombe sur une jolie page très propre avec cette fois presque du vrai contenu, du vrai texte en bon français qui veut dire quelque chose, mais pas d'image ou de publicité, en bas de ces pages inaccessibles aux internautes mais bien destinées aux robots des moteurs de recherche, une dizaine de liens vers les autres pages destinées aux robots.

          on n'a d'ailleurs plus la fausse liste de liens en commentaire en bas de ces pages, mais une mise en page et des artifices de présentation étudiés pour maximiser le "score" final accordé à la page (enfin, c'est ce que les clowns spécialistes du domaine prétrendent savoir, parce qu'ils ne travaillent *pas* chez Google & co : ce sont plutot des charlatans qui oeuvrent dans l'empirique)

          bref, un autre site de confiance...
  • # Encore plus drôle..

    Posté par  . Évalué à 7.

    C'est tout un site parallèle qui existe.

    Mode opératoire :

    1°) Désactivez javascript.
    2°) Allez sur le lien su-cité
    3°) Changez le css/Style vers Pas de Css/Style.

    Et voilà, plein de lien a cliquer vers des vraies pages qui existent vraiment, avec plein de trucs dessus. Un vrai site.

    Tout en bas des liens pour changer de catégorie.
    • [^] # Re: Encore plus drôle..

      Posté par  . Évalué à 2.

      Encore beaucoup plus drole, vous remarquerez que ces pages sont en fait incluses dans la page d'acceuil de krouf, dans une css qui les fait disparaitre de la vision de l'innocent internaute
    • [^] # Re: Encore plus drôle..

      Posté par  . Évalué à 5.

      Une ch'tite copie d'écran pour l'exemple ?
      • [^] # Re: Encore plus drôle..

        Posté par  (site web personnel) . Évalué à 3.

        Une copie d'écran ne servirait à rien ...
        J'ai copié la page sur mon site, j'ai enlever le script redirecteur, mis en commentaire le style css et interdit à Google d'y mettre son nez (normalement) ...

        Elle est dispo ici : http://t.helleboid.free.fr/four.fr.html(...)

        à noter que j'ai mis un lien direct vers le logo de carrouf (image qui s'appelle prix carburant )
        • [^] # Re: Encore plus drôle..

          Posté par  (site web personnel) . Évalué à 3.

          Encore mieux!

          Ils ont fait une faute de frappe sur "chausette de foot" en fin de page, pouf on tombe encore sur carouf en tapant ça (avec la faute) dans google.
          • [^] # Re: Encore plus drôle..

            Posté par  (site web personnel) . Évalué à 3.

            Toujours plus fort !

            Suite à la question "mais combien carrouf a-t-il de telles pages, la réponses est ... une estimation de 66 400 !

            Alors, pour trouver les pages, c'est très simple :
            - Toutes les pages sont sur le site de carrouf : http://google.fr/search?q=site:carrefour.fr(...)
            - Les pages d'achat sont des pages dynamiques, les pages de pubs finissent par .htm --> http://www.google.com/search?q=site:carrefour.fr+htm(...)
            Sans compter le premier lien qui à l'air d'être le plan du site, toutes les autres pages ont l'air d'être de fausses pages !

            Résultats Google 1 - 10 sur un total d'environ 66 400 provenant de carrefour.fr pour htm. (0,07 secondes)

            Vive les moulinnettes !
        • [^] # Re: Encore plus drôle..

          Posté par  . Évalué à 2.

          joli travail, on voit bien les Chavignols fermiers

          d'ailleurs c'est bien ça que voient les robots donc les moteurs. les pauvres...
  • # a bien y réfléchir,

    Posté par  . Évalué à -10.

    le concept carrefour, ne vous plait pas. Peu importe, ce qui compte c'est qu'une personne assez judicieuse a usé de son intelligence pour exploiter un certain moteur de recherche jusqu'a ses dernier retranchement et que ca produise un résultat.

    Il ne faut pas oublier qu'en meme temps que l'equipe business il y a tout un staff technique dont des gens comme vous et moi. Et ce boulot, meme s'il ne vous plait pas est pour eux un simple gagne pain au quotidien.

    Soyez heureux d'avoir un système d'exploitation libre, des meninges qui fonctionnent a merveille, un talent hors du commun et un esprit un petit peu revolutionnaire. Aux armes citoyens Linuxiens, la bataille ne fait que commencer.
    La revolution est deja en marche.

  • # Pour continuer la pub

    Posté par  . Évalué à 7.

    Maintenant, il faut que tout le monde fasse un lien vers ce journal pour que cette page soit mieux classée que celle de carrouf
  • # d'accord

    Posté par  (site web personnel) . Évalué à 2.

    Je suis d'accord avec toi mais:

    >un esprit au courant des détails remarquera que le code HTML de la >page est particulièrement adapté aux moteurs de recherche, avec >des tags h1, h2, strong...

    tu vas pas reprocher au webmaster de tendre vers le web semantique, de respecter les regles que nous defendons chaque jour..

    là preuve que c'est utile d'ailleurs, ca premet une meilleur indexation


    en vous remerciant
    • [^] # Re: d'accord

      Posté par  (site web personnel) . Évalué à 1.

      tu vas pas reprocher au webmaster de tendre vers le web semantique, de respecter les regles que nous defendons chaque jour..

      Tu n'as visiblement pas visité les pages concernées.

      Autre technique que celle proposée au dessus pour les visiter : utiliser un navigateur Web léger. Pour ma part, j'ai utilisé dillo, mais il y a aussi links, links2, lynx, w3m, ...
    • [^] # Re: d'accord

      Posté par  . Évalué à 2.

      ce n'est pas ça que je reproche, c'est tout le reste : la tromperie.

      d'ailleurs pour le "vrai" site, ils ont oublié ces beaux principes et c'est plutot un carnage (flash, javascript) mais bref.

      tiens, juste pour rire, ici :

      http://www.carrefourspectacles.com/moteur.jsp(...)

      on a une page liée depuis la page d'accueil http://www.carrefourspectacles.com/(...) mais avec style="visibility:hidden" donc seuls les robots la verront. et les gens avec des clients Web tout bizarre, comme les non-voyants par exemple. d'ailleurs ces derniers seront typiquement très interessés par ce lien.
  • # Web Citoyen

    Posté par  (site web personnel) . Évalué à 2.

    Dans l'url donné dans les messages il y a un lien

    http://www.google.fr/webmasters/spamreport.html(...)

    pour "denoncer" les abus de ce genre ..

    Les sites qui essaient de tromper notre robot d'exploration à l'aide de texte caché, de redirections trompeuses, de pages masquées (« cloaking »), de page satellite (« doorway ») ou autres techniques de « spamdexing » faussent la qualité de nos résultats et compromettent les interactions entre Google et ses utilisateurs. Nous estimons que cette attitude est condamnable et que nous devons – ensemble – nous efforcer de la combattre.


    Alors certe ca prend du temps, c'est chiant ....
    Mais ca existe ...

    Bon maintenant, c'est ceux que veulent les entreprises, et quand carrfour veut ... carrfour peut ...
    Tient cette histoire de petit contre un géant, c'a me fait penser a plein de truc .. (Linux, LL, ...)

    Quelqu'un a deja mis 01net et carouf ? (meme si mieu vaut plus ..)

    Baptiste
    • [^] # Re: Web Citoyen

      Posté par  . Évalué à 2.

      rien ne prouve qu'il y a un suivi humain derrière ou même que c'est exploité : l'être humain est bien gentil mais au bout de trois contributions patriotiques, il va arrêter s'il n'a aucun feedback ou indication qu'il n'est pas en train de pisser dans un violon

      alors, ce "ensemble", c'est bien gentil, mais il faut qu'on ne se sente pas tout seul, ensuite. sans rapport d'activités ou d'annonce des blacklistings (sous de vagues prétentions de "sécurité" pour garder une longueur d'avance sur les vilains), ça ne va pas aller bien loin

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.