il y a certaines techniques pour gonfler les résultats d'un site dans Google, Voila et autres moteurs de recherche qu'on pourrait croire réservés aux sites de cul et autres nids à spyware et autres arnaques. bref, des escrocs visant des simples d'esprit.
et puis voila que Google me sort cette page Carrefour fort bien placée sur une recherche "prix essence" :
www.carrefour.fr/grande-surface/comparatif-prix-essence.htm
(on passera sur les adwords stupidissimes à droite :
Prix Essence
Mis à prix à partir de 1¤! aff
Inscription gratuite & sans risque.
www.eBay.fr
qui se passent de commentaires. on peut aussi acheter des nègres, j'ai vu. ce n'est pas nouveau)
or, cliquer sur cette page renverra systématiquement sur la page d'accueil du site : www.carrefour.fr
après quelques secondes - et l'invocation de notre ami wget - n'importe qui peut constater que :
* la page existe bel et bien, ce n'est pas une redirection sur un 404 ou au niveau du serveur (302)
* elle contient des bouts de texte pas totalement sans queue ni tête, mais quand même bien bizarres. ça parle de Chavignols fermiers AOC Filière Qualité Carrefour et que la garantie des produits achetés chez Carrefour porte sur les pièces et la main-d'oeuvre (mais sur le Chavigol fermier ou sur l'essence ?), qu'elle est valable sur l'ensemble du territoire national, l'assistance téléphonique est disponible de 7 jours sur 7, de 8 heures à 22 heures...
* le texte "comparatif prix essence" apparait répété plusieurs fois, comme un cheveu sur la soupe, au milieu de la page mais en dehors des phrases précédentes ou de tout contexte,
* il y a plusieurs liens vers des pages similaires (et similairement nommées) :
http://www.carrefour.fr/grande-surface/comparer-prix-carburant.htm(...) title="comparer prix carburant comparer" prix carburant, idem pour complement alimentaire, complément alimentaire (avec accent, donc), complement alimentaire anti age, (version "anti age"), Commerce alimentaire...
...et toujours sans aucun contenu utilisable puisque redirection d'office puisque :
* il y a un bout de javascript à la fin de la page :
http://www.carrefour.fr/grande-surface/script-www/rw.js(...)
* celui ci est odieusement maquillé (obscurci), on se demande franchement pourquoi :
var a="ment"; a+=".loca"; a+="tion"; a+=".rep"; a+="lace";
var b="http"; b+="://";
var cookie="ww"; cookie+="w.carre"; cookie+="four.fr";
eval( "docu"+a+"('"+b+cookie+"')" );
fichtre et diantre, pourquoi donc ? si ce n'est espérer échapper à quelqu'un ou quelque chose qui chercherait à détecter une redirection du style document.location.replace(www.carrefour.fr), je me demande bien quel intéret cela présente puisqu'une partie du but du jeu est que je me la prenne dans les dents. donc c'est bien pour tromper les moteurs de recherche
* un esprit au courant des détails remarquera que le code HTML de la page est particulièrement adapté aux moteurs de recherche, avec des tags h1, h2, strong... qu'on voit très rarement utilisés comme ça dans des vraies pages d'un vrai site. idem pour les conventions de nommage de toutes ces pages artificielles
des escrocs visant des simples d'esprit ? mais non, c'est Carrefour et nous c'est leurs gentils clients, j'ai dû me tromper...
qu'on ne me dise pas que le but du jeu est de "tromper" Google et les autres moteurs de recherche : ces résultats bidons et gonflés ont pour but de me tromper, moi, car la page retournée est, encore une fois, la page d'accueil de Carrefour. et pas un contenu en rapport avec "prix essence", et d'ailleurs je serais tombé sur des Chavignols fermiers, je ne pense pas que les voitures modernes carburent à ça...
# Félicitations
Posté par Moonz . Évalué à 3.
[^] # Re: Félicitations
Posté par Gniarf . Évalué à 3.
[^] # Re: Félicitations
Posté par Damien Pobel (site web personnel) . Évalué à 4.
https://damien.pobel.fr
[^] # Re: Félicitations
Posté par jemore . Évalué à 2.
http://www.google.fr/intl/fr/webmasters/guidelines.html(...)
[^] # Re: Félicitations
Posté par Kouenny . Évalué à 10.
Surtout que si Google se donne le culot de faire ça, vue sa suprématie, les gens, et surtout les grands groupes, réflechiraient à deux fois avant de faire ça. C'est comme dans la vraie vie, il faut faire des exemples avec certains pour calmer les autres.
[^] # Re: Félicitations
Posté par Gniarf . Évalué à 10.
sérieusement, je sais bien que le moindre mongolien affilié à un site de sonneries pour mobiles va tenter ce genre de bourrage de site, mais si une entreprise qui a pignon sur rue comme Carrefour utilise ces mêmes ficelles pour chercher à apparaitre ou s'imposer sur n'importe quel mot clef ET ne pas fournir de contenu derrière ces fausses pages, je ne vois pas comment je peux lui faire confiance pour lui confier mon adresse email ou faire des achats en ligne chez eux : ils viennent déjà de me tromper en parfaite connaissance de cause, de me prendre pour le dernier des couillons, pourquoi ne pas continuer ?
quelle différence entre ces indélicats qui vont pourrir Google et des vendeurs de tisanes ou de médicaments contrefaits qui viennent pourrir des commentaires de blog ? aucune. ah, si, on va me sortir quelque chose du style "ils font ça sur leur propre site, c'est chez eux, ils y font ce qu'ils veulent, c'est la faute aux moteurs ensuite si ils se font avoir". je me gausse : la volonté délibérée de tromper est là, et accepter cette logique serait d'ailleurs légitimer toute publicité mensongère.
allez, juste pour le fun, voici un peu plus subtil : 01net.com, cliquez sur une paire d'articles au hasard, regardez le code HTML, en bas de chaque page, vous aurez plus de 50 liens avec des termes à la mode, dans un bloc mis en commentaire, comme http://www.01net.com/logiciel_linux.html(...)
en y allant avec wget - pour échapper à une redirection similaire à celle du site de Carrefour - on tombe sur une jolie page très propre avec cette fois presque du vrai contenu, du vrai texte en bon français qui veut dire quelque chose, mais pas d'image ou de publicité, en bas de ces pages inaccessibles aux internautes mais bien destinées aux robots des moteurs de recherche, une dizaine de liens vers les autres pages destinées aux robots.
on n'a d'ailleurs plus la fausse liste de liens en commentaire en bas de ces pages, mais une mise en page et des artifices de présentation étudiés pour maximiser le "score" final accordé à la page (enfin, c'est ce que les clowns spécialistes du domaine prétrendent savoir, parce qu'ils ne travaillent *pas* chez Google & co : ce sont plutot des charlatans qui oeuvrent dans l'empirique)
bref, un autre site de confiance...
# Encore plus drôle..
Posté par Loic Jaquemet . Évalué à 7.
Mode opératoire :
1°) Désactivez javascript.
2°) Allez sur le lien su-cité
3°) Changez le css/Style vers Pas de Css/Style.
Et voilà, plein de lien a cliquer vers des vraies pages qui existent vraiment, avec plein de trucs dessus. Un vrai site.
Tout en bas des liens pour changer de catégorie.
[^] # Re: Encore plus drôle..
Posté par Loic Jaquemet . Évalué à 2.
[^] # Re: Encore plus drôle..
Posté par bobert . Évalué à 5.
[^] # Re: Encore plus drôle..
Posté par chtitux (site web personnel) . Évalué à 3.
J'ai copié la page sur mon site, j'ai enlever le script redirecteur, mis en commentaire le style css et interdit à Google d'y mettre son nez (normalement) ...
Elle est dispo ici : http://t.helleboid.free.fr/four.fr.html(...)
à noter que j'ai mis un lien direct vers le logo de carrouf (image qui s'appelle prix carburant )
[^] # Re: Encore plus drôle..
Posté par Bastien Leblanc (site web personnel) . Évalué à 3.
Ils ont fait une faute de frappe sur "chausette de foot" en fin de page, pouf on tombe encore sur carouf en tapant ça (avec la faute) dans google.
[^] # Re: Encore plus drôle..
Posté par chtitux (site web personnel) . Évalué à 3.
Suite à la question "mais combien carrouf a-t-il de telles pages, la réponses est ... une estimation de 66 400 !
Alors, pour trouver les pages, c'est très simple :
- Toutes les pages sont sur le site de carrouf : http://google.fr/search?q=site:carrefour.fr(...)
- Les pages d'achat sont des pages dynamiques, les pages de pubs finissent par .htm --> http://www.google.com/search?q=site:carrefour.fr+htm(...)
Sans compter le premier lien qui à l'air d'être le plan du site, toutes les autres pages ont l'air d'être de fausses pages !
Résultats Google 1 - 10 sur un total d'environ 66 400 provenant de carrefour.fr pour htm. (0,07 secondes)
Vive les moulinnettes !
[^] # Re: Encore plus drôle..
Posté par Gniarf . Évalué à 2.
d'ailleurs c'est bien ça que voient les robots donc les moteurs. les pauvres...
# a bien y réfléchir,
Posté par Marc Quinton . Évalué à -10.
Il ne faut pas oublier qu'en meme temps que l'equipe business il y a tout un staff technique dont des gens comme vous et moi. Et ce boulot, meme s'il ne vous plait pas est pour eux un simple gagne pain au quotidien.
Soyez heureux d'avoir un système d'exploitation libre, des meninges qui fonctionnent a merveille, un talent hors du commun et un esprit un petit peu revolutionnaire. Aux armes citoyens Linuxiens, la bataille ne fait que commencer.
La revolution est deja en marche.
[^] # Re: a bien y réfléchir,
Posté par liberforce (site web personnel) . Évalué à 4.
# Pour continuer la pub
Posté par Louis Nyffenegger . Évalué à 7.
# d'accord
Posté par PloufPlouf (site web personnel) . Évalué à 2.
>un esprit au courant des détails remarquera que le code HTML de la >page est particulièrement adapté aux moteurs de recherche, avec >des tags h1, h2, strong...
tu vas pas reprocher au webmaster de tendre vers le web semantique, de respecter les regles que nous defendons chaque jour..
là preuve que c'est utile d'ailleurs, ca premet une meilleur indexation
en vous remerciant
[^] # Re: d'accord
Posté par Jonathan ILIAS-PILLET (site web personnel) . Évalué à 1.
Tu n'as visiblement pas visité les pages concernées.
Autre technique que celle proposée au dessus pour les visiter : utiliser un navigateur Web léger. Pour ma part, j'ai utilisé dillo, mais il y a aussi links, links2, lynx, w3m, ...
[^] # Re: d'accord
Posté par Gniarf . Évalué à 2.
d'ailleurs pour le "vrai" site, ils ont oublié ces beaux principes et c'est plutot un carnage (flash, javascript) mais bref.
tiens, juste pour rire, ici :
http://www.carrefourspectacles.com/moteur.jsp(...)
on a une page liée depuis la page d'accueil http://www.carrefourspectacles.com/(...) mais avec style="visibility:hidden" donc seuls les robots la verront. et les gens avec des clients Web tout bizarre, comme les non-voyants par exemple. d'ailleurs ces derniers seront typiquement très interessés par ce lien.
# Web Citoyen
Posté par Bactisme (site web personnel) . Évalué à 2.
http://www.google.fr/webmasters/spamreport.html(...)
pour "denoncer" les abus de ce genre ..
Alors certe ca prend du temps, c'est chiant ....
Mais ca existe ...
Bon maintenant, c'est ceux que veulent les entreprises, et quand carrfour veut ... carrfour peut ...
Tient cette histoire de petit contre un géant, c'a me fait penser a plein de truc .. (Linux, LL, ...)
Quelqu'un a deja mis 01net et carouf ? (meme si mieu vaut plus ..)
Baptiste
[^] # Re: Web Citoyen
Posté par Gniarf . Évalué à 2.
alors, ce "ensemble", c'est bien gentil, mais il faut qu'on ne se sente pas tout seul, ensuite. sans rapport d'activités ou d'annonce des blacklistings (sous de vagues prétentions de "sécurité" pour garder une longueur d'avance sur les vilains), ça ne va pas aller bien loin
Suivre le flux des commentaires
Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.