Quel étonnement ce matin en visualisant les statistiques de fréquentation d'un site Web commercial que je gère en utilisant Piwik. Pour information Piwik un logiciel libre de statistiques écrit en PHP.
La surprise est de taille, puisque le nombre d'internautes ayant utilisé le moteur de recherche Bing (anciennement Live Search) pour arriver sur le dit site Web était égal aux nombre d'internautes ayant utilisé Google... Le site Web en question a une fréquentation modeste, mais le fait est marquant.
Curieux de connaître un peu mieux ces nouveaux Internautes, j'ai écrit un petit script Perl pour extraire des informations directement depuis le fichier log d'Apache de la veille. Stupeur, en lançant une commande « whois » sur 98 % des IP de ces internautes utilisant le moteur Bing, j'ai comme résultat « OrgName: Microsoft Corp ». Stupéfaction 5,98 % de mes hits sur les pages de ce site Web sont des employés de Microsoft ! Mais des employés de Microsoft qui ne sont pas gâtés puisqu'ils utilisent encore Windows XP et Internet Explorer 6 et en ayant désactivé le chargement des images.
Certaines mauvaises langues diront que Microsoft utilise des scripts pour augmenter artificiellement les statistiques d'utilisation de son moteur Bing, mais je suis incapable de penser et d'écrire une chose pareille d'une société aussi soigneuse de son image de marque que Microsoft, connue de par le monde pour son intégrité et son respect des lois.
J'avais déjà remarqué ce grand nombre de visites d'employés de Microsoft sur ce même site il y a quelques mois pendant une période assez longue à l'époque où Bing s'appelait encore Live Search, mais depuis deux trois mois ces d'employés de Microsoft avait boudé le site Web sans raison... Mais là ils sont revenus et pour un moment je pense.
# ou...
Posté par fcartegnie . Évalué à 7.
Vu les abus dans le référencement, je serais pas étonné que les pages soient vérifiées par la suite avec une signature autre que "bot" pour voir si le contenu change en fonction...
Ce que tu vois donc c'est probablement le bot lui même, et la plage d'ip correspondante.
[^] # Re: ou...
Posté par Gui13 (site web personnel) . Évalué à 6.
[^] # Re: ou...
Posté par Epy . Évalué à 10.
http://www.bing.com/search?q=articles 2 (18.18 %)
http://www.bing.com/search?q=logiciels 2 (18.18 %)
http://www.bing.com/search?q=accueil 2 (18.18 %)
http://www.bing.com/search?q=openoffice 1 (9.09 %)
http://www.bing.com/search?q=documentation 1 (9.09 %)
http://www.bing.com/search?q=parallel 1 (9.09 %)
http://www.bing.com/search?q=projets 1 (9.09 %)
http://www.bing.com/search?q=linux
(mois d'août seulement)
alors que les recherches venant de Google sont des phrases complètes, je me suis demandé s'il ne découpait pas les recherches de ses visiteurs mais la supposition que ce soit le moteur qui fasse ces recherches est effectivement plus probable.
(Ceci dit pour la découpe des recherches c'est parfaitement imaginable aussi vu certains mots cherchés: 'parallel' est une partie du nom d'un de mes projets)
On pourra croire que Bing connait un succès phénoménal de cette façon, si Xiti ressort le même genre de statistiques (ce qui serait une belle tricherie de la part du moteur) ils diront qu'il a beaucoup de succès et ça attirera les vrais internautes..
Hum, j'espère que je me plante vraiment !
Bon, après avoir regardé les recherches sur l'année
http://www.bing.com/search?q=linux 5 (5.43 %)
http://www.bing.com/search?q=logiciels 4 (4.35 %)
http://www.bing.com/search?q=accueil 4 (4.35 %)
http://www.bing.com/search?q=articles 3 (3.26 %)
http://www.bing.com/search?q=openoffice 1 (1.09 %)
http://www.bing.com/search?q=parallel 1 (1.09 %)
http://www.bing.com/search?q=galeries 1 (1.09 %)
http://www.bing.com/search?q=projets 1 (1.09 %)
http://www.bing.com/search?q=documentation 1 (1.09 %)
http://www.bing.com/search?q=credits
C'est confirmé, c'est le crawler, ces mots là sont les titres de mes pages (ou des liens qui mènent à ces pages)
[^] # Re: ou...
Posté par yellowiscool . Évalué à 9.
J'ai un peu de mal à croire que bind soit tellement utilisé que les gens soient capable de cliquer sur mon site à la vingtième page de résultats pour la recherche «votre».
C'est pénible, il va falloir rajouter bind.com dans la liste des spammers de referer dans awstats.
Envoyé depuis mon lapin.
[^] # Re: ou...
Posté par yellowiscool . Évalué à 3.
Envoyé depuis mon lapin.
[^] # Re: ou...
Posté par Thierry Thomas (site web personnel, Mastodon) . Évalué à 3.
[^] # Re: ou...
Posté par Bruno Ethvignot (site web personnel) . Évalué à 5.
Puis ensuite, j'ai écrit moi-même un script Perl pour extraire (du fichier log « access_www.mon-site.com.log.1» d'Apache) les IP associées au référant « www.bing.com », et le script a lancé une commande « whois », sur chacune des IP et 98 % de ces IP appartiennent à la société Microsoft et possèdent un agent utilisateur « Mozilla/4.0 (compatible; MSIE 6.0; ...) » et non pas « msnbot/2.0b ».
Donc selon toi, tous ces hits viendraient compléter le référencement du moteur Bing, mais avec un agent utilisateur différent ? Mais pourquoi tant de hits, alors que le contenu du site change peu et pourquoi mettre « www.bing.com » en référant ?
[^] # Re: ou...
Posté par fcartegnie . Évalué à 7.
Les petits malins renvoient un contenu différent *optimisé* s'ils detectent un bot.
Donc, pour eviter le spamdexing, un passage avec un user-agent normal permet de constater et blacklister ceux usant de ces pratiques.
[^] # Re: ou...
Posté par rewind (Mastodon) . Évalué à 10.
[^] # Re: ou...
Posté par Prae . Évalué à 2.
[^] # Re: ou...
Posté par zebra3 . Évalué à 4.
Article Quarante-Deux : Toute personne dépassant un kilomètre de haut doit quitter le Tribunal. -- Le Roi de Cœur
[^] # Re: ou...
Posté par Prae . Évalué à 2.
[^] # Re: ou...
Posté par Bruno Ethvignot (site web personnel) . Évalué à 9.
Et je n'ai pas constaté la présence de robot Google lutant référencement abusif ayant ce comportement.
[^] # Re: ou...
Posté par Sébastien B. . Évalué à 3.
[^] # Re: ou...
Posté par Anonyme . Évalué à 3.
moi j'avais essayé de trouver un resultat connu sur bing, et pas moyen de tomber dessus meme en mettant le texte integrale. Google avec le texte integrale me le mets en premier resultat (page perdu au fin fond du web)
peut etre qu'il faut lui laisser le temps de decouvrir internet (serieusement) a l'epoque de google il y avait moins de site que de nos jours et ils ont grandi avec internet. Microsoft est arrivé avec une masse de travail assez conséquente qui l'attendait.
[^] # Re: ou...
Posté par Smarter . Évalué à 3.
[^] # Re: ou...
Posté par steph1978 . Évalué à 2.
bien je n'ai pas pû exploiter les résultats de bing.
je ne suis pas sûr d'y retourner un jour.
[^] # Re: ou...
Posté par yellowiscool . Évalué à 4.
Si l'algorithme est différent, les résultats ne sont pas les mêmes pour les mêmes questions, et il faut reformuler les recherches. Or, on reformule pour google par habitude.
Envoyé depuis mon lapin.
[^] # Re: ou...
Posté par Dr BG . Évalué à 2.
[^] # Re: ou...
Posté par yellowiscool . Évalué à 2.
Envoyé depuis mon lapin.
[^] # Re: ou...
Posté par Dr BG . Évalué à 3.
Suivre le flux des commentaires
Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.