Journal Fin de la vie privée sur Google Search ? Au revoir.

21
5
nov.
2011

Cher Nal,

Je n'ai pas pu t'écrire hier vendredi jour de troll, je t'écris donc très tôt ce matin. Je viens te rapporter que la vie privée avec Google, c'était pas déjà ça ; mais ça l'est encore moins maintenant.

Petites explications...

(Que les choses soit clair, ici je parle exclusivement du moteur de recherche Google. Rien à voir avec Gmail, Google+, ou je ne sais pas quoi qui n'ont jamais respecté la vie privée.)

Le début de la fin de la vie privée sur Google.

De la petite surveillance…

À l'origine Google ne traquait que les recherches. Quand vous tapiez « example.net » sur Google, l'entreprise archivait « l'ip 192.0.43.10 a cherché le terme example.net le 1er janvier 1970 ».

C'est bien, me ce n'est pas suffisant pour profiler les utilisateurs. Parce que « example.net » donnait deux résultats : le site officiel example.net et bigboob-mature-example.net. Et connaissant l’internaute moyen, tout le monde cliquait sur le deuxième lien.

...à la grande surveillance

Google s'est donc mis à traquer le lien sur lequel l'utilisateur cliquait. Comment ? C'est très simple. Regardons par l'exemple. Cherchons « linuxfr » sur Google, et regardons dans Firebug le DOM (≃ le code HTML) :

<a onmousedown="return rwt(this,'','','','1','valueurpourrie','','autrevaleurpourrie')" class="l" href="http://linuxfr.org/">Accueil - <em>LinuxFr</em>.org</a>


Qu'est-ce que cela signifie ? Concrètement, en JavaScript, quand vous cliquez sur « Accueil - LinuxFr.org », (je simplifie) ça envoie un google les informations « le lien sur lequel vous avez cliqué, valeurpourrie et autrevaleurpourrie » (Vous vous doutez que ces deux valeurs permettent de vous identifier de façon unique pour mieux vous suivre à la trace).

Bien sur, comme la majorité des gens sain d'esprit, j'utilise NoScript pour éviter que les sites web ne lancent du code JavaScript sur ma machine comme il leur plaît. Et Google n'était pas autorisé :) .

La fin de la vie privée sur Google

Mais Google a récemment (depuis 2–3 jours) mis en place une parade contre ceux qui désactivent le JavaScript. Désactivons le JavaScript, et regardons le code HTML :

<a class="l" href="/url?url=http://linuxfr.org/&amp;rct=j&amp;sa=U&amp;ei=N3i0TsKuPKPV4QS2n9X0Aw&amp;ved=valeurpourrie&amp;q=linuxfr&amp;usg=autrevaleurpourrie">Accueil - <em>LinuxFr</em>.org</a>


Plus de « onmousedown » ! Ahah, mais à la place, on fait une redirection vers google.fr/url?url=blabla .

En plus d'être suivit à la trace même quand on désactive le JavaScript ; c'est super lourd, parce qu'à chaque fois que je clique sur un lien, j'ai une page blanche de transition entre Google et la page :@ . Enfer et damnation !

C'est bon c'est fini. « Google ? [ton solennel] Au revoir ! (Marseillaise) ».

Les alternatives

C'est bien de vouloir quitter Google. Mais, il faut le reconnaitre aucun moteur de recherche ne donne des résultats aussi pertinents ; et j'ai toujours besoin de faire mes recherches…

Quelle alternative utiliser ?

UserScript, greffon Firefox,…

J'ai juste chercher rapidement. Mais je n'ai rien trouver. Peut être que toi, cher Nal, trouvera quelque chose. Je pensais à un greffon Firefox, ou un script GreaseMonkey qui, en gros, modifierai tout les liens de résultat /url?url=blabla, par blabla.

Mais ça ne revient qu'à repousser la transition de Google vers un autre moteur au jour où Google trouvera une autre solution pour nous suivre à la trace.

Duck Duck Go

Duck Duck Go est un moteur de recherche respectueux de la vie privée d'après la société qui l'édite. Et qui changerait pas les résultat suivant les utilisateurs d'après la même société.

Mais les résultat n'ont pas l'air top. Et j'étais habitué aux prévisualisations avec SearchPreview. J'avoue qu'il a des fonctionnalités interessantes. Mais la transition sera difficile.

Seeks

Un truc qui me trotte dans la tête, c'est Seeks. D'après ce que j'ai compris (je peux me tromper), le principe c'est que c'est un meta-moteur. Il fait des recherche sur plusieurs moteurs (google, bing, yahoo, duckduckgo, …), prend les résultats les plus adéquats, et s'adapte à votre profil. Mais vu que vous l'auto-hébergez, vos informations sur votre profil restent chez vous. Et j'ai cru comprendre qu'il essayait de pourrir le profilage fait par les moteurs de recherche en injectant des fausses recherches. J'ai aussi cru comprendre qu'il retenait les recherches pour pas faire les même trop souvent (moi qui tape plusieurs fois par jour « imdb », « linuxfr » ou « wikipedia » sur Google, ça m'a l'air d'être la meilleure solution).

 

 

Et toi cher Nal, vas-tu abandonner Google pour Duck Duck Go ou Seeks ?

Post-scriptum : tu peux aussi chercher mes fautes d'orthographe, de grammaire ou de français académique, il y en a plein ;) .

  • # Désolé, j'ai oublié la nimage

    Posté par . Évalué à 10.

    Je suis désolé, j'ai oublié de mettre une nimage :
    Bébé Panda

    Knowing the syntax of Java does not make someone a software engineer.

  • # Pour ceux que ça intéresse…

    Posté par . Évalué à 7.

    En attendant de passer à Seeks auto-hébergé, j'ai remis Google comme il était avant.

    Knowing the syntax of Java does not make someone a software engineer.

  • # Scroogle

    Posté par . Évalué à 8.

    C'est bien de vouloir quitter Google. Mais, il faut le reconnaitre aucun moteur de recherche ne donne des résultats aussi pertinents ; et j'ai toujours besoin de faire mes recherches…

    Alors Scroogle. Pourvu que ça dure !

    Théorie du pot-au-feu : « Tout milieu où existe une notion de hauteur (notamment les milieux économique, politique, professionnels) se comporte comme un pot-au-feu : les mauvaises graisses remontent. »

    • [^] # Re: Scroogle

      Posté par . Évalué à 2.

      merci de le rappeler. Il me semble que ce site avait été mis en berne un moment car google avait modifié son système, bloquant (involontairement ?) scroogle.

      Pour ma part j'utilise avec bonheur duckduckgo, que je trouve sympa visuellement (canard rigolo), éthiquement (pas de profilage) et techniquement (résultats directs et sans clics pour certaines requêtes, syntaxe !bang [https://duckduckgo.com/bang.html], il en existe même une pour scroogle : !scroogle ou !s)
      Pour les résultats anglais, c'est top, pour les français, moins bon malgré le rajout de fr ou !r:fr (et pas d'images), en ce cas je rajoute !gfr, !gi, !b ou !bi selon mes besoins

      Only wimps use tape backup: real men just upload their important stuff on megaupload, and let the rest of the world ~~mirror~~ link to it

      • [^] # Re: Scroogle

        Posté par . Évalué à 2.

        syntaxe !bang [https://duckduckgo.com/bang.html], il en existe même une pour scroogle : !scroogle ou !s)

        Détail piquant sur les bangs : ça redirige vers les versions HTTPS de ces sites lorsqu'elles existent.

        Article Quarante-Deux : Toute personne dépassant un kilomètre de haut doit quitter le Tribunal. -- Le Roi de Cœur

  • # a propos de seeks

    Posté par (page perso) . Évalué à 6.

    Pour la rectification : Seeks n envoie pas de fausses requetes. Le profilage est desamorce par la fonction pair a pair.

    Pour solutionner ton probleme : installer seeks sur ton laptop ou ton serveur. Ne garder que Google en moteur source dans la configuration. Cinq minutes montre en main. Tu peux ensuite desactiver la fonction pair a pair si celle-ci ne te convient pas.

    A noter que Seeks permet dorenavant de cross-poster tes clics. Au lieu de les donner a Google cela revient a les donner de facon anonyme pour ameliorer les resultats des autres utilisateurs de Seeks.

  • # à bon escient

    Posté par . Évalué à 9.

    moi qui tape plusieurs fois par jour « imdb », « linuxfr » ou « wikipedia » sur Google

    Je ne te fais pas l'injure de te demander si tu fais partie de ces gens qui ignorent qu'il existe une barre d'adresse et qui cherchent « linuxfr.org » dans gogole pour aller sur linuxfr.org ; mais alors pourquoi diable cherches-tu « linuxfr » plusieurs fois par jour ?

    • [^] # Re: à bon escient

      Posté par . Évalué à 5.

      j'ose espérer qu'il voulait dire qu'il tapait la requête linuxfr + autre mot clé pour voir l'évolution de ce mot clé sur le site linuxfr durant la journée (on a peut-être trouvé le multi de pasbillpasgates qui cherche en temps réel le mot microsoft sur linuxfr)

      Only wimps use tape backup: real men just upload their important stuff on megaupload, and let the rest of the world ~~mirror~~ link to it

      • [^] # Re: à bon escient

        Posté par . Évalué à 3.

        Si c'est le cas c'est pas avec une mise en cache que ça va l'aider.

        Tous les contenus que j'écris ici sont sous licence CC0 (j'abandonne autant que possible mes droits d'auteur sur mes écrits)

      • [^] # Re: à bon escient

        Posté par (page perso) . Évalué à 4.

        Alors, du coup, sur Google, c’est : site:linuxfr.org <recherche>

    • [^] # Re: à bon escient

      Posté par . Évalué à 4.

      Surtout que pour un site ou une page où on va régulièrement, les navigateurs récents propose le bon dès que tu as tapé trois caractères dans la barre d'URL. Par exemple chez moi je tape lin dans ma barre d'adresse et je retrouve linuxfr.

      Tous les contenus que j'écris ici sont sous licence CC0 (j'abandonne autant que possible mes droits d'auteur sur mes écrits)

      • [^] # Re: à bon escient

        Posté par (page perso) . Évalué à 9.

        Tu viens pas assez souvent. Moi, je tape « l » et j'y suis ;-).

        • [^] # Re: à bon escient

          Posté par . Évalué à 7.

          Tu ne viens pas assez souvent. Moi j'ouvre mon navigateur et j'y suis (c'est ma page d'accueil).

          Article Quarante-Deux : Toute personne dépassant un kilomètre de haut doit quitter le Tribunal. -- Le Roi de Cœur

          • [^] # Re: à bon escient

            Posté par (page perso) . Évalué à 1.

            Tu ne viens pas assez souvent, j'ouvre ma session qui rétablit mon navigateur qui était sur Linuxfr à la fermeture.

            • [^] # Re: à bon escient

              Posté par . Évalué à 3.

              tu ne viens pas assez souvent, moi j'ai mon navigateur toujours ouvert sur linuxfr

              Il ne faut pas décorner les boeufs avant d'avoir semé le vent

    • [^] # Re: à bon escient

      Posté par . Évalué à 7.

      Je ne te fais pas l'injure de te demander si tu fais partie de ces gens qui ignorent qu'il existe une barre d'adresse et qui cherchent « linuxfr.org » dans gogole pour aller sur linuxfr.org ; mais alors pourquoi diable cherches-tu « linuxfr » plusieurs fois par jour ?

      Non, je te rassure. Je tape directement linuxfr.org dans la barre d'adresse. Mais je me surprend plusieurs fois par jours à faire la même recherche Google. Un exemple tout simple « gentoo installation lvm », deuxième lien, j'ai ça « http://www.gentoo.org/doc/en/gentoo-x86+raid+lvm2-quickinstall.xml ». Maintenant, depuis gentoo.org, il faut enchainer les clics. (Docs, Documentation Listing, et il faut que tu cherche « Gentoo Linux x86 with Software Raid and LVM2 Quick Install Guide ».) Et si j'ai fermé l'onglet et que je veux relire un truc, je repasse par Google. (Je sais saimal, je centralise le web sur google, blabla, Shame on you Niniryoku…)

      Knowing the syntax of Java does not make someone a software engineer.

      • [^] # Re: à bon escient

        Posté par . Évalué à 6. Dernière modification le 05/11/11 à 13:37.

        si j'ai fermé l'onglet et que je veux relire un truc

        J'ai découvert par hasard que Firefox permet d'ouvrir le dernier onglet fermé avec [CTRL]+[SHIFT]+t
        (Pareil pour une fenêtre avec [CTRL]+[SHIFT]+n )

      • [^] # Re: à bon escient

        Posté par . Évalué à 3.

        Et si j'ai fermé l'onglet et que je veux relire un truc

        Bah voilà, c’est parce que tu fermes l’onglet.

        Firefox a maintenant dans la barre d’adresse une recherche sur les onglets ouverts... et aussi une option pour ne charger que l’onglet courant au démarrage et les autres seulement quand on clique dessus (bien utile quand on a plus de 200 onglets !).

        Théorie du pot-au-feu : « Tout milieu où existe une notion de hauteur (notamment les milieux économique, politique, professionnels) se comporte comme un pot-au-feu : les mauvaises graisses remontent. »

  • # Alternative ? Testée et approuvé !

    Posté par (page perso) . Évalué à 7.

    Depuis quelques mois maintenant j'utilise Seeks sur toutes mes machines et j'en suis pleinement satisfait :
    - sur mes PC qui tiennent la route j'utilise une instance Seeks locale (tournant sous Ubuntu c'est facile, j'installe le dépôt ppa:theli48/seeks puis le paquet seeks-experimental, y'a plus qu'à configurer le proxy de mon navigateur sur 127.0.0.1:8250 et mettre http://s.s/search?s=%s en adresse de recherche par défaut et basta !
    - sur les machines où c'est plus complexe ou peu puissantes (mon smartbook par exemple) j'utilise un nœud public.
    - sous Android j'utilise le widget prévu à cet effet ou un nœud public sur un navigateur libre le permettant (Zirco browser par exemples).

    Grace à Seeks je n'ai plus besoin de Google que TRÈS rarement, notament sur les sites utiliant Google comme moteur de recherche (je te pointe du doigt, linuxfr.org !).

    Je n'attend plus qu'une chose : le peer-to-peer qui promet beaucoup à mon avi.

    Bref, développeurs de Seeks, infiniment merci pour tout ce gros boulot.

    • [^] # Re: Alternative ? Testée et approuvé !

      Posté par (page perso) . Évalué à -6.

      notament sur les sites utiliant Google comme moteur de recherche (je te pointe du doigt, linuxfr.org !).

      Rassure-moi, tu connais bien un truc "de base" de la recherche, même sur Seeks, genre site:linuxfr.org?

      • [^] # Re: Alternative ? Testée et approuvé !

        Posté par . Évalué à -3.

        Il fait probablement reference a la recherche "interne" (le machin en haut a gauche) de linuxfr qui est en fait une recherche googlr.

        If you can find a host for me that has a friendly parrot, I will be very very glad. If you can find someone who has a friendly parrot I can visit with, that will be nice too.

        • [^] # Re: Alternative ? Testée et approuvé !

          Posté par (page perso) . Évalué à 0.

          Oh j'ai bien compris... Le Monsieur a dit qu'il a besoin de Google pour faire une recherche sur LinuxFr, je lui répond que non, il n'en a pas besoin, c'est pas parce que son site met un lien "rapide" qu'il est obligé de l'utiliser.

          Il n'a aucun besoin d'utiliser Google, si ça lui plait pas il utilise Seek pour faire une recherche sur LinuxFr. Google n'oblige rien du tout, LinuxFr n'oblige rien du tout non plus, il est libre.

          • [^] # Re: Alternative ? Testée et approuvé !

            Posté par . Évalué à 9.

            T'es un peu lourd avec ton couplet "t'as le choix, t'es pas oblige" servi en boucle et a toutes les sauces.

            If you can find a host for me that has a friendly parrot, I will be very very glad. If you can find someone who has a friendly parrot I can visit with, that will be nice too.

          • [^] # Re: Alternative ? Testée et approuvé !

            Posté par (page perso) . Évalué à 6.

            La question n'est pas là, j'étais juste surpris que Linuxfr utilise Google pour faire des recherches sur sa propre base donnée.

            D'ailleurs je ne comprend vraiment pas le besoin qu'ont les sites de faire passer par Google les recherches que font leurs visiteurs sur leur propre site... ils peuvent pas traiter ça en interne ? Il préfèrent laisser Google vampiriser la bae de donnée et aire les calculs lui même ?

            En gros je n'ai pas besoin de Google pour faire des recherches sur Linuxfr, je reproche à Linuxfr d'avoir besoin de Google pour faire ses recherches à sa place.
            Dire que Linuxfr n'oblige en rien est idiot car la fonction de recherche interne avec Google est là et est mise en avant.

            • [^] # Re: Alternative ? Testée et approuvé !

              Posté par . Évalué à 4.

              https://linuxfr.org/suivi

              Tous les contenus que j'écris ici sont sous licence CC0 (j'abandonne autant que possible mes droits d'auteur sur mes écrits)

            • [^] # Re: Alternative ?Testée et approuvé!

              Posté par . Évalué à 2.

              Google fournit un ensemble de fonctionnalités de recherche avancées, qu'il serait con mais aussi fastidieux à réimplémenter (la recherche par image, la correction des termes de la recherche, les exclusions, les opérateurs logiques, les suggestions, les liens commerciaux, …).

            • [^] # Re: Alternative ? Testée et approuvé !

              Posté par (page perso) . Évalué à 5.

              ils peuvent pas traiter ça en interne ?

              Jusqu'à il y a peu c'était quand même loin d'être trivial. Depuis quelques temps pas mal de cms intègrent des plugins de recherche basés sur apache solr (durpal, ezpublish).
              Ça nécessite d'avoir une jvm mais c'est assez raisonnable en terme de ressources
              et permet d'être pertinent facilement.

              C'est comme le tracking basés sur google analytics. Il existe des solutions alternatives libres. Mais elles sont compliquées à maintenir. Tu me diras qu'au moins comme ça il y a pas 10000 trucs à bloquer.

              Le principal problème est l'entretiens d'une base de données. Le dba de beaucoup de sites s'appelant "plesck" , ils se retrouvent vite avec des problèmes d'accès concurrent dont ils ne savent pas se dépêtrer sinon avec plus de plus gros serveurs. Ce qui a un cout.

              Pour te donner un exemple, le module de recherche de prestashop (celui qu'utilse l'un de mes clients en tout cas), crée une table dédiée à la recherche via un script d'indexation lancé depuis l'admin du site.

              Ce script étant lancé via une requête http, il n'abouti simplement pas si ton serveur http est configuré avec des timeout raisonnables.

              La solution consiste à soit déporter l'admin sur un autre serveur http ou d'adapter ce script pour qu'il puisse s’exécuter en ligne de commande. Pour un graphiste rien de cela n'est trivial. De plus il faut avoir choisie le bon moteur de stockage, défragmenter et analyser régulièrement ta table si tu veux que ce soit efficace. Il faut aussi ajuster régulièrement les paramètres de ton serveur mysql en fonction de l'évolution de ta base, rajouter un index ou deux qui sont oubliés en cas de mise à jour depuis telle version ...

              Tandis qu'avec la recherche google, ça juste marche directement et sans rien faire.

            • [^] # Re: Alternative ? Testée et approuvé !

              Posté par . Évalué à -3.

              Google ne vampirise rien du tout, ils indexent deja linuxfr.
              Et en plus, eux ont des donnees exterieures (les liens vers les pages), qui leur permet d'ajuster la pertinence.

              Apres, si tu te sens de maintenir un index pertinent sur du contenu genere par des utilisateurs, et avoir des temps de reponse decents, ben lache toi, mais tu risques de vite dechanter.

              If you can find a host for me that has a friendly parrot, I will be very very glad. If you can find someone who has a friendly parrot I can visit with, that will be nice too.

    • [^] # Re: Alternative ? Testée et approuvé !

      Posté par (page perso) . Évalué à 1.

      Moi ce qui me manque avec seeks c'est les recherches par site, par exemple « moule site:linuxfr.org ».

  • # J'ai rien compris...

    Posté par (page perso) . Évalué à 9.

    C'est quoi le problème ? Que Google sache sur quels liens tu as cliqué ?

    Ben, il me semble que cela a tjs été le fonctionnement de leur site, que c'est ce fonctionnement qui garantie la pertinence des recherches Google...

    • [^] # Re: J'ai rien compris...

      Posté par (page perso) . Évalué à 6.

      Ben, il me semble que cela a tjs été le fonctionnement de leur site, que c'est ce fonctionnement qui garantie la pertinence des recherches Google...

      Suis pas certain que google ait toujours enrobé les liens des résultats pour passer par lui systématiquement.
      Y'a quand même une sacrée différence entre renvoyer un paquet de liens extérieurs et renvoyer un paquet des liens google, non ?

      • [^] # Re: J'ai rien compris...

        Posté par (page perso) . Évalué à -3.

        Y'a quand même une sacrée différence entre renvoyer un paquet de liens extérieurs et renvoyer un paquet des liens google, non ?

        Non. Le comportement n'a pas changé (je vais bien sur le site que je veux), et Google ne connait toujours rien sur ma vie privée, n'en déplaise à ceux qui mettent le mot "vie privée" (nom, adresses...) à toutes les sauces.

        • [^] # Re: J'ai rien compris...

          Posté par . Évalué à 1.

          le mot "vie privée" (nom, adresses...) à toutes les sauces.

          Étonnant comme remarque
          La vie privée est une notion personnelle, elle n'a pas pour moi le même périmètre que mes amis qui annoncent qu'ils vont chier sur facebook. Mais je pense qu'on peut simplement la définir en disant que la vie privée est toute information que son propriétaire ne veut pas rendre publique.

          Perso, que cette information me soit liée nommément ou anonymement ne change pas grand-chose, mon fingerprint gpg, même si ma clé est anonyme, m'identifie. Autant que mon numéro de carte de métro, ou l'ensemble des infos qu'un site peut récupérer sur ma configuration os/navigateur ou je ne sais quoi d'autre. De plus, et même si ce n'est pas autorisé en France, je n'ai pas confiance sur la façon dont pourraient être recoupés les fichiers.

          Ensuite les mentalités évoluent, mes parents sont plus paranos que moi, et je le suis plus que mes jeunes cousins.

          • [^] # Re: J'ai rien compris...

            Posté par (page perso) . Évalué à -2.

            La vie privée est une notion personnelle

            Figure-toi que non. Les loi sur les atteintes à la vie privée ne changent pas suivant qui est "atteint"... Après, tu fais ce que tu veux des informations et si ça te plait pas ce que fait Google (tant que Google n'atteint pas à ta vie privée, ce qui est interdit) il te reste le choix de ne pas l'utiliser, mais ce n'est pas de l'atteinte à la vie privée.

            C'est bien ce que je disais : il y en a qui s'amusent à mettre ça à toutes les sauces comme ça les arrangent pour mieux faire passer en "positif" leur paranoïa.

            • [^] # Re: J'ai rien compris...

              Posté par . Évalué à 5.

              J'ai une révélation à te faire : Les mots et les concepts ne sont pas définis par la loi. Ce qu'il faut légalement respecter l'est, et si tu te concentres uniquement sur ce point, tu as raison, mais je ne pense pas que l'auteur du journal ou du commentaire auquel tu réponds fasse référence à la loi. (pour faire une analogie, je ne suis pas sûr que la science fiction soit définie par la loi, pourtant c'est bien un genre qui existe)

              On peut penser que même si ce que google fait est légal (et avec quelle loi ? Française, états-uniennes, autre ?) ça porte atteinte à la vie privée de ses utilisateurs. Je te rejoins par contre sur le «si ça ne te plait pas, fais un autre choix», du coup l'utilisateur informé a deux choix, continuer d'être un utilisateur, ou arrêter de s'en servir (ou éventuellement essayer, par une astuce quelconque, d'éviter d'être tracé). Par contre, l'utilisateur non informé ne fait pas volontairement le choix d'être ainsi tracé. Mais c'est le genre de problèmes qu'il est difficile de résoudre, les gens ne pouvant pas être expert en tout. Mais c'est aussi pour ça qu'il existe des lois même sur des sujets éventuellement obscur pour une grande part de la population. Si certaines personnes trouvent ce genre de pratique dérangeante, il est tout à fait normal pour elles de provoquer un débat, avec éventuellement comme but de l'interdire par la loi, ou au moins d'en informer le plus grand nombre.

              Je pense qu'il est légitime de dire que les sites qu'on visite, ou au moins une partie d'entre-eux, «vie privée». Par exemple, la liste des sites d'amis, comme la liste des amis chez qui je me suis rendu au cours du dernier mois fait partie de ma vie privée.

              Tous les nombres premiers sont impairs, sauf un. Tous les nombres premiers sont impairs, sauf deux.

            • [^] # Re: J'ai rien compris...

              Posté par . Évalué à 1.

              Figure-toi que non. Les loi sur les atteintes à la vie privée ne changent pas suivant qui est "atteint"

              Figure toi que non, en l'occurrence la loi édicte que "Chacun a droit au respect de sa vie privée", sans jamais définir le sens de "vie privé", cela reste à l'interpretation des juges.

    • [^] # Re: J'ai rien compris...

      Posté par (page perso) . Évalué à 3.

      Ça n'a pas toujours été le cas. Un moment (au début?) les liens étaient direct. Puis à un moment il y a eu de manière aléatoire des liens de redirection passant par Google. Puis ensuite des liens directs, qui étaient remplacés par des liens vers Google sur les évènements javascript "onclick" (ce qui permet au navigateur de gérer les liens déjà visiter comme d'hab).
      Il y a eu peut-être d'autres étapes.

      • [^] # Re: J'ai rien compris...

        Posté par (page perso) . Évalué à 0.

        Wai, enfin ca plus de 10 ans que Google sait sur quel lien tu as cliqué, et ils ne s'en cache pas sinon la base de leur moteur de recherche serait une coquille vide... (vu que l'algo de classement de site se base sur le fait qu'un site est beaucoup visité).

        • [^] # Re: J'ai rien compris...

          Posté par (page perso) . Évalué à 3.

          (vu que l'algo de classement de site se base sur le fait qu'un site est beaucoup visité)

          Euh, à la base c'était sur le nombre de liens rentrants vers un site donné (impact positif) et le nombre de liens sortant (impact négatif).

          • [^] # Re: J'ai rien compris...

            Posté par . Évalué à 2.

            oui mais depuis on a inventé le google bombing, et un tas d'autre astuces pour contourner l'algorithme de base.

            En se basant sur la corrélation terme recherché / lien cliqué, tu peux avoir une information supplémentaire, et tu utilises l'esprit humain ainsi qu'un grand nombre de ce dernier pour évaluer la pertinence d'un site selon les critères recherchés.

            Il ne faut pas décorner les boeufs avant d'avoir semé le vent

    • [^] # Re: J'ai rien compris...

      Posté par (page perso) . Évalué à 6.

      Google utilise un certain nombre de signaux en retour (feedback) de la présentation des résultats de recherche. Ces signaux incluent bien entendu le lien cliqué, mais aussi l'adresse IP, la localisation, les headers du navigateur, et probablement quelques autres indicateurs.

      Ces informations permettent de préciser l'ordonnement des résultats pour chaque population d'utilisateur. Ainsi l'ordre pourra varier en fonction de l'utilisation d'un navigateur sous Linux ou sous un autre système. Exemple, sous Linux, il se peut que la requête 'python' rapporte plutôt des résultats relatifs au langage de programmation.

      Maintenant, de nombreux utilisateurs de Gmail, et autres services Google, sont en en fait 'loggés', même sans en être conscients, lors de leur utilisation de Google Search. Et dans ce cas, les indicateurs de retour (feedback) sont liés au profil de l'utilisateur. Si on y ajoute que les utilisateurs d'Android (sans CyanogenMod) sont aussi loggés sur leur compte Google, ceux-ci voient leur numéro de téléphone, voire leurs données personnelles, liées à leurs recherches.

      A noter enfin, que ce lien entre recherches et identité est bien évidemment immédiat sur les téléphones portables, notamment ceux sous Android.

  • # copier le lien devient infernal

    Posté par . Évalué à 6.

    Personnellement j'ai découvert cela en faisant un clic-droit "copier le lien" sur une des réponse pour récupérer une partie du lien qui pointait sur un fichier à télécharger (dépot svn)... et ben ça devient épique maintenant.

  • # mouais

    Posté par . Évalué à 7.

    Comment fait google pour savoir si un lien est pertinent pour la recherche ou non ? Sa façon la plus efficace est quand même de savoir sur quoi l'utilisateur à cliqué. Ça lui permet de faire remonter les sites qui sont visité et descendre ceux qui ne le sont pas.

    Il ne faut pas décorner les boeufs avant d'avoir semé le vent

    • [^] # Re: mouais

      Posté par (page perso) . Évalué à 5.

      Bon j'ai fait un petit test. J'ai cherché linuxfr.org (sur google.fr) et regardé ce qu'il y avait comme paramètre à onmousedown en passant par une connexion normal et par un proxy. Bon j'ai exactement la même chose :
      this,'','','','1','AFQjCNGGkLSKgLEpf0S2sA3jtgE5DZH1Dg','','0CB0QFjAA'

      Alors soit il est super fort et arrive à découvrir qui se cache derrière un proxy. Soit c'est juste pour savoir « quand on cherche linuxfr.org le gars clique sur tel lien ». Soit je me suis planté. Si qqn peut regarder ce qu'il a à onmousedown sur le premier lien : http://www.google.fr/search?q=linuxfr.org (en étant déloggé de google).

      • [^] # Re: mouais

        Posté par (page perso) . Évalué à 2.

        J'ai aussi:

        <a href="http://linuxfr.org/" class="l" onmousedown="return rwt(this,'','','','1','AFQjCNGGkLSKgLEpf0S2sA3jtgE5DZH1Dg','','0CB0QFjAA')">Accueil - <em>LinuxFr</em>.<em>org</em></a>
        
        

        « Rappelez-vous toujours que si la Gestapo avait les moyens de vous faire parler, les politiciens ont, eux, les moyens de vous faire taire. » Coluche

      • [^] # Re: mouais

        Posté par (page perso) . Évalué à 3.

        this,'','','','1','AFQjCNGGkLSKgLEpf0S2sA3jtgE5DZH1Dg','RJkYgNCC...bY21FmJOMQ','0CB0QFjAA'

      • [^] # Re: mouais

        Posté par . Évalué à 2.

        J'ai la meme chose
        this,'','','','1','AFQjCNGGkLSKgLEpf0S2sA3jtgE5DZH1Dg','','0CB0QFjAA'
        C'est pas avec ca qu'ils associent un utilisateur a un clic

        • [^] # Re: mouais

          Posté par . Évalué à 10.

          Ouai en fait vous êtes un multi sur linuxfr.

          Tous les contenus que j'écris ici sont sous licence CC0 (j'abandonne autant que possible mes droits d'auteur sur mes écrits)

        • [^] # Re: mouais

          Posté par . Évalué à 0.

          Je suppose que c'est plus le couple URL + contenu du/des cookie(s) qui leur sert à ça ...

    • [^] # Re: mouais

      Posté par . Évalué à 1.

      Comment fait google pour savoir si un lien est pertinent pour la recherche ou non ? Sa façon la plus efficace est quand même de savoir sur quoi l'utilisateur à cliqué. Ça lui permet de faire remonter les sites qui sont visité et descendre ceux qui ne le sont pas.

      N'est ce pas un problème de poule et d’œuf ? Les liens en première page de résultats seront les plus cliqués, parce que les utilisateurs font confiance au tri. S'il suffit d'être cliqué pour devenir plus pertinent, alors les résultats ne changeront jamais.

      • [^] # Re: mouais

        Posté par (page perso) . Évalué à 1.

        Il existe des algorithmes spécialisés pour traiter ce problème, aussi connu sous le nom de "click position bias", ou biais de position / clic. L'idée générale est simple, il s'agit d'accorder du poids proportionnel à la position des résultats cliqués. En théorie et en implémentation c'est un peu plus compliqué. Enfin, la tendance est à une automatisation de l'ordonnement des résultats, par des algorithmes d'apprentissage automatique qui utilisent un nombre de signaux plus large que la simple position.

  • # danger firefox

    Posté par (page perso) . Évalué à 10.

    Je viens de faire une recherche, lorsque la souris passe sur un lien des résultats Google, Firefox affiche l'URL finale mais si on fais copier le lien, alors Firefox affiche le lien passant par Google (à vrai dire j'utilise Iceweasel... j'ai pas fait le test sous l'original Firefox).

    Cela signifie que Firefox n'affiche pas en bas à droite le vrai lien mais un truc dont on ne peux pas avoir confiance... C'est pas bon ça pour le phishing car si Google le fait, d'autres peuvent aussi le faire. j'utilisais cette fonctionnalité pour toujours vérifier les liens un peu louche.

    Ca va pas améliorer le web cela.

    • [^] # Re: danger firefox

      Posté par (page perso) . Évalué à 4.

      Ça fait des années que Google fait ça, il remplace le lien, via javascript, au moment où tu clique dessus (malheureusement, il ne distingue pas le clique gauche du droit). D'ailleurs, si tu survole le lien après avoir cliquer droit dessus, tu verra que le lien affiché par Firefox est le même.

      « Rappelez-vous toujours que si la Gestapo avait les moyens de vous faire parler, les politiciens ont, eux, les moyens de vous faire taire. » Coluche

      • [^] # Re: danger firefox

        Posté par (page perso) . Évalué à 10.

        Je n'avais jamais fait attention, mais c'est quand même inquiétant : en gros, le lien affiché n'est pas garanti être le lien cible réel?

        Et aucun navigateur n'a eu l'idée ou pu mettre en oeuvre une parade? Car c'est quand même une question de sécurité que de savoir où on va...

        • [^] # Re: danger firefox

          Posté par (page perso) . Évalué à 3.

          Ça fait des années que la technique est connue et ça n'a jamais poser de problème. Mais si on ne peut plus faire des adresses dynamiques via javascript, ça va vite devenir chiant, rien que sur Google par exemple mais sur d'autres sites aussi.

          « Rappelez-vous toujours que si la Gestapo avait les moyens de vous faire parler, les politiciens ont, eux, les moyens de vous faire taire. » Coluche

        • [^] # Re: danger firefox

          Posté par . Évalué à 4.

          Je n'avais jamais fait attention, mais c'est quand même inquiétant : en gros, le lien affiché n'est pas garanti être le lien cible réel?

          Et aucun navigateur n'a eu l'idée ou pu mettre en oeuvre une parade? Car c'est quand même une question de sécurité que de savoir où on va...

          Quand les moules découvrent qu'il n'y a rien de plus dangereux que le JavaScript :) … NoScript* !!

           

           

          * Pour un web plus sur™

          Knowing the syntax of Java does not make someone a software engineer.

    • [^] # Re: danger firefox

      Posté par . Évalué à 2.

      "Le web, c'est l'avenir !"

      Quel avenir de merde...

    • [^] # Re: danger firefox

      Posté par (page perso) . Évalué à 2.

      Pourquoi danger "firefox" ? Ça le fait dans tout les navigateurs. Vérifiez avant d'accuser.

      • [^] # Re: danger firefox

        Posté par (page perso) . Évalué à 5.

        C'est pas incompatible ;-)

        Je remonte un sentiment sur un forum. Je ne suis pas là pour faire tous les test sur tous les navigateurs sur toutes les plateformes...

        Déjà, je précise que j'ai fais en vrai les tests sous iceweasel...

        Tant mieux si d'autres font le même test ailleurs et le disent. C'est le but du débat.

        A priori, ca fait cela depuis des années et je ne le découvre que maintenant et je ne suis pas le seul. Objectif du post atteint ;-)

  • # Ce ne serait pas les bots plutôt?

    Posté par (page perso) . Évalué à 6.

    Il fait des recherche sur plusieurs moteurs (google, bing, yahoo, duckduckgo, …)

    Ça ne fait pas énorme comme choix de moteur, Duckduckgo utilise l'api offerte par Yahoo! et ce dernier utilise Bing.

    Mais Google a récemment (depuis 2–3 jours) mis en place une parade contre ceux qui désactivent le JavaScript.

    C'est pour lutter contre les personnes qui désactivent JavaScript ou contre les bots (comme Seeks) qui ne l'implémente et qui doivent être bien plus nombreux que les gens qui désactivent JavaScript?

    « Rappelez-vous toujours que si la Gestapo avait les moyens de vous faire parler, les politiciens ont, eux, les moyens de vous faire taire. » Coluche

    • [^] # Re: Ce ne serait pas les bots plutôt?

      Posté par (page perso) . Évalué à 0.

      Ça ne fait pas énorme comme choix de moteur, Duckduckgo utilise l'api offerte par Yahoo! et ce dernier utilise Bing.

      Et Bing utilise (a l'occasion) Google...
      https://linuxfr.org/users/albert_/journaux/eux-honnete-non

      Excusez l'absence d'accents dans mes commentaires, j'habite en Allemagne et n'ai pas de clavier francais sous la main.

    • [^] # Re: Ce ne serait pas les bots plutôt?

      Posté par . Évalué à 2.

      ou contre les bots (comme Seeks) qui ne l'implémente et qui doivent être bien plus nombreux que les gens qui désactivent JavaScript

      Apparemment ça ne le fait pas sur Seeks: les URL finales des résultats venant de Google ne repointent pas vers Google…

      (Voir la recherche Seeks sur linuxfr indiquée plus haut, à noter qu'après avoir cliqué sur le 3ème lien, celui-ci est passé en haut [j'adoooore les nodes Seeks publiques ^^]).

  • # addon firefox

    Posté par . Évalué à 3.

    un petit addon qui n'était pas prévu pour ça mais qui peut être utile dans ton cas, c'est text link, un double clic sur une URL non cliquable t'envoie sur la page.
    Pour google, ça peut être les liens en vert sous le lien google

  • # après la société qui l'édite

    Posté par (page perso) . Évalué à 2.

    Pourquoi, à propos de duckduckgo, les liens "après la société qui l'édite" pointent-ils vers http://donttrack.us/ ?
    "Don't Track Us" est une campagne de DuckDuckGo Inc (ou plus simplement Gabriel Weinberg), comme Don't Bubble Us.

  • # Plugin Firefox

    Posté par . Évalué à 0.

    Il y a le plugin Customize Google (http://www.customizegoogle.com/) pour Firefox qui permet de remettre les liens direct dans les résultats des recherches google (et bien d'autre chose). Malheureusement, il n'est plus maintenu et n'est pas compatible avec les dernières versions de Firefox (je n'ai pas testé en modifiant les numéros de version dans le fichier install.rdf).

    • [^] # Re: Plugin Firefox

      Posté par . Évalué à 2.

      Il y a http://www.optimizegoogle.com qui remplace Customizegoogle (bbbasé dessus) et qui entre autre empêche donc le suivi des clics.
      Ta remarque m'a fait comprendre pourquoi je n'arrivais pas à reproduire les tests cités plus haut sur ce tracking chez moi, j'ai oublié que j'utilisais cette excellente extension

      http://www.optimizegoogle.com/about/

      What is OptimizeGoogle?

      OptimizeGoogle is based on the abandoned Firefox add-on called CustomizeGoogle.
      
      

      What are the features?

      [...]
      Remove click tracking
      [...]
      
      
      • [^] # Re: Plugin Firefox

        Posté par (page perso) . Évalué à 2.

        Non disponible pour firefox 7.0.1

        • [^] # Re: Plugin Firefox

          Posté par . Évalué à 1.

          Ah ...

          Comme j'utilise le canal beta de firefox (v8.0) et cette extension de mozilla https://addons.mozilla.org/fr/firefox/addon/add-on-compatibility-reporter, je ne m'en suis pas rendu compte, l'extension fonctionne sans problème.

          Dommage, les dernières à jour sont récentes en plus, ce doit plus être un problème de mauvaises valeurs (des versions de firefox compatibles) dans l'extension qu'une réelle incompatibilité...

          • [^] # Re: Plugin Firefox

            Posté par (page perso) . Évalué à 8.

            Merci à la nouvelle politique de version de firefox.

            • [^] # Re: Plugin Firefox

              Posté par (page perso) . Évalué à 2.

              Il ne faut pas non plus tout lié à la nouvelle politique de Firefox. Déjà avant il y a avait des extensions qui avaient une ou plusieurs versions de retard.

              « Rappelez-vous toujours que si la Gestapo avait les moyens de vous faire parler, les politiciens ont, eux, les moyens de vous faire taire. » Coluche

              • [^] # Re: Plugin Firefox

                Posté par . Évalué à 3.

                Alors que maintenant, elles n'auront plus que trois ou quatre versions de retard. C'est sûr, c'est pas pire.

                Article Quarante-Deux : Toute personne dépassant un kilomètre de haut doit quitter le Tribunal. -- Le Roi de Cœur

  • # Cadobonux

    Posté par (page perso) . Évalué à 4.

    En plus de la page blanche, quand on n'a pas Javascript (NoScript, dans mon cas) ça pète les liens vers Wikipedia.

    Par exemple quand je cherche « l'oreal » (j'ai pas fait exprès, j'ai pris au pif dans les suggestions à partir de « l' ») et quand je clique sur le résultat qui pointe vers la page Wikipedia, j'arrive sur wikipedia.org/L ; supaÿr.

    • [^] # Re: Cadobonux

      Posté par (page perso) . Évalué à 6.

      Hmpf je voulais évidemment dire « ça pète les liens avec une apostrophe », pas grand chose à voir avec Wikipedia -_-

      Bon, j'vais installer Seeks moi, hein...

  • # NoScript

    Posté par (page perso) . Évalué à 6.

    J'ai jamais rien trouvé de plus évolué dans comme greffon, dans la capacité de de pourrir "l'expérience utilisateur" de la navigation Web, et de te foutre le cafard avec une interface anti-ergonomique, intrusive et triste au possible. En plus, ça garde en local la trace de tous les sites pr0n/W4r3z/wh4t3v3r que tu as autorisé.

    • [^] # Re: NoScript

      Posté par . Évalué à 2.

      heu tu les autorises temporairement ou tu autorise tout globalement. Comme ça pas de trace

      Il ne faut pas décorner les boeufs avant d'avoir semé le vent

  • # Ixquick ?

    Posté par . Évalué à 2.

    Bonjour,

    Il y a quelques temps j'étais tombé sur ce méta-moteur de recherche : Ixquick qui met en avant la confidentialité des recherches.

    Je n'ai pas encore pris le temps de tester. Mais certains d'entre vous seront peut-être intéressés.

    Sur cette page sont expliqués les avantages de l'utilisation d'Ixquick.

    • [^] # Re: Ixquick ?

      Posté par (page perso) . Évalué à 3.

      Autant faire la même chose en libre avec Seeks. Je ne vois aucune bonne raison de se baser sur une croyance de confidentialité basé sur du code propriétaire.

      • [^] # Re: Ixquick ?

        Posté par . Évalué à 0.

        J'en vois au moins une :

        Je connais des personnes qui, bien qu'étant intéressées par la confidentialité de leurs recherches, n'ont pas linux (personne n'est parfait).

        Mais je suis d'accord sur le fait que plus loin on pousse le concept de confidentialité, et plus on arrive à des alternatives de type Seeks.

        Mais j'estime que l'on peut simplement être agacé par la "filature" de Google et ses amis, et vouloir trouver un moteur de recherche normal accessible depuis n'importe où (ben oui on est pas forcément chez soi, ou avec son portable).

        • [^] # Re: Ixquick ?

          Posté par . Évalué à 0.

          Au temps pour moi, ne connaissant pas bien Seeks, je pensais qu'il fallait être soi même un "peer" pour l'utiliser.

  • # Le truc exaspérant sur Google

    Posté par . Évalué à 6.

    Chez Google, tu n'es pas ma petite amie, donc laisse moi d'abord FINIR ma p*t*n de phrase avant de répondre et me suggérer d'autres questions…

    Article Quarante-Deux : Toute personne dépassant un kilomètre de haut doit quitter le Tribunal. -- Le Roi de Cœur

Suivre le flux des commentaires

Note : les commentaires appartiennent à ceux qui les ont postés. Nous n'en sommes pas responsables.