Journal Google Stop

Posté par  (site web personnel) . Licence CC By‑SA.
Étiquettes : aucune
21
26
fév.
2016

Bonsoir Nal<

Je ne vais pas te faire un discours grandiloquent sur l'exploitation des meta-données, le profilage, la revente, et les dérives potentielles. Je ne te ferais pas non plus un long journal, en fait. Je vais juste te dire pourquoi factuellement Google m'énerve : son profilage est trop bas de gamme. Ce n'est pas le profilage lui même, mais sa qualité…et au final son résultat.

Tout a commencé avec Youtube.
Je n'ai pas 16 ans, et la musique que j'aime est aujourd'hui bien fixée : le classique tendance math, un peu de rock de temps à autre, et le reggae. En fait classique et reggae sont les deux seules musiques que j'aime n'importe où et n'importe quant. Mais j'aime encore découvrir, et d'ailleurs j'apprécie FIP, par exemple. Youtube propose des écoutes : et bien souvent ça tourne en boucle : même style. Bon c'est pas grave puisque le profilage culturel est complexe. Ce n'est pas parceque l'on requête X que l'on va avoir envie d'écouter : avoir systématiquement "rapport avec x" dans les suggestions parceque l'on a écouté une fois quelque chose met la puce à l'oreille, mais tout le monde comprends que faire mieux est compliqué.

Cela a continué avec la presse.
Je dévore la presse depuis longtemps, de toute sorte et de toutes les tendances. Et souvent, si je requête une question sur Google sur un sujet, ce n'est pas parceque je m'intéresse particulièrement au sujet, ou encore m'interresse à un angle d'analyse particulier, mais bien simplement que je souhaite compléter des informations acquises par ailleurs. Non je ne suis pas un nazbol parceque je consulte régulièrement un site tendance rouge-brun, et à l'identique je ne suis pas de droite parceque je lis régulièrement Le Figaro. Peu importe qui je suis et ce que je pense, mais simplement là encore Google me place dans des cases uniquement en fonction de ce qu'il sait de mon surf, sans être capable de faire des recoupements.

Cela a débordé à Google+.
Là c'est le pompon : G+ me propose en "recommendations personnalisés" des articles du FN (voir de complotistes). Et là j'hallucine complet. Mais en fait il s'agit du même problème.

Google est incapable d'aller plus loin que des stats horizontales. Tu le vois cher Nal<, ce qui me dérange ce n'est pas que Google me "profile", mais qu'il se trompe totalement sur le profil. La complexité culturelle de l'être humain n'est pas pour le moment modélisable sans une bonne connaissance dudit être, personnel. Et Google échoue dans sa tâche. Tout va bien lorsqu'il s'agit de me vendre une perceuse parceque je suis aller visiter 10 sites sur les perceuses, ça colle. Mais ça par en sucette lorsque la même formule est appliqué à ce qui relève de la sphère culturelle, des opinions, et des relations.

Google, s'il te plait, envoie moi un questionnaire sur mes tendances, mes opinions, mes préférences, les fréquences d'usages, les intérêts politiques et culturels. Je préfère que tu ai de bonnes informations plutôt que tu continues d'appliquer ton algo bête comme tes pieds, qui suffit au commerce mais est si faible avec le culturel.

Merci.
l'impact concret d'un mauvais profilage est …

  • # Mais non...

    Posté par  . Évalué à 10.

    Rassure-toi, le profilage de Google fonctionne bien. Pour le commun des mortels.

    Il n'a pas l'habitude des gens qui réfléchissent. C'est notamment précisément la raison pour laquelle il persiste à vouloir nous corriger, nous qui savons pertinemment et mieux que lui ce que nous cherchons.

    C'est surtout ça, que tu as démontré.

  • # Au moins, on ne te tire pas dessus.

    Posté par  (site web personnel) . Évalué à 10.

    Tiens, un article sur un autre problème de qualité des profilages :
    http://arstechnica.co.uk/security/2016/02/the-nsas-skynet-program-may-be-killing-thousands-of-innocent-people/

    (via Standblog)

    • [^] # Re: Au moins, on ne te tire pas dessus.

      Posté par  . Évalué à 10.

      Whooo, ça fait froid dans le dos…

      Ça me rappelle les propos de concitoyens (y compris de la famille proche) à propos de l'état d'urgence : « on s'en fiche que des bavures soient faites, pourvu qu'on attrape les terroristes avant leur prochain attentat; si c'est le prix à payer, pas de problème ». Je vais garder le lien bien au chaud, si d'autres discussions se profilent.

      Le gros soucis du Big Data, c'est la confiance aveugle donnée à la machine, et la déresponsabilisation : il n'y a plus personne qui prend la décision (qui implique une certaine éthique), la machine a dit, il faut le faire. Voilà ce qui arrive lorsqu'on écarte la justice des procédure de condamnations. Il ne manquerait plus que les drones soient autonomes… :'(

  • # Commerçons

    Posté par  . Évalué à 8.

    suffit au commerce mais est si faible avec le culturel.

    En même temps, bon… le culturel ne les intéresse que marginalement, s'il leur permet d'atteindre le but premier : faire du commerce.

  • # Profilage gĂ©nĂ©rique/gĂ©nĂ©ral

    Posté par  . Évalué à 5.

    Le soucis est que l'on ne sait absolument pas comment Google tente de nous profiler. Tu pars du principe qu'il te fait un profilage unique et personnalisé alors que ce n'est peut être absolument pas le cas. D'après ta description il fait seulement quelques profiles générique ou il catalogue les utilisateurs qui lui passe sous la dent.

    Une image pour accompagner l'idée :
    http://www.commitstrip.com/fr/2016/02/23/just-trust-the-ai/

    Finalement le mieux c'est peut être de ne pas se soucier de ce qu'il te propose et découvrir par toi même/bouche à oreille. Se passer de Google c'est possible :þ

    • [^] # Re: Profilage gĂ©nĂ©rique/gĂ©nĂ©ral

      Posté par  (site web personnel) . Évalué à 6.

      Il faut voir aussi que dans le cas de youtube, c'est parfois pas tant du profilage que de la pur recommendation commercial payé.

      Exemple, chaque fois que j'écoute "passenger, let her go", ça bascule toujours sur la même exact chanson après. Chanson que je coupe toujours au bout de 5 secondes pour mettre autre chose, car l'ambiance est pas la même ni rien. Donc je commence à avoir des doutes. Soit Google propose de passer 2 chansons l'une après l'autre. Soit les maisons de disques se sont arrangés pour trafiquer ça. Soit bien sur, il y a rien, mais bon…

  • # RĂ Z

    Posté par  . Évalué à 3.

    Personnellement le seul service google que j'utilise "connecté" c'est Youtube (j'ai un vieux compte qui date d'avant le rachat par google), et quand les suggestions finissent par délirer je vide l'historique des vidéos vues et des recherches.

    C'est un peu dommage de perdre son historique tous les 6 mois, mais pour l'instant ça suffit à permettre aux suggestions de repartir sur des bases saines = mes vidéos favorites.

    Par-contre J'ignore si Google+ propose les mĂŞmes options.

    • [^] # Re: RĂ Z

      Posté par  . Évalué à 10.

      J'ai souvent ce problème. Il m'arrive de m'égarer sur Youtube et de regarder une vidéo "ultra-populaire" mais très souvent très pauvre en contenu. Le genre de vidéos qu'on trouve dans l'onglet "Tendances". A l'heure où j'écris, le top 2 est Booba et Squeezie.

      Youtube se met donc à penser que tout d'un coup, j'aime ce genre de vidéos, et il va me proposer tout un tas de vidéos de Booba, alors que je voulais tout simplement vérifier si je n'aimais si je n'aimais toujours pas ça !

      Avec ton commentaire, je viens de voir qu'il est possible de supprimer tout l'historique d'un seul coup. Je vais peut-être utiliser cette méthode-là. Néanmoins, on ne peut pas savoir si Google garde toujours cet historique sous la main, et que ton historique effacé puisse être utilisé, plus discrètement pour te proposer des suggestions.

  • # Musique et youtube

    Posté par  (site web personnel) . Évalué à 2.

    Peut-être que les algos de recommandation de Google marchent moins bien sur Youtube que sur leur service dédié à la musique, car moins de méta-données spécifiques, utilisation d'algo plus génériques, etc.

    • [^] # Re: Musique et youtube

      Posté par  . Évalué à 1.

      Ca semble être le cas. Peut-être, comme tu le soulignes, parce que c'est un service générique (pas spécialisé dans la musique). Et pour leur service dédié, peut-être aussi pour concurrencer l'algo de Spotify.

      Perso, pour l'utilisation de la musique sur youtube, j'utilise le plus souvent mpsyt, il y a une recherche d'album assez top, et la possibilité d'établir des playlists.

  • # Faux problème ?

    Posté par  . Évalué à -8.

    J'utilise Google comme moteur de recherche au moins 20 fois par jour, sur 2 postes différents, dont l'un avec 2 sessions différentes (donc 3 sessions en tout). Je n'ai AUCUNE publicité en rapport avec mes recherches. Pourtant je fais comme toi des recherches à propos de tout un tas de trucs différents (perso, pro, curiosité, information, etc).

    Cela dit je n'ai pas de compte G+ auquel je suis connecté. J'ai juste un compte à usage pro auquel je me connecte une fois de temps en temps.

    Utiliser Youtube pour accéder à de la culture, le problème vient clairement de toi : ce n'est pas fait pour.
    C'est comme ceux qui regardent le journal télévisé pour s'informer : ce n'est pas fait pour.

    J'ai l'impression qu'il faut simplement que tu installes un bloqueur de publicités dans ton navigateur, et que tu utilises ton cerveau.

    • [^] # Re: Faux problème ?

      Posté par  . Évalué à 10.

      Utiliser Youtube pour accéder à de la culture, le problème vient clairement de toi : ce n'est pas fait pour.

      Euh lol, wut ?

      J'avais pas lu quelque chose d'aussi condescendant et ridicule depuis un bail.

      Youtube, c'est juste un site où n'importe qui peut y mettre des vidéos. Que ce soit "culturel" ou non n'a absolument RIEN à voir.

      Ce serait comme dire que parce que n'importe qui peut décider de filmer à l'aide d'une caméra, le cinéma n'est pas fait pour la culture.

      Sur youtube, j'ai appris énormément de choses : sur des anciens ordinateurs, sur des moteurs 3D, sur des techniques de programmation, sur des culture, le cinéma, la littérature, …

      Si tu trouves que YT ce n'est pas enrichissant, c'est que tu ne regardes pas au bon endroit.

      Quelques exemples :
      https://www.youtube.com/user/Vsauce -> une chaîne sur la science
      https://www.youtube.com/channel/UCwbV8cTR4yBgFdfa_BXV2OA -> une chaîne sur le cinéma, ses conventions, …
      https://www.youtube.com/channel/UC4zKSynEH_sLA1TC8_kU0gQ -> une autre chaîne sur le cinéma, le tournage des films, la post-prod, etc…
      https://www.youtube.com/user/XboxAhoy/videos -> une chaîne sur les jeux vidéos et sur leur histoire. La série "Nuclear Fruit" (ou autrement dit, les retombées de la seconde guerre mondiale) est particulièrement enrichissante.
      https://www.youtube.com/channel/UCLx053rWZxCiYWsBETgdKrQ -> une chaine sur les anciens jeux vidéos, le matériel et entreprises associées. La série "LGR - Tech Tales" est particulièrement bien sourcée et riche d'enseignements.

      Evidement c'est une liste extrêmement limitée, car tirée de mes intérêts et écrite en peu de temps.

      Mais sur YT, si on cherche, en général on trouve.

      Toi t'as vu des vidéos de chats, et t'as décidé que tout le site ne contenait que ça… Désolé de t'ouvrir les yeux.

      "Quand certains râlent contre systemd, d'autres s'attaquent aux vrais problèmes." (merci Sinma !)

      • [^] # Re: Faux problème ?

        Posté par  (site web personnel) . Évalué à -10.

        belle défense de youtube :-)

        comme quoi le syndrĂ´me de Stockholm touche pas mal de monde :/

        promouvoir la culture française, via l'ina ne serait-il pas plus intéressant ? cf. https://linuxfr.org/users/baud/journaux/la-minute-de-monsieur-cyclopede

        • [^] # Re: Faux problème ?

          Posté par  . Évalué à 2.

          J'ignorais que l'ina hébergeait (hébergeât ?), comme youtube, les video de tout un chacun. Je vais me renseigner.

          Sinon, je compatis avec l'auteur du journal, moi je reçois même des mails de librairies d'extrême droite, et sur mon adresse pro en plus, alors que ce n'est pas précisément mon kif.

          La gent féminine, pas la "gente", pas de "e" ! La gent féminine ! Et ça se prononce comme "gens". Pas "jante".

        • [^] # Re: Faux problème ?

          Posté par  . Évalué à 4.

          C'est sur qu'il risque pas de poster grand chose sur youtube lui.
          Apres si la culture francaise s'est arretee il ya 30 ans selo toi, c'est un peu triste non?

          Linuxfr, le portail francais du logiciel libre et du neo nazisme.

      • [^] # Re: Faux problème ?

        Posté par  . Évalué à 6.

        Ya quand-même deux côtés avec Youtube, là, et j'ai l'impression que vous ne parlez pas du même. D'un côté, la plateforme d'hébergement de vidéo, ce qui est relativement neutre. Et de l'autre côté l'algorithme de suggestions, qui l'est beaucoup moins.

        En tant que simple plateforme d'hébergement, on peut en effet y trouver du bon contenu culturel (avec pas mal de merdes autour, il faut admettre).
        Mais en tant que prescripteur et bon donneur de conseil, il ne faut en effet rien en attendre, au contraire. Du moins est-ce que je comprends des commentaires des uns et des autres (moi je n'en sais rien, je n'utilise ni compte Google ni cookies, du coup je ne vois pas ce qu'ils peuvent me servir de pertinent, mĂŞme en le voulant).

        • [^] # Re: Faux problème ?

          Posté par  . Évalué à 1.

          je n'utilise ni compte Google ni cookies, du coup je ne vois pas ce qu'ils peuvent me servir de pertinent, mĂŞme en le voulant

          Malheureusement ça ne suffit pas.

          Am I unique?

          seulement 2 navigateurs parmi les 146087 observés (0.00 %) ont exactement la même empreinte que celle de votre navigateur.

          • [^] # Re: Faux problème ?

            Posté par  . Évalué à 2. Dernière modification le 28 février 2016 à 09:50.

            J'utilise aussi Random Agent Spoofer. ;)

    • [^] # Re: Faux problème ?

      Posté par  . Évalué à 2.

      Je n'ai AUCUNE publicité en rapport avec mes recherches.

      Si tu as coché la case de ne pas te proposer de pubs personnalisées c'est assez normal ;)

      En fouillant dans les options des différents services y'a pleins d'option du genre qui permettent de désactiver les historiques, l'envoi d'informations vers les serveurs ou les recos personnalisées. Bon bien sur faut pas espérer avoir goolge now ou autres en décochant tout.

  • # plusieurs possibilitĂ©s

    Posté par  . Évalué à 3.

    Là c'est le pompon : G+ me propose en "recommendations personnalisés" des articles du FN (voir de complotistes). Et là j'hallucine complet. Mais en fait il s'agit du même problème.

    Non je ne suis pas un nazbol parceque je consulte régulièrement un site tendance rouge-brun, et à l'identique je ne suis pas de droite parceque je lis régulièrement Le Figaro.

    plusieurs reponses possibles :

    • soit google est dans le vrai, et on a de bonnes raisons de s'inquieter du profilage de Google qui arrive Ă  identifier qui nous sommes
    • soit google a tort, auquel cas, tant qu'il sera dans le faux, on ne risque rien sur ses capacitĂ©s Ă  nous profiler
  • # Vision "corporations are evil" ?

    Posté par  . Évalué à 3. Dernière modification le 29 février 2016 à 16:02.

    C'est mon avis, et je vais me faire lyncher, mais je suis au contraire content quand les résultats de recherche sont ciblés. Quand je tapes une recherche qui contiens "python", je suis heureux de ne pas me retrouver avec une liste de sites qui parle de reptiles. Et même s'il est vrai que Google n'est pas encore parfait, qu'il me force parfois à affiner ma recherche, il s'améliore de jour en jour et me fourni la plupart du temps des liens pertinents dans les premiers résultats de ma recherche, et même dès les premières lettres tapées (avec les suggestions).

    Cela me permet de trouver ce que je recherche, rapidement et avec le moins de touche de clavier pressées. Exactement ce que je souhaites dans un moteur de recherche.

    Tout ce "profilage" que vous haïssez tant, je lis ça comme une avancée énorme dans la recherche sur les intelligences artificielles, la sémantique… Aujourd'hui j'ai un accès plus fluide aux connaissances et je m'en réjouis ! Je n'imagine pas retourner en arrière et faire des recherches laborieuses comme on le faisait seulement il y a 5-10 ans.

    Rendez-vous compte, sans tout cela des outils magnifiques n'existeraient pas, tels que Wolfram Alpha, qui est un trésor magnifique et surprends par sa lecture quasi humaine des questions, Watson qui est vraiment bluffant, mais aussi la traduction instantanée que l'on croyais cantonnée à H2G2 et son Babelfish, qui est maintenant une quasi réalitée, Siri/Google Now/Cortana, etc…

    Certes tout cela est financé par la publicité, mais je suis persuadé que la plupart des chercheurs dans ces domaines ne pourraient pas obtenir les financements de cet ordre par des voies publiques.

    • [^] # Re: Vision "corporations are evil" ?

      Posté par  (site web personnel) . Évalué à 7.

      La question n'est pas « est-ce pratique d'avoir des propositions d'infos ciblées » mais plutôt : il paraît évident que ça peut être pratique, et que ça l'est très souvent. La question plus pertinente me semble être « est-il possible d'avoir facilement des infos non ciblées ? » (pour éviter une version déformée de la réalité, pour éviter que ne me soit présenté que des avis identiques au mien par exemple)

      Autre exemple : l'édition "Google News édition France" qui m'est présentée (sans compte Google) contient des infos que je trouve intéressantes. Il s'avère que les éditions "Belgique", "Canada francophone" et "Suisse" contiennent non seulement des infos intéressantes, mais aussi des infos intéressantes différentes. Le fait de désactiver le ciblage "pays par défaut" m'est donc utile. (Et encore je n'ai pas de contrôle sur l'algo qui décide de ce qui est pertinent ou pas dans chaque pays/édition. Simple popularité ? Des médias privilégiés sur d'autres ? Etc.). On peut bien sûr faire la même remarque sur les éditions anglophones, ou dans n'importe quelle langue utilisée largement sur la planète.

      • [^] # Re: Vision "corporations are evil" ?

        Posté par  . Évalué à 3. Dernière modification le 29 février 2016 à 16:37.

        C'est là où je pense que l'on se fourvoie dans cette discussion : vous semblez penser que des résultats d'une recherche "non ciblés" existent en premier lieu.

        Ça n'existe juste pas, il y a toujours un filtre, un classement, même depuis les tout premiers moteurs de recherche. C'est d'ailleurs pour cela qu'on utilise un moteur de recherche ! Google a amené l’algorithme révolutionnaire "PageRank" qui a très vite fait sa renommée, mais les autres moteurs de l'époque (Altavista, Lycos…) utilisaient eux aussi leur propre algo.

        Je le répètes car je n'ai pas été très clair, je pense que votre grief envers les résultats que vous propose Google n'est pas que le moteur vous donne des résultats ciblés, mais qu'il vous retourne des résultats pas assez ciblés !

        Je m'explique : dans l'idéal le moteur de recherche devrait comprendre que tu souhaites avoir également des résultats des journaux belges, suisses et québecois, aujourd'hui il ne s'en rends juste pas compte. Même chose pour ton goût pour les médias "non mainstream", voire même ton goût de "sortir de mes résultats habituels pour découvrir d'autres horizons"… En gros pour l'instant l'algo n'est juste pas assez bon pour ton profil !

        Pour toi ce serait quoi une recherche non ciblée ?

        • [^] # Re: Vision "corporations are evil" ?

          Posté par  . Évalué à 3.

          moi je trouve très désagréable d'avoir des résultats différents juste parce que j’effectue ma recherche depuis un autre endroit physique.

          Et je trouve horrible ce ciblage qui fait qu'après avoir regardé une vidéos du bazar du grenier, il devient impossible de trouver la dernière vidéos documentaire Arte de "le dessous des cartes" juste parce que la chaîne du grenier a aussi des vidéos intitulé "dessous des cartes" (jeux vidéos).

          Donation Bitcoin : 1N8QGrhJGWdZNQNSspm3rSGjtXaXv9Ngat

          • [^] # Re: Vision "corporations are evil" ?

            Posté par  . Évalué à 2.

            La cerise sur le gâteau, c’est ceux qui mettent en lien une recherche sur Google…

            Ça n’était déjà pas vraiment viable avant le profilage, où une recherche donnait le même résultat pour tout le monde à un même instant, mais potentiellement un résultat différent quelques jours plus tard.

            « Le fascisme c’est la gangrène, à Santiago comme à Paris. » — Renaud, Hexagone

          • [^] # Startpage

            Posté par  . Évalué à 2.

            Et je trouve horrible ce ciblage qui fait qu'après avoir regardé une vidéos du bazar du grenier, il devient impossible de trouver la dernière vidéos documentaire Arte de "le dessous des cartes" juste parce que la chaîne du grenier a aussi des vidéos intitulé "dessous des cartes" (jeux vidéos).

            Cela dit, en utilisant Startpage (un proxy anonymisant sur Google), tu devrais Ă©chapper au ciblage.

            « Le fascisme c’est la gangrène, à Santiago comme à Paris. » — Renaud, Hexagone

            • [^] # Re: Startpage

              Posté par  . Évalué à 0.

              Cela dit, en utilisant Startpage (un proxy anonymisant sur Google), tu devrais Ă©chapper au ciblage.

              Je l'ai utilisé pendant un moment, les résultats ne sont pas terrible.
              Y a plus simple: CTRL+maj+delete = supprimer cookies et données hors connexion (et tout le reste :D, pas oublier les cookie silverlight et co). Ça ne supprime pas le ciblage IP, mais ça restart pas mal de trucs (youtube par exemple).

              Donation Bitcoin : 1N8QGrhJGWdZNQNSspm3rSGjtXaXv9Ngat

              • [^] # Re: Startpage

                Posté par  . Évalué à 2.

                PlutĂ´t que de bousiller toute ta session, un Ctrl+Maj+P fait la mĂŞme chose, en plus rapide.

              • [^] # Re: Startpage

                Posté par  . Évalué à 2.

                Je l'ai utilisé pendant un moment, les résultats ne sont pas terrible.

                Ben normalement, ce sont les mêmes que sur Google sans ciblage. Donc la popularité passe avant ta requête exacte, ce qui te rend parfois des résultats médiocres.
                En un sens, le ciblage est une façon de contourner le défaut de l’algorithme pagerank.

                Je te conseillerais bien Ixquick, un méta-moteur sur d’autres moteurs de recherche que Google, fait par les mêmes que Startpage, mais j’ai l’impression que les autres moteurs de recherche se sont inspirés de Google au niveau de leur algorithme et que les résultats ne sont pas bien différents.

                Normalement le champ « Tous ces mots » de la recherche avancée permet d’avoir des résultats correspondant plus à la requête (et moins à la mode) que la recherche de base.

                Cela dit, je ne sais pas quel problème tu as exactement avec les résultats, donc ce n’est peut-être pas la solution que tu attends.

                « Le fascisme c’est la gangrène, à Santiago comme à Paris. » — Renaud, Hexagone

      • [^] # Re: Vision "corporations are evil" ?

        Posté par  . Évalué à 3.

        « est-il possible d'avoir facilement des infos non ciblées ? » (pour éviter une version déformée de la réalité, pour éviter que ne me soit présenté que des avis identiques au mien par exemple)

        Non, c'est impossible. Ce n'est pas la faute de Google. Il y a un paquet de biais possible dans tous les sens qu'ils soient politique/culturels/sociaux ou technique.

        Tous les contenus que j'Ă©cris ici sont sous licence CC0 (j'abandonne autant que possible mes droits d'auteur sur mes Ă©crits)

  • # Indiquer ses prĂ©fĂ©rences Ă  Google

    Posté par  (site web personnel) . Évalué à 4.

    Google, s'il te plait, envoie moi un questionnaire sur mes tendances, mes opinions, mes préférences, les fréquences d'usages, les intérêts politiques et culturels.

    C'est par lĂ  : https://www.google.com/settings/u/0/ads/authenticated

  • # Aubergine

    Posté par  . Évalué à 3.

    « le classique tendance math » sékoi ?

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.