Journal Des liens… pour rien

Posté par  (site web personnel) . Licence CC By‑SA.
Étiquettes : aucune
21
14
oct.
2013

On trouve de plus en plus d'articles en lignes bourrés de lien hypertext absolument inintéressants (les liens) - comme si un robot avait identifié des mots et mis en place des liens pour faire joli.

Un exemple, article du monde sur un film : Grossesse à risque au Palais de Justice (afficher sans feuille de style)

Toute une série de verbes : "avenir", "paraître", "être", "aller", "imaginer"…) dont les liens hypertext pointent vers conjugaison de ces verbes verbe sur le même site. On sent que ça apporte un plus évident à l'article.

Des mots clés : "golf" parce qu'on y parle d'une canne de golf, "justice" car ça se passe au palais de justice, "famille" because ça apparaît dans une phrase d'un comédien, "médecine" parce que Dupontel l'a étudié quatre ans (mais surtout pas de lien vers une page sur l'acteur et sa filmographie - elle risquerait d'être sur un autre site)… là encore on sent les liens à forte valeur ajoutée par rapport au contenu de l'article.

Pour rire, "ses" (dans "à ses trousses") qui renvoie vers euronext "ses" (pas été voir, probablement le code d'une boite en bourse).

Les mecs qui ont mis ça en place n'ont franchement pas le sens du ridicule. Feraient mieux d'y passer un peu de temps à la main et d'ajouter des liens utiles. Ou de ne rien faire plutôt que ça.

  • # client-side ?

    Posté par  (site web personnel) . Évalué à 9.

    T'es sûr que t'as pas un virus ou une extension de navigateur qui en fait trop pour se sucrer au passage de tes clics ?

    ce commentaire est sous licence cc by 4 et précédentes

    • [^] # Re: client-side ?

      Posté par  (site web personnel) . Évalué à 7.

      Parce ce que oui, des sites qui font ça ça existe, et c'est chiant parce que ça détourne l'attention.

      Mais la page que tu lies n'a pas ce comportement. Alors je n'ai de cette page que le résumé, parce que je ne suis pas abonné, mais il faut reconnaître qu'une page qui met des liens hypertexte inutiles uniquement dans un article réservé aux initiés, ça sert pas à grand chose. Le résumé est assez long pour que je puisse avoir certains des mots que tu dénonce.

      En général les comportements chiant sont réservés aux visiteurs non payants, pas les abonnés. Si ces liens n'étaient que dans la page abonnée cela signifierai que :

      • Il s'agirait de vendre un placement de lien comme une publicité, ce qui est est idiot car cela signifie sucrer deux fois le client, celui qui paie pour avoir un meilleur service. J'ai du mal à croire que Le Monde dégrade l'usage du client qui paie et qu'il faut fidéliser, et ne dégrade que celui-là…
      • Il s'agirait de vendre un placement de lien comme une aide au référencement, c'est absurde puisque les moteurs de recherche ne voient pas ces liens. J'ai du mal à croire que les responsables techniques du Monde soient aussi incompétents.

      Ni un commercial compétent ni un technicien compétent ne ferait ça…

      D'où l'idée à cause de cet exemple d'article du Monde que même si je ne peux pas le lire en entier, je suppose que le problème est de ton coté.

      ce commentaire est sous licence cc by 4 et précédentes

      • [^] # Re: client-side ?

        Posté par  (site web personnel) . Évalué à 2.

        As-tu essayé de demander l'affichage de la page sans aucun style (ie. le style par défaut p h1 h2 & Co) ?

        Python 3 - Apprendre à programmer dans l'écosystème Python → https://www.dunod.com/EAN/9782100809141

        • [^] # Re: client-side ?

          Posté par  (site web personnel) . Évalué à 10.

          Alors oui j'avais essayé sans les styles… et les liens ne s'affichaient pas non plus, et puis j'ai regardé le source et j'ai bondi ! quelle horreur !

          Les articles soit disant accessibles aux abonnés sont en fait téléchargés par tout le monde, c'est le javascript qui le cache. Mais attention, il y a deux domaines qui hébergent des scripts !

          • Si l'on ne bloque aucun script, on télécharge tout et ne voit qu'un résumé.
          • Si l'on bloque tous les scripts du domaine lemonde.fr, on voit alors tout le text en grisé très clair peu lisible avec dessus un message « abonnez-vous ».
          • Si l'on bloque les scripts du domaine lemde.fr, alors on voit tout.

          Hein ? tout le monde télécharge l'article même les non abonnés ?
          Hein ? c'est le client qui tronque lui-même l'article à la taille autorisée, c'est la version journaleux du virus belge  ?
          Hein ? un XSS est nécessaire à cette implémentation douteuse ?

          À noter pour rire, dans les pages, il y a ce message :

          Le Monde.fr a le plaisir de vous offrir la lecture de cet article habituellement réservé aux abonnés du Monde.fr. Profitez de tous les articles réservés du Monde.fr en vous abonnant à partir de 1€ / mois | Découvrez l'édition abonnés

          Le visiteur qui arrive sur le site sans javascript, on lui dit que s'il voit l'article c'est un cadeau exceptionnel (bravo le rattrapage aux branches), et je suppose que ce message est supprimé en javascript si on est abonné !

          Et puis c'est dégueulasse :

          le lieutenant Edouard (Christian Hecq, génial) est à <a class="lien_interne bourse" href="http://www.lemonde.fr/bourse/nyse-euronext-paris-equities/ses/">ses</a> trousses.</p>

          ou encore :

          <a target="_blank" onclick="return false;" class="lien_interne conjug" href="http://conjugaison.lemonde.fr/conjugaison/premier-groupe/encha%C3%AEner">enchaîner</a>

          Donc non seulement ils mettent bien des liens pourris (que je ne vois toujours pas et ne peut-toujours pas cliquer), mais en plus ils ont implémenté le plus foireux des DRM (quand on dit que le DRM fournit la clé avec l'œuvre, on ne pensait pas aussi grossièrement).

          Alors juste pour rire , un script naïf nommé plop rédigé en écriture-seule avec des outils pas du tout prévus pour parser du xml :

          #! /bin/sh
          url=$1; filename="$(echo $url | sed -e 's#.*/##;s#?.*##')"; domain="$(echo $url | sed -e 's#.*://\(.*\)#\1#;s#/.*##g')"; proto="$(echo $url | sed -e 's#\(.*\)\://.*#\1#')"; (wget $url -O - 2>/dev/null; printf '\n') | iconv -f iso-8859-15 -t utf-8 | grep -v 'logc2.xiti.com/hit.xiti\|smartadserver.com' | sed -e 's#charset=iso-8859-1#charset=utf8#;s#<a.*lien_interne.*>\(.*\)<\/a>#\1#g' | grep -v 'http-equiv="refresh"' | (cd $(mktemp -d); sed -e 's#<script.*>.*</script>##g' | (while read line; do if echo $line | grep '<script>' >/dev/null; then echo $line | sed -e 's#<script>.*##'; while read line; do if echo $line | grep '</script>' > /dev/null; then echo $line | sed -e 's#.*</script>##'; break; fi; done; else echo $line; fi; done) | sed -e "s#\\(\\=\"\\)//#\\1$proto\://#g;s#\\(\\=\"*\\)\\(/[^/]\\)#\\1$proto\://$domain\2#g" | grep -v '^$' > $filename; (xdg-open $filename || x-www-browser $filename || w3m $filename || links $filename || lynx $filename) 2>/dev/null)
          #EOF

          À exécuter comme cela :

          $ ./plop http://www.lemonde.fr/culture/article/2013/10/14/grossesse-a-risque-au-palais-de-justice_3495597_3246.html

          Et hop la page soit-disant « réservée abonné » s'affiche proprement avec tous les styles dans votre navigateur préféré, sans script, sans liens foireux et avec un codage correct !

          Je me souviens en effet qu'il fut un temps où les pages www.lemonde.fr étaient restreintes et pas les pages mobiles.lemonde.fr, il suffisait alors de s/www/mobile/ pour voir l'article. Il semble que ce point là a changé (faut dire que ça la foutait mal d'avoir les articles mobile sans fioritures et complets référencés à la place de la vitrine à publicité).

          ce commentaire est sous licence cc by 4 et précédentes

      • [^] # Commentaire supprimé

        Posté par  . Évalué à 4.

        Ce commentaire a été supprimé par l’équipe de modération.

        • [^] # Re: client-side ?

          Posté par  . Évalué à 1.

          D'ailleurs, on pourrait se demander si ce n'est pas pour emmerder et se faire de l'argent avec la pub quand quelqu'un contourne leur système d'abonnement.

          • [^] # Commentaire supprimé

            Posté par  . Évalué à 4.

            Ce commentaire a été supprimé par l’équipe de modération.

    • [^] # Re: client-side ?

      Posté par  (site web personnel) . Évalué à 2.

      Adblock, noscript, ghostery. Je ne penses pas - au pire y'aurait un javascipt dans la page, chargé de nettoyer les liens débiles et qui n'est pas activé.

      Python 3 - Apprendre à programmer dans l'écosystème Python → https://www.dunod.com/EAN/9782100809141

      • [^] # Re: client-side ?

        Posté par  . Évalué à 1.

        Et avec un autre navigateur ?

        • [^] # Re: client-side ?

          Posté par  (site web personnel) . Évalué à 3.

          Ha oui, tiens, sous Konqueror (sans les noscript & Co) les liens n'apparaissent pas.

          Mais dans le code, on a des choses comme:

          <p>Pourtant, tout semble alors <a target="_blank" onclick="return false;" class="lien_interne conjug" href="http://conjugaison.lemonde.fr/conjugaison/troisieme-groupe/aller">aller</a> bien pour Ariane. <em>"J'aime mon travail"</em>, admet-elle. Envie d'autre chose ? <em>"La <a class="lien_interne rub" href="http://www.lemonde.fr/famille/">famille</a> est une …

          Python 3 - Apprendre à programmer dans l'écosystème Python → https://www.dunod.com/EAN/9782100809141

          • [^] # Re: client-side ?

            Posté par  . Évalué à 4. Dernière modification le 14 octobre 2013 à 21:49.

            Ah ok j'ai trouvé comment ils font les petits malins (mais j'ai du mal à voir l'intérêt). Réactive le Javascript sur cette page et tu verras que tout est bien différent (et notamment que tu ne peux plus accéder à la version abonnée si tu ne l'es pas). Du coup les liens existent, mais ils les désactivent en Javascript \o/ Désactiver le CSS seul ne suffit pas

            Edit ah oui en fait c'est ce que tu supposais plus haut, autant (au temps) pour moi !

      • [^] # Re: client-side ?

        Posté par  (site web personnel) . Évalué à 3.

        Si je comprends bien :

        • la page web ne contient pas de liens avec un navigateur ayant des paramètres par défaut, donc destiné aux humains (du moins à ceux qui ne s'amusent pas à désactiver les feuilles de style).

        • la page web contient des liens débiles dans d'autres cas, probablement destiné aux robots… mais lesquels ?

        1. Les robots d'indexation pour améliorer le "ranking" de la page ?
        2. Les robots de ceux qui espionnent ou copient les articles ?
        3. Les robots aspirateurs de sites web  ?

        Probablement, seulement les robots d'indexation…

        vos avis ?

        Commentaire sous licence Creative Commons Zero CC0 1.0 Universal (Public Domain Dedication)

        • [^] # Commentaire supprimé

          Posté par  . Évalué à 10. Dernière modification le 14 octobre 2013 à 22:13.

          Ce commentaire a été supprimé par l’équipe de modération.

    • [^] # Re: client-side ?

      Posté par  . Évalué à -10.

      Moi j'ai pas de liens débile. Donc je serait assez d'avis que le problème vient pas du site

      • [^] # Re: client-side ?

        Posté par  (site web personnel) . Évalué à 7.

        Si si, ils sont là (demandes l'affichage du code source html), mais dans certaines conditions ils ne sont ni visibles ni actifs au clic.

        <p>Pourtant, tout semble alors <a target="_blank" onclick="return false;" class="lien_interne conjug" href="http://conjugaison.lemonde.fr/conjugaison/troisieme-groupe/aller">aller</a> bien pour Ariane. <em>"J'aime mon travail"</em>, admet-elle. Envie d'autre chose ? <em>"La <a class="lien_interne rub" href="http://www.lemonde.fr/famille/">famille</a> est une …

        (code via Konqueror — où les liens ne sont ni visibles ni actifs)

        Python 3 - Apprendre à programmer dans l'écosystème Python → https://www.dunod.com/EAN/9782100809141

        • [^] # Re: client-side ?

          Posté par  . Évalué à -10.

          Je ne nie pas la présence des liens, je dis que c'est une extension de ton coté qui te les rajoute

          • [^] # Re: client-side ?

            Posté par  (site web personnel) . Évalué à 8.

            Un extension de mon côté qui me rajouterais des liens vers des sites tiers (de pub ou autre), je pourrais le croire (mais j'aimerais bien savoir comment elle se serait installée sur mon firefox à côté de adblock / noscript / ghostery). Mais une extension de mon côté qui irait ajouter des liens comme http://conjugaison.lemonde.fr/conjugaison/troisieme-groupe/aller ou http://www.lemonde.fr/famille/, franchement non.

            Python 3 - Apprendre à programmer dans l'écosystème Python → https://www.dunod.com/EAN/9782100809141

            • [^] # Re: client-side ?

              Posté par  . Évalué à -10.

              Bah perso sur mon safari utilisé 1 seule fois pour télécharger un autre navigateur j'ai pas de soucis…

              • [^] # Re: client-side ?

                Posté par  (site web personnel) . Évalué à 7.

                Tu veux dire que dans le code source de la page tu n'as pas de tels liens?

                Python 3 - Apprendre à programmer dans l'écosystème Python → https://www.dunod.com/EAN/9782100809141

                • [^] # Re: client-side ?

                  Posté par  (site web personnel) . Évalué à 9.

                  Dialogue de sourd, j'ai l'impression… Courage!

                  • [^] # Re: client-side ?

                    Posté par  . Évalué à 4.

                    wget http://www.lemonde.fr/culture/article/2013/10/14/grossesse-a-risque-au-palais-de-justice_3495597_3246.html -O truc.html 
                    grep -c conjugaison truc.html -> 12 lignes contenants au moins une fois conjugaison...
                    

                    C'est bien coté serveur.
                    Par contre, chez moi, firefox ne me les affiche pas (sans noscript mais avec ghostery et adblock+), konqueror non plus et les mots ne semblent pas cliquables pour autant.

                    Chose marrante, quand on regarde le code source récupéré, l'article complet est dedans alors qu'il est sensé être protégé.
                    C'est assez ridicule, enfin ce doit être pour le référencement par les moteurs de recherche. Le pékin moyen ne devant rarement essayer de contourner leur "protection".

  • # C'est lourd

    Posté par  . Évalué à 5.

    Je ne vois pas ça dans la page que tu cites, mais il m'est souvent arrivé de cliquer par erreur dans un article du monde et d'arriver sur la conjugaison du mot, dont je me foutais totalement à ce moment-là, donc j'ai déjà constaté ce que tu racontes.

    Un autre exemple de site qui met des liens automatiques pour définir tous les mots de l'article : http://www.techno-science.net/?onglet=news&news=12112
    Ça gêne la lecture et ça n'a à mon avis aucun intérêt.

  • # Ça me rend fou

    Posté par  . Évalué à 10.

    Perso, j'ai une habitude (pourrie et inutile, mais bon, on se refait pas…) : quand je suis en train de lire un texte sur mon PC, je passe mon temps à sélectionner le texte que je suis en train de lire, en double-cliquant dessus.

    Et ces articles remplis de liens (la plupart du temps invisibles, bien entendu) me gonflent au plus haut point : je suis sans arrêt redirigé vers des pages qui n'ont absolument aucun intérêt. Genre je clique sans faire gaffe sur "vache"… j'en ai carrément rien à faire de voir la liste des articles du Monde qui parlent de vache.

    Ces gens ne pensent pas aux débiles comme moi qui cliquent frénétiquement sur les pages. Pourtant, on doit bien être quelques uns. Je suis pas tout seul, hein ? :(

    • [^] # Re: Ça me rend fou

      Posté par  . Évalué à 9.

      Tu pourrais en parler pendant tout un diner ? Disons mercredi soir ?

      • [^] # Re: Ça me rend fou

        Posté par  . Évalué à 7.

        J'ai déjà un autre dîner : un type était vachement intéressé par ma collection de rognures d'ongle. Va savoir pourquoi !

    • [^] # Re: Ça me rend fou

      Posté par  . Évalué à 4.

      Non t'es pas tout seul :D

      • [^] # Re: Ça me rend fou

        Posté par  (site web personnel) . Évalué à 2.

        je crois qu'on es plein à faire ça : xkcd

        \Ö<

        • [^] # Re: Ça me rend fou

          Posté par  . Évalué à 2.

          Haha oui, j'avais oublié qu'un truc me rend encore plus fou : quand la sélection du texte est désactivée.

          • [^] # Re: Ça me rend fou

            Posté par  . Évalué à 3.

            Pareil.

            C'est grave docteur ?

            Article Quarante-Deux : Toute personne dépassant un kilomètre de haut doit quitter le Tribunal. -- Le Roi de Cœur

  • # faille ou fail?

    Posté par  (site web personnel) . Évalué à 4.

    Le même principe sur futura-sciences :

    Ajoutons que cette faille pourrait également être exploitée à des fins de surveillance par des États ou des agences gouvernementales

    #fail²

    blog.rom1v.com

    • [^] # Re: faille ou fail?

      Posté par  . Évalué à 2.

      sur Futura Sciences, il y a moins de mots concernés et ils semblent choisi de manière beaucoup plus pertinente, un peu comme des tags.

      sur le site du monde, on a l'impression d'une bidouille pour multiplier les liens…

      • [^] # Re: faille ou fail?

        Posté par  . Évalué à 0.

        Ouais enfin, l'exemple de la faille montre que c'est pas terrible non plus.

        Il ferait mieux de passer du temps à insérer de vrais liens pertinents à la main, quitte à en mettre moins.

        En plus, leurs liens sont parmi les plus gênants que j'aie pu voir, ils cumulent tout :
        - une différence de couleur très nette avec le contenu classique,
        - sur certains, un énorme tooltip qui vient te saouler quand tu passes sur le lien
        - sur certains, une jolie image rouge, qui détourne bien l'attention (tu ne vois que ça !).

        Donc ouais, ils sont sans doute plus pertinents pour la plupart, mais de mon point de vue, ils sont toujours aussi inutiles et gênants.

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.