Journal Des liens… pour rien

Posté par (page perso) . Licence CC by-sa
Tags : aucun
21
14
oct.
2013

On trouve de plus en plus d'articles en lignes bourrés de lien hypertext absolument inintéressants (les liens) - comme si un robot avait identifié des mots et mis en place des liens pour faire joli.

Un exemple, article du monde sur un film : Grossesse à risque au Palais de Justice (afficher sans feuille de style)

Toute une série de verbes : "avenir", "paraître", "être", "aller", "imaginer"…) dont les liens hypertext pointent vers conjugaison de ces verbes verbe sur le même site. On sent que ça apporte un plus évident à l'article.

Des mots clés : "golf" parce qu'on y parle d'une canne de golf, "justice" car ça se passe au palais de justice, "famille" because ça apparaît dans une phrase d'un comédien, "médecine" parce que Dupontel l'a étudié quatre ans (mais surtout pas de lien vers une page sur l'acteur et sa filmographie - elle risquerait d'être sur un autre site)… là encore on sent les liens à forte valeur ajoutée par rapport au contenu de l'article.

Pour rire, "ses" (dans "à ses trousses") qui renvoie vers euronext "ses" (pas été voir, probablement le code d'une boite en bourse).

Les mecs qui ont mis ça en place n'ont franchement pas le sens du ridicule. Feraient mieux d'y passer un peu de temps à la main et d'ajouter des liens utiles. Ou de ne rien faire plutôt que ça.

  • # client-side ?

    Posté par (page perso) . Évalué à 9.

    T'es sûr que t'as pas un virus ou une extension de navigateur qui en fait trop pour se sucrer au passage de tes clics ?

    ce commentaire est sous licence cc by 4 et précédentes

    • [^] # Re: client-side ?

      Posté par (page perso) . Évalué à 7.

      Parce ce que oui, des sites qui font ça ça existe, et c'est chiant parce que ça détourne l'attention.

      Mais la page que tu lies n'a pas ce comportement. Alors je n'ai de cette page que le résumé, parce que je ne suis pas abonné, mais il faut reconnaître qu'une page qui met des liens hypertexte inutiles uniquement dans un article réservé aux initiés, ça sert pas à grand chose. Le résumé est assez long pour que je puisse avoir certains des mots que tu dénonce.

      En général les comportements chiant sont réservés aux visiteurs non payants, pas les abonnés. Si ces liens n'étaient que dans la page abonnée cela signifierai que :

      • Il s'agirait de vendre un placement de lien comme une publicité, ce qui est est idiot car cela signifie sucrer deux fois le client, celui qui paie pour avoir un meilleur service. J'ai du mal à croire que Le Monde dégrade l'usage du client qui paie et qu'il faut fidéliser, et ne dégrade que celui-là…
      • Il s'agirait de vendre un placement de lien comme une aide au référencement, c'est absurde puisque les moteurs de recherche ne voient pas ces liens. J'ai du mal à croire que les responsables techniques du Monde soient aussi incompétents.

      Ni un commercial compétent ni un technicien compétent ne ferait ça…

      D'où l'idée à cause de cet exemple d'article du Monde que même si je ne peux pas le lire en entier, je suppose que le problème est de ton coté.

      ce commentaire est sous licence cc by 4 et précédentes

      • [^] # Re: client-side ?

        Posté par (page perso) . Évalué à 2.

        As-tu essayé de demander l'affichage de la page sans aucun style (ie. le style par défaut p h1 h2 & Co) ?

        Python 3 - Apprendre à programmer en Python avec PyZo et Jupyter Notebook → https://www.dunod.com/sciences-techniques/python-3

        • [^] # Re: client-side ?

          Posté par (page perso) . Évalué à 10.

          Alors oui j'avais essayé sans les styles… et les liens ne s'affichaient pas non plus, et puis j'ai regardé le source et j'ai bondi ! quelle horreur !

          Les articles soit disant accessibles aux abonnés sont en fait téléchargés par tout le monde, c'est le javascript qui le cache. Mais attention, il y a deux domaines qui hébergent des scripts !

          • Si l'on ne bloque aucun script, on télécharge tout et ne voit qu'un résumé.
          • Si l'on bloque tous les scripts du domaine lemonde.fr, on voit alors tout le text en grisé très clair peu lisible avec dessus un message « abonnez-vous ».
          • Si l'on bloque les scripts du domaine lemde.fr, alors on voit tout.

          Hein ? tout le monde télécharge l'article même les non abonnés ?
          Hein ? c'est le client qui tronque lui-même l'article à la taille autorisée, c'est la version journaleux du virus belge  ?
          Hein ? un XSS est nécessaire à cette implémentation douteuse ?

          À noter pour rire, dans les pages, il y a ce message :

          Le Monde.fr a le plaisir de vous offrir la lecture de cet article habituellement réservé aux abonnés du Monde.fr. Profitez de tous les articles réservés du Monde.fr en vous abonnant à partir de 1€ / mois | Découvrez l'édition abonnés

          Le visiteur qui arrive sur le site sans javascript, on lui dit que s'il voit l'article c'est un cadeau exceptionnel (bravo le rattrapage aux branches), et je suppose que ce message est supprimé en javascript si on est abonné !

          Et puis c'est dégueulasse :

          le lieutenant Edouard (Christian Hecq, génial) est à <a class="lien_interne bourse" href="http://www.lemonde.fr/bourse/nyse-euronext-paris-equities/ses/">ses</a> trousses.</p>

          ou encore :

          <a target="_blank" onclick="return false;" class="lien_interne conjug" href="http://conjugaison.lemonde.fr/conjugaison/premier-groupe/encha%C3%AEner">enchaîner</a>

          Donc non seulement ils mettent bien des liens pourris (que je ne vois toujours pas et ne peut-toujours pas cliquer), mais en plus ils ont implémenté le plus foireux des DRM (quand on dit que le DRM fournit la clé avec l'œuvre, on ne pensait pas aussi grossièrement).

          Alors juste pour rire , un script naïf nommé plop rédigé en écriture-seule avec des outils pas du tout prévus pour parser du xml :

          #! /bin/sh
          url=$1; filename="$(echo $url | sed -e 's#.*/##;s#?.*##')"; domain="$(echo $url | sed -e 's#.*://\(.*\)#\1#;s#/.*##g')"; proto="$(echo $url | sed -e 's#\(.*\)\://.*#\1#')"; (wget $url -O - 2>/dev/null; printf '\n') | iconv -f iso-8859-15 -t utf-8 | grep -v 'logc2.xiti.com/hit.xiti\|smartadserver.com' | sed -e 's#charset=iso-8859-1#charset=utf8#;s#<a.*lien_interne.*>\(.*\)<\/a>#\1#g' | grep -v 'http-equiv="refresh"' | (cd $(mktemp -d); sed -e 's#<script.*>.*</script>##g' | (while read line; do if echo $line | grep '<script>' >/dev/null; then echo $line | sed -e 's#<script>.*##'; while read line; do if echo $line | grep '</script>' > /dev/null; then echo $line | sed -e 's#.*</script>##'; break; fi; done; else echo $line; fi; done) | sed -e "s#\\(\\=\"\\)//#\\1$proto\://#g;s#\\(\\=\"*\\)\\(/[^/]\\)#\\1$proto\://$domain\2#g" | grep -v '^$' > $filename; (xdg-open $filename || x-www-browser $filename || w3m $filename || links $filename || lynx $filename) 2>/dev/null)
          #EOF

          À exécuter comme cela :

          $ ./plop http://www.lemonde.fr/culture/article/2013/10/14/grossesse-a-risque-au-palais-de-justice_3495597_3246.html

          Et hop la page soit-disant « réservée abonné » s'affiche proprement avec tous les styles dans votre navigateur préféré, sans script, sans liens foireux et avec un codage correct !

          Je me souviens en effet qu'il fut un temps où les pages www.lemonde.fr étaient restreintes et pas les pages mobiles.lemonde.fr, il suffisait alors de s/www/mobile/ pour voir l'article. Il semble que ce point là a changé (faut dire que ça la foutait mal d'avoir les articles mobile sans fioritures et complets référencés à la place de la vitrine à publicité).

          ce commentaire est sous licence cc by 4 et précédentes

      • [^] # Re: client-side ?

        Posté par . Évalué à 4.

        Mais la page que tu lies n'a pas ce comportement. Alors je n'ai de cette page que le résumé, parce que je ne suis pas abonné,

        Tu désactives le javascript et tu recharges l'article, puis tu désactives les CSS et tu auras accès à l'article complet. Tu verras alors tous les liens en quention.

        • [^] # Re: client-side ?

          Posté par . Évalué à 1.

          D'ailleurs, on pourrait se demander si ce n'est pas pour emmerder et se faire de l'argent avec la pub quand quelqu'un contourne leur système d'abonnement.

          • [^] # Re: client-side ?

            Posté par . Évalué à 4.

            Non c'est une technique pourrie connue pour « optimiser » le référencement/marketing. Ces liens sont invisibles pour les internautes qui naviguent sur le web avec JavaScript et CSS activés, mais ils sont visibles par les robots qui analysent les pages en mode texte.

    • [^] # Re: client-side ?

      Posté par (page perso) . Évalué à 2.

      Adblock, noscript, ghostery. Je ne penses pas - au pire y'aurait un javascipt dans la page, chargé de nettoyer les liens débiles et qui n'est pas activé.

      Python 3 - Apprendre à programmer en Python avec PyZo et Jupyter Notebook → https://www.dunod.com/sciences-techniques/python-3

      • [^] # Re: client-side ?

        Posté par (page perso) . Évalué à 1.

        Et avec un autre navigateur ?

        • [^] # Re: client-side ?

          Posté par (page perso) . Évalué à 3.

          Ha oui, tiens, sous Konqueror (sans les noscript & Co) les liens n'apparaissent pas.

          Mais dans le code, on a des choses comme:

          <p>Pourtant, tout semble alors <a target="_blank" onclick="return false;" class="lien_interne conjug" href="http://conjugaison.lemonde.fr/conjugaison/troisieme-groupe/aller">aller</a> bien pour Ariane. <em>"J'aime mon travail"</em>, admet-elle. Envie d'autre chose ? <em>"La <a class="lien_interne rub" href="http://www.lemonde.fr/famille/">famille</a> est une …

          Python 3 - Apprendre à programmer en Python avec PyZo et Jupyter Notebook → https://www.dunod.com/sciences-techniques/python-3

          • [^] # Re: client-side ?

            Posté par (page perso) . Évalué à 4. Dernière modification le 14/10/13 à 21:49.

            Ah ok j'ai trouvé comment ils font les petits malins (mais j'ai du mal à voir l'intérêt). Réactive le Javascript sur cette page et tu verras que tout est bien différent (et notamment que tu ne peux plus accéder à la version abonnée si tu ne l'es pas). Du coup les liens existent, mais ils les désactivent en Javascript \o/ Désactiver le CSS seul ne suffit pas

            Edit ah oui en fait c'est ce que tu supposais plus haut, autant (au temps) pour moi !

      • [^] # Re: client-side ?

        Posté par (page perso) . Évalué à 3.

        Si je comprends bien :

        • la page web ne contient pas de liens avec un navigateur ayant des paramètres par défaut, donc destiné aux humains (du moins à ceux qui ne s'amusent pas à désactiver les feuilles de style).

        • la page web contient des liens débiles dans d'autres cas, probablement destiné aux robots… mais lesquels ?

        1. Les robots d'indexation pour améliorer le "ranking" de la page ?
        2. Les robots de ceux qui espionnent ou copient les articles ?
        3. Les robots aspirateurs de sites web  ?

        Probablement, seulement les robots d'indexation…

        vos avis ?

        Commentaire sous licence Creative Commons Zero CC0 1.0 Universal (Public Domain Dedication)

        • [^] # Re: client-side ?

          Posté par (page perso) . Évalué à 10. Dernière modification le 14/10/13 à 22:13.

          Si je comprends bien :

          Tu comprends bien.

          Dans toutes les grandes rédactions web, près du coin des commerciaux, il y a un pauvre hère qui mijote fébrilement des trucs de ce genre en poussant des petits cris. Il harasse les tecos en leur demandant des stats toujours plus granulaires, il subdivise des pages en zones de clics, le tout avec la bénédiction des annonceurs qui ont des idées encore plus tordues, et dont il faut sans arrêt repousser poliment les ardeurs. Rappeler 30 fois / jour que non, on n'autorise pas les pubs sonores "oui non bien sur je sais haha bien sur (snif) mais comme j'ai dit à Yves qui a vu avec Hélène qui est d'accord, c'est une musique très douce, d'ailleurs tout le monde l'adore ici, snif" Tenter de ne vexer personne "Vous voulez quoi ? Qu'on passe toutes les fontes en bleu Ixxxl pendant une semaine ??" Et c'est sans arret, le lendemain tu reçois une livraison de boites de matos "cadeau" et l'attachée de presse t'appelle pour t'assurer que c'est juste pasque tu es sympa, et t'as vu cet article sur Bloomberg/Nielsen/YouNameIt sur le SEO interne avec des liens auto ? J'ai croisé Antoine (ton redchef) qui est très pour. Au fait cette app iPhone vous en êtes où ? La pression est per-ma-nente.

          Le soir (tard) tout le monde rentre chez soi en se demandant qui peut bien lire cette merde (no offense).

    • [^] # Re: client-side ?

      Posté par . Évalué à -10.

      Moi j'ai pas de liens débile. Donc je serait assez d'avis que le problème vient pas du site

      • [^] # Re: client-side ?

        Posté par (page perso) . Évalué à 7.

        Si si, ils sont là (demandes l'affichage du code source html), mais dans certaines conditions ils ne sont ni visibles ni actifs au clic.

        <p>Pourtant, tout semble alors <a target="_blank" onclick="return false;" class="lien_interne conjug" href="http://conjugaison.lemonde.fr/conjugaison/troisieme-groupe/aller">aller</a> bien pour Ariane. <em>"J'aime mon travail"</em>, admet-elle. Envie d'autre chose ? <em>"La <a class="lien_interne rub" href="http://www.lemonde.fr/famille/">famille</a> est une …

        (code via Konqueror — où les liens ne sont ni visibles ni actifs)

        Python 3 - Apprendre à programmer en Python avec PyZo et Jupyter Notebook → https://www.dunod.com/sciences-techniques/python-3

        • [^] # Re: client-side ?

          Posté par . Évalué à -10.

          Je ne nie pas la présence des liens, je dis que c'est une extension de ton coté qui te les rajoute

          • [^] # Re: client-side ?

            Posté par (page perso) . Évalué à 8.

            Un extension de mon côté qui me rajouterais des liens vers des sites tiers (de pub ou autre), je pourrais le croire (mais j'aimerais bien savoir comment elle se serait installée sur mon firefox à côté de adblock / noscript / ghostery). Mais une extension de mon côté qui irait ajouter des liens comme http://conjugaison.lemonde.fr/conjugaison/troisieme-groupe/aller ou http://www.lemonde.fr/famille/, franchement non.

            Python 3 - Apprendre à programmer en Python avec PyZo et Jupyter Notebook → https://www.dunod.com/sciences-techniques/python-3

            • [^] # Re: client-side ?

              Posté par . Évalué à -10.

              Bah perso sur mon safari utilisé 1 seule fois pour télécharger un autre navigateur j'ai pas de soucis…

              • [^] # Re: client-side ?

                Posté par (page perso) . Évalué à 7.

                Tu veux dire que dans le code source de la page tu n'as pas de tels liens?

                Python 3 - Apprendre à programmer en Python avec PyZo et Jupyter Notebook → https://www.dunod.com/sciences-techniques/python-3

                • [^] # Re: client-side ?

                  Posté par (page perso) . Évalué à 9.

                  Dialogue de sourd, j'ai l'impression… Courage!

                  • [^] # Re: client-side ?

                    Posté par . Évalué à 4.

                    wget http://www.lemonde.fr/culture/article/2013/10/14/grossesse-a-risque-au-palais-de-justice_3495597_3246.html -O truc.html 
                    grep -c conjugaison truc.html -> 12 lignes contenants au moins une fois conjugaison...
                    

                    C'est bien coté serveur.
                    Par contre, chez moi, firefox ne me les affiche pas (sans noscript mais avec ghostery et adblock+), konqueror non plus et les mots ne semblent pas cliquables pour autant.

                    Chose marrante, quand on regarde le code source récupéré, l'article complet est dedans alors qu'il est sensé être protégé.
                    C'est assez ridicule, enfin ce doit être pour le référencement par les moteurs de recherche. Le pékin moyen ne devant rarement essayer de contourner leur "protection".

  • # C'est lourd

    Posté par . Évalué à 5.

    Je ne vois pas ça dans la page que tu cites, mais il m'est souvent arrivé de cliquer par erreur dans un article du monde et d'arriver sur la conjugaison du mot, dont je me foutais totalement à ce moment-là, donc j'ai déjà constaté ce que tu racontes.

    Un autre exemple de site qui met des liens automatiques pour définir tous les mots de l'article : http://www.techno-science.net/?onglet=news&news=12112
    Ça gêne la lecture et ça n'a à mon avis aucun intérêt.

  • # Ça me rend fou

    Posté par . Évalué à 10.

    Perso, j'ai une habitude (pourrie et inutile, mais bon, on se refait pas…) : quand je suis en train de lire un texte sur mon PC, je passe mon temps à sélectionner le texte que je suis en train de lire, en double-cliquant dessus.

    Et ces articles remplis de liens (la plupart du temps invisibles, bien entendu) me gonflent au plus haut point : je suis sans arrêt redirigé vers des pages qui n'ont absolument aucun intérêt. Genre je clique sans faire gaffe sur "vache"… j'en ai carrément rien à faire de voir la liste des articles du Monde qui parlent de vache.

    Ces gens ne pensent pas aux débiles comme moi qui cliquent frénétiquement sur les pages. Pourtant, on doit bien être quelques uns. Je suis pas tout seul, hein ? :(

    • [^] # Re: Ça me rend fou

      Posté par . Évalué à 9.

      Tu pourrais en parler pendant tout un diner ? Disons mercredi soir ?

      • [^] # Re: Ça me rend fou

        Posté par . Évalué à 7.

        J'ai déjà un autre dîner : un type était vachement intéressé par ma collection de rognures d'ongle. Va savoir pourquoi !

    • [^] # Re: Ça me rend fou

      Posté par . Évalué à 4.

      Non t'es pas tout seul :D

      • [^] # Re: Ça me rend fou

        Posté par (page perso) . Évalué à 2.

        je crois qu'on es plein à faire ça : xkcd

        \Ö<

        • [^] # Re: Ça me rend fou

          Posté par . Évalué à 2.

          Haha oui, j'avais oublié qu'un truc me rend encore plus fou : quand la sélection du texte est désactivée.

          • [^] # Re: Ça me rend fou

            Posté par . Évalué à 3.

            Pareil.

            C'est grave docteur ?

            Article Quarante-Deux : Toute personne dépassant un kilomètre de haut doit quitter le Tribunal. -- Le Roi de Cœur

  • # faille ou fail?

    Posté par (page perso) . Évalué à 4.

    Le même principe sur futura-sciences :

    Ajoutons que cette faille pourrait également être exploitée à des fins de surveillance par des États ou des agences gouvernementales

    #fail²

    blog.rom1v.com

    • [^] # Re: faille ou fail?

      Posté par . Évalué à 2.

      sur Futura Sciences, il y a moins de mots concernés et ils semblent choisi de manière beaucoup plus pertinente, un peu comme des tags.

      sur le site du monde, on a l'impression d'une bidouille pour multiplier les liens…

      • [^] # Re: faille ou fail?

        Posté par . Évalué à 0.

        Ouais enfin, l'exemple de la faille montre que c'est pas terrible non plus.

        Il ferait mieux de passer du temps à insérer de vrais liens pertinents à la main, quitte à en mettre moins.

        En plus, leurs liens sont parmi les plus gênants que j'aie pu voir, ils cumulent tout :
        - une différence de couleur très nette avec le contenu classique,
        - sur certains, un énorme tooltip qui vient te saouler quand tu passes sur le lien
        - sur certains, une jolie image rouge, qui détourne bien l'attention (tu ne vois que ça !).

        Donc ouais, ils sont sans doute plus pertinents pour la plupart, mais de mon point de vue, ils sont toujours aussi inutiles et gênants.

Suivre le flux des commentaires

Note : les commentaires appartiennent à ceux qui les ont postés. Nous n'en sommes pas responsables.