Journal Génération de mots-clefs par mediawiki

Posté par (page perso) .
Tags : aucun
0
27
juin
2006
Comme toute moule^Wingénieur qui se respecte, je suis un flemmard. J'aime quand les choses chiantes^Wrépétitives se font toutes seules. Dans la guerre qui fait rage dans l'Internet du dehors pour avoir son site bien classé dans les résultats du conglomérat en g dont on ne doit pas dire le nom, il paraît qu'avoir des keywords bien sentis, eh ben ça aide. Brèfle, je voudrais que ces balises ce génèrent toutes seules sur un site à très très haute audience: http://www.esterel-technologies.com/ .

En me balladant sur des articles que j'ai posté sur la wikipedia, je me dis que quand même, les sus-dits keywords sont quand même rudement bien choisis. Donc voilà, je voudrais pareil pour chez moi. J'ai bien essayé de trouver ça dans leur doc http://svn.wikimedia.org/doc/ mais tout ce que je trouve se rapport aux méta-données dublinCore. Donc voilà, si quelqu'un avait un point d'entrée, voire un bonne méthode pour générer des mots-clefs pertinents qui vont bien avec la page, je pourrais continuer à faire des siestes.
  • # Pas bien compliqué

    Posté par . Évalué à 2.

    Apparament, ils prennent au pif 10 des N (20 ?) premiers liens internes.
    • [^] # Re: Pas bien compliqué

      Posté par . Évalué à 1.

      Salut,

      J'ai testé sur 2 pages au hasard, et je pense qu'il prend en effet des liens internes, mais pas au pif, plutot dans l'ordre alphabétique:

      http://en.wikipedia.org/wiki/Astrophysics
      meta name="keywords" content="Astrophysics,1670,16th century,17th century,19th century,20th century,Adaptive optics,Age of the Universe,Aristarchus of Samos,Aristotle,Astronomer"

      http://en.wikipedia.org/wiki/Linux (au hasard j'ai dit!)
      meta name="keywords" content="Linux,2006,April 1,April 3,June 19,March 20,May 11,May 19,May 7,May 8,$100 laptop"

      En passant, "April 1", ... ne sont pas si bien choisi pour qualifier Linux...

      Julien
      • [^] # Re: Pas bien compliqué

        Posté par (page perso) . Évalué à 1.

        Ca m'a bien l'air d'être ça. C'est quand même assez lié à la structure du bouzin, les liens internes pointant fatalement sur quelque chose de court et significatif. Et puis comme vu sur la page [Linux], ce n'est pas fatalement hyper-représentatif. Ce qui est intéressant de noter, c'est qu'ils ont limité la liste à 10, un chiffre à copier peut-être?

        Bon, ben je vais m'en coder un à la mimine alors.
  • # Au hasard

    Posté par . Évalué à 2.

    Moi je veux bien te les faire :

    Scade, Airbus, Aeronautics, Modelling, Prover, Coding, Generation, Matlab, Simulink, Logics, Boeing, Defence, Aerospace, A380, Forgeard, Linux, Unix


    Avec ça si tu ne fais pas un score...

    ­La faculté de citer est un substitut commode à l'intelligence -- Somerset Maugham

    • [^] # Re: Au hasard

      Posté par (page perso) . Évalué à 2.

      Il faut juste en changer un peu d'une page à l'autre, suivant son contenu. Et là je tourne à environ 300 pages.

      Je te remercie tout de même pour ta contribution à notre domination totale du monde mondial, je la mettrai dans ma liste de mots-clefs suggérés.
  • # Les keywords ça sert à rien

    Posté par . Évalué à 4.

    Je croyais que G** ne prenait plus du tout en compte les "meta name keywords", justement (Pour renvoyer des résultats en fonction des informations effectivement lisibles par les humains, et non pas des keywords qui ne servent qu'à spammer)

    Evidemment comme on ne connait pas leur algorithme, on n'est sûr de rien, mais ça me paraitrait logique.
    • [^] # Re: Les keywords ça sert à rien

      Posté par (page perso) . Évalué à 2.

      De mémoire : les mots-clés ne sont pris en compte que si ils apparaissent effectivement dans la page. C'est un moyen de donner de l'importance relative à des mots qui étaient déjà là avant.

      Mais c'est vrai que vu la quantité de pages dynamiques et du coup en général sans keywords sur le web aujourd'hui, ça doit devenir un critère vraiment secondaire (je viens de regarder, je ne trouve pas de keywords dans l'HTML de linuxfr.org, et pourtant, il a un super google ranking !).

      Voir aussi du côté des sitemaps pour aider Google à faire l'indexation.
    • [^] # Re: Les keywords ça sert à rien

      Posté par (page perso) . Évalué à 1.

      Moi aussi je croyais; mais il y a des choses que j'ai du mal à comprendre. Je travaille en ce momment sur un seul mot-clef: DO-178B
      La page qui sort en premier sur cette recherche: http://www.lynuxworks.com/solutions/milaero/do-178b.php3 a un page rank de 5. La page qui sort en premier chez moi, http://www.esterel-technologies.com/services/process-consult(...) , a un PR de 6. Et si je fais un http://www.google.com/search?q=link:www.lynuxworks.com/solut(...) : ils ont 192 pages qui les lient, toutes venant de leur propre site. si je fais la mêm chose chez moi, je n'ai qu'une seule page. Alors j'essaye de regarder les différences entre leur source et le mien, et le premier truc qui m'accroche sont les keywords. Je suppose que des keywords qui collent bien au contenu de la page doivent aider un peu, alors je vais essayer.

Suivre le flux des commentaires

Note : les commentaires appartiennent à ceux qui les ont postés. Nous n'en sommes pas responsables.