Journal Wikidata et le multilinguisme

12
1
avr.
2014

Wikidata est un projet qui nomme des trucs à grande échelle dans pleins de langues.

Bonus, Wikidata a une API utilisable par qui veut. Il en était déjà sorti des cartes avec des labels multilingues. Vous voulez proposez internationaliser un peu vos sites ? Bonne nouvelle, un créateur de Wikidata, maintenant chez google, vient de créer une bibliothèque javascript pour faciliter ça. Il va (probablement) juste falloir trouver le bon concept, ou connaitre le titre de l'article dans une wikipédia quelconque pour pouvoir l'utiliser et voir le nom du concept s'afficher dans la langue de l'utilisateur.

Évidemment tout n'est pas traduit dans toutes les langues, mais on peut déja avoir quelques informations en récupérant quelques affirmations Wikidata qui permettront sans doute d'afficher des informations basiques comme la nature de l'élément.

J'ai pas encore testé, d'où les probablement sans doute parsemant mon journal, mais ça me semblait assez intéressant dans l'idée pour partager.

Ça s'appelle qlabel, en référence aux identifiants wikidatas qui sont des chaines qui commencent par Q, et c'est décrit sur le blog google opensource

Au passage, le numéro Q 16 000 000 vient d'être créé ainsi qu'un WikiProjet France sur Wikidata.

That's all I got.

  • # n'est pas en dessous de la vérité...

    Posté par . Évalué à 1.

    … de dire /des trucs/

    Wikidata est un projet qui nomme des trucs à grande échelle

    Je crois que c'est bien une tentative de modéliser le tout.
    D'un côté j'aime bien l'idée, parce que c'est open, de l'autre je ne peux m'empêcher de penser marchine learning => big brother
    Non ?

    Par contre, il n'y à pas un lien vers la lib autre le blog de google ?

    Pas dispo ici, pas de bonne réponses là https://duckduckgo.com/?q=qlabel+wikidata : (

    • [^] # Re: n'est pas en dessous de la vérité...

      Posté par . Évalué à 3.

      Ben toute médaille à son revers, oui. Après c'est pas une tentative de modéliser le tout, personne ne peut insérer ton ADN dans la base de donnée à ton insu, et les données privées sur les gens sont examinée de la même manière que sur les articles Wikipédia, notamment pour les personnes vivantes.

      Le github: https://github.com/googleknowledge/qlabel/

      Oui, c'est google, après ça veut pas dire qu'on est obligé de passer par eux. Bon la licence de Wikidata est la CC0, c'est effectivement un point discutable.

      • [^] # Re: n'est pas en dessous de la vérité...

        Posté par . Évalué à 1.

        Oui. C'est juste que c'est un pas de plus pour améliorer le machine learning.

        Merci pour le lien, je ne l'avais pas vu..

        CC0 => https://creativecommons.org/choose/zero/?lang=fr

        Je ne saurais dire ce qui te chagrine par contre.

        • [^] # Re: n'est pas en dessous de la vérité...

          Posté par . Évalué à 3.

          moi pas grand chose en particulier, mais par rapport à Wikipédia j'ai cru comprendre qu'il y avait la crainte que des géants comme Google se comportent un peu voracement en important sauvagement toutes les données dans (le volet proprio) freebase sans rien vraiment reverser. Ils jouent relativement bien le jeu pour l'instant, et c'est un peu le jeu du ''linked data'' de tout mutualiser, mais ça peut être un reproche pour certains.

          Sur la CC0, c'est une licence qui mine de rien est incompatible avec un certain nombre d'autres licence, et si ça risque de faciliter la réutilisation des données Wikidata, ce qui est sans doute bien, ça ne va peut être pas faciliter l'import d'autres sources de données qui seraient dans des licence un poil moins permissive. Ce sont des points qu'on peut considérer comme points de détails, certes.

Suivre le flux des commentaires

Note : les commentaires appartiennent à ceux qui les ont postés. Nous n'en sommes pas responsables.