JeuxDeMots : un jeu en ligne pour produire des données lexicales libres

Posté par . Modéré par Benoît Sibaud.
Tags :
0
9
juin
2008
Technologie
JeuxDeMots est un jeu en ligne développé au sein du Laboratoire d'Informatique Robotique Micro-électronique de Montpellier (LIRMM), par Mathieu Lafourcade. Ce jeu fait jouer des joueurs sur un terme précis (par exemple "chat") et une consigne précise (par exemple "trouver des synonymes"). Une telle partie est proposée à deux joueurs tirés au hasard, et les points gagnés sont proportionnels au nombre de mots trouvés qu'ils ont en commun.

Outre son aspect ludique, l'intérêt de JeuxDeMots réside dans le fait qu'il produit un réseau lexical en fonction des réponses données par les joueurs. Un réseau lexical permet de représenter des relations entre des termes (exemple "matou" est synonyme de "chat", "haine" est le contraire de "amour"). Le réseau lexical produit par JeuxDeMots est placé sous licence Creative Commons by-sa. Plusieurs API (python, Java) permettent ensuite de pouvoir exploiter ce réseau dans des applications.

NdM : pour l'instant le code est propriétaire « mais le choix d'une licence finale se fera quand toutes les fonctionnalités du site auront été développées ». En revanche, les données produites sont sous une licence Creative Commons, la licence libre by-sa 2.0 (Attribution - Share Alike) et les API sont libres sous GPLv3.
  • # Pourquoi tant de frilosité ?

    Posté par (page perso) . Évalué à 8.

    Ne pas vouloir diffuser le code n'est pas une bonne solution. Cela fait peser une suspicion sur le projet et tient à l'écart la plupart de ceux qui y auraient contribué.

    Rentrer dans un logiciel pour faire un "fork" est un risque qui n'existe que lorsque le mainteneur principal est devenu déficient ou prend des options contraires à la demande.

    Rentrer dans un programme dont on n'est pas l'auteur demande beaucoup de travail et personne ne le fera sans y être contraint. Il ne faut donc pas être frileux et appliquer la recette de Linus : "Release often".
  • # Rapidement.

    Posté par (page perso) . Évalué à 3.

    Belle application de la théorie, bravo !

    Ce projet pourrait avoir sa place dans KDEEDU [ http://edu.kde.org/ ] ou tout autre projet "d'éducation", qu'en pensez-vous ?
  • # D'un point de vue legal ?

    Posté par . Évalué à 3.

    Si c'est le joueur qui fait le travail, comment peut-on s'approprier ce-dit travail et le diffuser ? Meme sous license libre...
    • [^] # Re: D'un point de vue legal ?

      Posté par . Évalué à 3.

      a partir du moment ou quand tu demarre le jeu on te dit tes réponses vont etre la propriété du labo et qu'elles seront utiliser et mis sous licences libre je vois pas le problème.

      Je pense, dans ce cas, a wikipédia: tu sais avant de poster quoi que ce soit que TON texte appartient a wikipédia et qu'il serra sous licences libre.

      Ou encore (il me semble que c'est pour firefox3) mozilla qui avait organiser un concours pour trouver son logo. Il était bien précisé que tout les participants, en déposant leur création, renonçaient à leurs droit laissait la propriété du logo a mozilla.
      (Je sais c'est moyen mais bon c'est légal )
      • [^] # Re: D'un point de vue legal ?

        Posté par . Évalué à 3.

        a partir du moment ou quand tu demarre le jeu on te dit tes réponses vont etre la propriété du labo et qu'elles seront utiliser et mis sous licences libre je vois pas le problème.
        Tu as vu ça sur quelle page que les données seraient la propriété du labo ? Je n'ai rien trouvé sur le site de JeuxDeMots à ce sujet.

        Je pense, dans ce cas, a wikipédia: tu sais avant de poster quoi que ce soit que TON texte appartient a wikipédia et qu'il serra sous licences libre.
        Sur la page de Wikipedia relative aux droits d'auteurs¹, il est dit que l'auteur garde les droits sur son travail, il ne sont pas transférés à Wikipedia.

        ¹ http://fr.wikipedia.org/wiki/Wikip%C3%A9dia:Droit_d%27auteur
        • [^] # Re: D'un point de vue legal ?

          Posté par . Évalué à 2.

          Tu as vu ça sur quelle page que les données seraient la propriété du labo ? Je n'ai rien trouvé sur le site de JeuxDeMots à ce sujet.

          non j'imaginais que ca puisse ce passé comme ca : je pensais a mon exemple avec mozilla je n'en sait rien. Je n'ai rien trouvé non plus qui parle des listes de mots collecté.

          Sur la page de Wikipedia relative aux droits d'auteurs¹, il est dit que l'auteur garde les droits sur son travail, il ne sont pas transférés à Wikipedia.


          Effectivement je me suis trompé. Je pensais ..... mais non. En revanche ils t'impose tout de meme le type de licence pour ton texte. On peut imaginer que sur ce site ils fassent la meme chose. non ?
        • [^] # Re: D'un point de vue legal ?

          Posté par . Évalué à 3.

          Là il s'agit plus d'une collection de données qu'autre chose, ça s'apparente plus à un dictionnaire, le droit d'auteur est un peu particulier dans ce cas il me semble.
  • # Ca me rappelle Cyc

    Posté par . Évalué à 2.

    Je me demande s'il y a des échanges entre ces projets qui cherchent a modéliser l'intelligence humaine?

    http://fr.wikipedia.org/wiki/Cyc_%28projet%29
  • # on en fait quoi après ?

    Posté par (page perso) . Évalué à 3.

    Bonjour,
    J'ai aussi un jeu que j'ai mis en ligne y'a déjà quelques années qui demandent à chaque joueur de proposer 8 mots en relation avec ce mot (par exemple pour le mot lune : astre, soleil, amstrong, fusée, clair, ...)

    Et chaque joueur reçoit le nombre de point égal au nombre de personne qui ont proposé le même mot.

    J'obtiens ainsi une base assez conséquente de mot qui ont des relations les uns par rapport aux autres.

    Je me suis dit qu'il y avait peut être quelque chose à faire avec ces termes, mais jusqu'à présent, je n'ai rien trouvé.

    Axel
    • [^] # Re: on en fait quoi après ?

      Posté par . Évalué à 1.

      L'idée c'est déjà d'avoir plus qu'un seul type de relation (pas seulement mot associé mais par exemple synonyme, hyponyme, contraire, etc ...). Ensuite il faut mémoriser les informations dans une base de données. Enfin il est possible d'exploiter cette base de données dans des applications (exemple: embarquer un dictionnaire de synonyme dans l'éditeur de texte Gedit ou Kate (un exemple sur le site des API de jeux de mots est disponible, en python))...
    • [^] # Re: on en fait quoi après ?

      Posté par (page perso) . Évalué à 1.

      Par exemple :
      un gestionnaire de synonymes pour une suite bureautique,
      intégrer ça à un moteur de recherche pour optimiser les résultats,
      mettre ça dans un outils d'apprentissage de la langue,
      suivre l'évolution de la langue et voir la "popularité" des mots

      ou encore :
      proposer un système qui remplace les mots par leur synonymes pour que les lycéens puissent copier wikipédia discrètement ?
      --> []


      Il y a tellement de choses possibles, après faut voir comment se présente ta base, mais je suis sûr que beaucoup de personnes seraient intérêssées par des données de ce type.

      ( Pour voir comment mélanger informatique et vocabulaire | linguistique, je te conseille la lecture de ce blog : [http://aixtal.blogspot.com/] plein de ressources )
  • # Licence des données

    Posté par . Évalué à 2.

    En revanche, les données produites sont sous une licence Creative Commons, la licence libre by-sa 2.0 (Attribution - Share Alike)
    Pas libre pour tout le monde cette licence, en tout cas pas pour le projet Debian¹.

    Pourquoi n'avoir pas utilisé la CC-by-sa 3.0 qui est compatible avec les DFSG² et que le site Creative Commons incite fortement à utiliser en remplacement de la 2.0³ ?

    ¹ http://people.debian.org/~evan/ccsummary
    ² http://wiki.debian.org/DFSGLicenses
    ³ http://creativecommons.org/licenses/by-sa/2.0/
    • [^] # Re: Licence des données

      Posté par (page perso) . Évalué à 3.

      Sans doute tout simplement parce que lorsque tu cherches une licence sur le site creativecommons avec utilisation commerciale permise et partage si aux conditions identiques pour la juridiction française :
      http://creativecommons.org/license/results-one?q_1=2&q_1(...)

      bin le site te propose encore la CC-by-sa 2.0 :/ (déjà que le logo est un peu plus clean maintenant c'est bien, mais le travail n'est clairement pas encore fini...).
      Par ailleurs, les travaux ont effectivement bien avancé avec la v3.0 (grâce à pas mal de participants de Debian-Legal d'ailleurs), mais il me semble que tout n'est pas encore terminé : il y a encore un rapprochement avec la GFDL en cours iirc, avec notamment des intervenants de wikipedia ; ainsi que, dernièrement, le approved for free cultural work dont un journal [https://linuxfr.org/~akauffmann/26730.html] a parlé.
      Bref, il est encore temps de changer de licence...
  • # Navigateurs

    Posté par . Évalué à 2.

    Nickel avec Firefox
    Nickel avec Arora (WebKit)

    Le site foire complètement avec Konqueror et Opera :(

    Ca a l'air d'être du JavaScript ou des redirections qui partent dans tous les sens ....
    • [^] # Re: Navigateurs

      Posté par . Évalué à 1.

      bonjour,

      oui, je viens de constater que ca ne marche pas sous opera 9.5 - par contre pas de problème jusqu'à au moins la 9.27.

      Aucune idée des raisons - la console n'affiche pas d'erreur - et j'avoue que je ne sais pas du tout par quel bout prendre le problem...

Suivre le flux des commentaires

Note : les commentaires appartiennent à ceux qui les ont postés. Nous n'en sommes pas responsables.