Forum général.général Télécharger les mots du Wiktionaire

Posté par (page perso) . Licence CC by-sa
Tags :
2
1
juil.
2015

Salut forum,

Connais-tu un moyen de télécharger la liste des mots français du Wiktionaire ? J'aurais besoin d'un dico pour un jeu et ça me semble être la meilleure source proposant les mots et les conjugaisons avec un contrat d'utilisation sympa.

Tout ce que j'ai trouvé pour l'instant ce sont les fichiers de http://dumps.wikimedia.org/frwiktionary/ qui listent les titres des pages. Malheureusement ces titres sont parfois des mots étrangers.

  • # aspell

    Posté par (page perso) . Évalué à 3.

    J'ai eu besoin d'une liste similaire mais du coup moi je l'ai choppé avec aspell en faisant :
    aspell -d fr dump master | aspell -l fr expand > dico.txt

    par contre pour des mots-flêchés par exemple c'est pas terrible il manque les noms propres, les rivières du genre AA etc. mais c'est déjà une très bonne base.

    Aucune idée pour le wiktionnaire mais je checkerai la soluce si tu trouves et que c'est mieux rempli.

  • # Kiwix

    Posté par . Évalué à -6.

    kiwix est ta solution

  • # La bdd d'anagrime

    Posté par (page perso) . Évalué à 3.

    Un des contributeurs de wiktionnaire à fait une base de donnée pour exploiter facilement tout ça dans anagrime. La page précédente propose un lien vers la base SQL correspondante.

  • # grammalecte

    Posté par . Évalué à 2.

    Salut,

    Il y a eu des infos récentes sur grammalecte.

    Ça peut être un point d'entrée. Ce n'est évidemment pas le vocabulaire du Wiktionaire, mais pour une source de mots, il y a matière.

  • # wordnet.

    Posté par (page perso) . Évalué à 1.

    Ça ne répond pas vraiment à ta question, j'ai juste découvert ça hier :
    Wordnet

    et Wolf

    Si quelqu'un utilise, je serais curieux de voir ce qu'on peut en tirer.

    « Il vaut mieux mobiliser son intelligence sur des conneries que mobiliser sa connerie sur des choses intelligentes. »

  • # Parseur de dump

    Posté par . Évalué à 1.

    J'avais écrit des scripts pour parser le dump du wiktionnaire à l'époque.

    Cfr: https://fr.wiktionary.org/wiki/Utilisateur:Jona#Scripts

    Ça devrait pas être trop dur de l'adapter à tes besoins.

Suivre le flux des commentaires

Note : les commentaires appartiennent à ceux qui les ont postés. Nous n'en sommes pas responsables.