Linguae : Gestionnaire de dictionnaires, multiformat et multiplateforme.

Posté par . Modéré par Mouns.
8
2
juin
2009
Éducation
Linguae est un nouvel outil libre (licence CeCILL) de gestion de dictionnaires hors-ligne. Il permet de lire, d'éditer et de convertir des dictionnaires de différents formats ainsi que de créer ou d'améliorer ses propres dictionnaires. Linguae vient compléter des logiciels comme StarDict ou QStarDict, offrant des possibilités et des facilités de conversion nouvelles entre les différents formats.

Les fonctionnalités d'édition de dictionnaires qu'offre Linguae sont actuellement sans égales à notre connaissance dans le domaine, au moins parmi les logiciels à code ouvert. Ce logiciel sous licence libre CeCILL a aussi pour objectif de permettre à des auteurs de dictionnaires informatiques de garder la maîtrise de leur travail, grâce à ses fonctionnalités simples de création, de modification, de conversion et de cryptage, à l'inverse de ce que proposent certains outils similaires dans le monde des logiciels propriétaires.

Développé en Python par Billig depuis août 2008, Linguae, bien qu'encore en version alpha, est déjà très fonctionnel. Linguae est un logiciel associé au projet "Polyglotte". Formats de dictionnaires actuellement supportés en lecture, écriture (édition du contenu) et conversion d'un format à l'autre :
  • *.ling (format binaire Linguae)
  • *.dict (format binaire StarDict)
  • *.xdxf (format texte xml)
  • *.wb (format binaire à champs de longueur fixe)
  • *.ini (format texte des fichiers d'initialisation)
  • *.csv, *.tab, *.txt (fichiers texte délimités)

Linguae accepte des greffons ("plug-ins”) sous la forme de modules Python utilisant un interfaçage logiciel simple. Les greffons sont destinés à apporter des fonctionnalités propres à une langue ou un groupe de langues ou de dictionnaires. Un seul greffon est pour le moment disponible : Declinator (déclinaisons, conjugaisons et traductions à partir d'un dictionnaire Latin à codage grammatical compatible), également libre (CeCILL). La création de nouveaux greffons est souhaitée.

Caractéristiques :
  • Logiciel libre sous licence CeCILL
  • Version courante : 0.0.25 Alpha (01/06/2009)
  • Compatible multi-plateforme
  • Compatible avec divers formats de dictionnaires, en lecture et en édition.
  • Capacité multi-utilisateur sur ordinateur partagé (potentialité variable suivant la plateforme).

Lecture des dictionnaires :
  • Lecture en format natif des divers formats supportés.
  • Module d'aide à la traduction, utilisable quel que soit le dictionnaire.
  • Gestion de relations internes entre les entrées (si le format le permet).

Édition du contenu des dictionnaires :
  • Modification des entrées (entrée et notice).
  • Ajout de nouvelle entrées.
  • Déplacement libre des entrées dans le dictionnaire.
  • Suppression d'entrées.
  • Table de caractère Unicode intégrée.
  • Édition des propriétés (métadonnées) du dictionnaire pour les formats le permettant.
  • Tri paramétrable des dictionnaires.
  • Ajout ou modification du contenu audio directement par l'interface.
  • Association d'images gif aux entrées.

Gestion des dictionnaires :
  • Création de nouveaux dictionnaires vides.
  • Chemin de recherche et chemin du fichier de stockage principal paramétrables
  • Création automatique de dictionnaires inverses.
  • Croisement de dictionnaires (L1/L2 x L2/L3 -> nouveau dictionnaire L1/L3)
  • Exportation des dictionnaires vers divers formats.
  • Importation au format texte (CSV ou format texte dédié).

Recherche dans les dictionnaires :
  • Recherche dans les entrées ou les notices ou les deux associées.
  • Recherche des entrées "à la volée" en tapant le début du mot.
  • Recherche itérative dans les entrées et les notices avec insensibilité optionnelle aux ligatures (avec ou sans sensibilité à la casse).

Interface :
  • Interface redimensionnable
  • Transparence réglable (inactif sur certaines plateformes).
  • Affichage récursif du dossier de stockage dans un menu déroulant "Dictionnaires"
  • Polices d'affichage paramétrables (indépendamment pour la liste d'entrées et la notice)
  • Mémorisation de la taille et de la position de la fenêtre d'une utilisation à l'autre.
  • Réouverture automatique du dernier dictionnaire ouvert.
  • Réouverture automatique du dernier greffon ouvert.

Divers :
  • Possibilité d'utiliser des greffons ("plug-ins")
  • Recherche automatique de l'existence d'une nouvelle version.
  • # c'est l'époque

    Posté par (page perso) . Évalué à 2.

    Quelle époque épique pour les dictionnaires ;-)
    - Dernièrement ce journal http://linuxfr.org/~cram51/28331.html Omnidic : traducteur pour téléphone portable sur mesures
    - Un peu avant cette dépêche http://linuxfr.org/2009/05/21/25498.html Apertium intègre le premier traducteur automatique breton-français

    Les dictionnaires sont-ils vraiment partagés ? Peut-être existe-t-il une page recensant les dictionnaires existants (sachant que ça peut servir dans le navigateur web[1], dans les traitements de texte / messageries, traducteurs, orthographe voire - rêvons un peu - grammaire...) ?

    [1] http://linuxfr.org//2008/02/08/23666.html c'est Hunspell maintenant dans Firefox, OOo...
    • [^] # Re: c'est l'époque

      Posté par . Évalué à 3.

      Cet outil me semble très bien, par contre l'interface n'est pas extrêmement sexy (c'est Tkinter apparemment)

      De plus, ce qui manque dans ces formats de fichier, c'est de pouvoir entrer le genre des noms, et d'indiquer également si le mot est un verbe, un nom, un adjectif, un adverbe...

      Je voulais justement réaliser un dictionnaire pour utiliser avec stardic, du coup je vais essayer de voir ce que je peux faire avec linguae.

      J'ai réalisé un PKGBUILD pour archlinux :

      http://aur.archlinux.org/packages.php?ID=26937

      Only wimps use tape backup: real men just upload their important stuff on megaupload, and let the rest of the world ~~mirror~~ link to it

      • [^] # Re: c'est l'époque

        Posté par (page perso) . Évalué à 3.

        J'ai réalisé un PKGBUILD pour archlinux :

        Ça marche pas, il me dit que mon python n'est pas configurer pour Tk

        « Rappelez-vous toujours que si la Gestapo avait les moyens de vous faire parler, les politiciens ont, eux, les moyens de vous faire taire. » Coluche

        • [^] # Re: c'est l'époque

          Posté par . Évalué à 2.

          oops, ok, je rajoute tk dans les dépendances.

          Only wimps use tape backup: real men just upload their important stuff on megaupload, and let the rest of the world ~~mirror~~ link to it

          • [^] # Re: c'est l'époque

            Posté par (page perso) . Évalué à 2.

            Ça marche maintenant, merci. C'est bête mais quand j'ai vu l'erreur, j'ai cherché un paquet lié à python mais pas à tk directement.

            « Rappelez-vous toujours que si la Gestapo avait les moyens de vous faire parler, les politiciens ont, eux, les moyens de vous faire taire. » Coluche

    • [^] # Re: c'est l'époque

      Posté par . Évalué à 6.

      Il faut distinguer les logiciels de lecture de dictionnaires d'une part et les dictionnaires numériques d'autre part.

      Une page recensant les logiciels existants pour lecture/édition de dictionnaires ?
      ... il y en a une sur le site du projet "Polyglotte" :
      [http://polyglotte.tuxfamily.org/doku.php?id=logiciels:dicos]

      Mais... "un logiciel de gestion de dictionnaire ne sert pas à grand chose sans dictionnaire..."

      "Internet fourmille de dictionnaires numériques, sous divers formats. Hélas, ils ne sont pas toujours faciles à dénicher, et les sites qui les hébergent ne sont pas toujours très clairs à comprendre." (extraits de l'aide de Linguae)

      Une page recensant les dictionnaires numériques français ou bilingues intégrant le français ?
      ... on en trouve une sur le site du projet "Polyglotte" :
      [http://polyglotte.tuxfamily.org/doku.php?id=donnees:dicos_bi(...)]

      La grande diversité des formats nécessite des outils de conversion... pour pouvoir utiliser des dictionnaires numériques avec le logiciel de son choix. Il reste du travail à abattre... mais parmi d'autres outils, Linguae rend bien des services de ce point de vue.

      Une page recensant les divers formats et les outils de conversion disponibles ?
      ... on en trouve une sur le site du projet "Polyglotte" :
      [http://polyglotte.tuxfamily.org/doku.php?id=logiciels:polygl(...)]

      Tout ceci est encore incomplet et imparfait... Mais dans ce vaste monde des dictionnaires numériques et des outils de lecture, édition, conversion, création de ces dictionnaires, une tentative de synthèse étaient nécessaires... Nous sommes preneurs de tout complément, amélioration... ou contribution.
      • [^] # Re: c'est l'époque

        Posté par (page perso) . Évalué à 6.

        Les dictionnaires ont été faits par des linguistes sans l'aide de l'informatique ou sans connaître suffisamment ses ressources, en particulier les bases de données et les notions de structuration y afférant. Je dois dire que wikitionnaire, s'il me plaît sur le principe, ne me plaît pas sur sa réalisation car sa structuration est bien insuffisante.
        La seule façon de progresser est d'unir les deux spécialités : informaticien et linguiste. Ce n'est pas facile, j'ai essayé plusieurs fois sans succès.

        J'ai ainsi été amené à tracer les grandes lignes d'un projet http://pjarillon.free.fr/eurolang/cetral-propos.fr.html dont la première étape est la constitution de dictionnaires de définition pour chacune des langues parlées en Europe.

        J'espère que ce projet soit la première étape de cet ambitieux projet.
  • # Bien !

    Posté par (page perso) . Évalué à 5.

    Ça a l'air très intéressant.
    Maintenant, j'ai envie d'une chose et besoin d'une autre

    1/ Des screenshots. J'ai envie de voir la tête que ça à, pour savoir si j'aurais le courage de tenter de l'essayer potentiellement. J'ai pas envie de quitter un dico qui marche et qui est acceptable pour un qui marche mais qui ne me parait pas du tout ergonomique.

    2/ Le support epwing et compagnie, car j'utilise des dicos japonais et coréens et que c'est la référence.

    En tout cas, merci pour cette dépêche !
    • [^] # Re: Bien !

      Posté par . Évalué à 5.

      1/ Copies d'écran : si j'ai le temps, j'en fais quelques-unes... disons d'ici 8 jours.
      2/ Peux-tu donner quelques précisions sur le support epwing ? Lien ? Que permet ce support pour ces langues asiatiques ? On pourrait transmettre ces infos au développeur de Linguae...

      Il me semble qu'au niveau des polices, ce logiciel prend déjà en charge beaucoup de choses. Mais epwing permet peut-être d'autres fonctionnalités ?
      • [^] # Re: Bien !

        Posté par (page perso) . Évalué à 5.

        EPWING n'est décrit quasiment que sur des sites écrits en japonais et j'ai la flemme de traduire. J'ai trouvé néanmoins ce lien en anglais qui présente vite fait le truc : http://www.hloeffler.info/epwing/epwing_format.html

        D'une manière générale, les dictionnaires électroniques au Japon utilisent ce format. Les logiciels (libres) comme ebview ou kanjidic le lisent aussi. Et comme le marché du dictionnaire électronique au Japon est *très* répandu, gérer ce standard est une condition sine qua non pour paraître sérieux vis-à-vis du japonais dans les logiciels linguistiques.
        • [^] # Re: Bien !

          Posté par . Évalué à 1.

          Merci pour ces précisions. Je vois que les paquets ebview et kanjidic sont disponibles dans les dépôts Ubuntu, ainsi que gjiten, qui peut utiliser kanjidic (et le dictionnaire japonais-anglais edict).

          Ebview :
          "ebview is an EPWING CD-ROM dictionary viewer using libeb. It uses libeb and supports EPWING format. It can read multiple dictionary at same time and can search words on X11 cut-buffer automatically."
          La dernière mise à jour de ebview aura bientôt 5 ans.
          [http://sourceforge.net/projects/ebview]

          Gitjen : gjiten is a Japanese dictionary for the Gnome Desktop. It also has a kanji dictionary; any combination of stroke number, radicals and search key can be used for kanji lookups. Requires dictionary files in edict format and a working X Input Method (e.g. kinput2) for Japanese input.

          Les interfaces de Gitjen et Ebview ne semblent pas être traduites en français (je les ai en anglais). Je vois que dans /usr/share/gjiten/dics, les fichiers "edict" et "kanjidic" n'ont pas d'extension. Ces fichiers sont-ils des exemples de dictionnaires respectant les standard du format epwing. Pour aller plus loin, il faudrait trouver une documentation assez complète, en anglais, sur les spécifications du standard epwing.

          Sais-tu si StarDict, logiciel libre de lecture de dictionnaires, gère le format epwing ?

          P.S. : un autre lien utilse :
          [http://www.ici-japon.com/cours_japonais/divers/le-japonais-a(...)]
  • # Copies d'écran

    Posté par . Évalué à 2.

    J'avais promis quelques copies d'écran. Les voici :
    [http://polyglotte.tuxfamily.org/doku.php?id=logiciels:polygl(...)]
  • # la paranoïa de Freelang

    Posté par . Évalué à 2.

    Ce logiciel sous licence libre CeCILL a aussi pour objectif de permettre à des auteurs de dictionnaires informatiques de garder la maîtrise de leur travail, grâce à ses fonctionnalités simples de création, de modification, de conversion et de cryptage, à l'inverse de ce que proposent certains outils similaires dans le monde des logiciels propriétaires.

    Garder la maîtrise de son travail: tu ne crois pas si bien dire [http://www.freelang.com/dictionnaire/dic-copyrights.html]. À lire la licence de Freelang, on en vient à se demander si les auteurs des dictionnaires ont le droit de distribuer leur œuvre sous un autre format que le *.wb. Elle n'est pas seulement compliquée, elle est carrément paranoïaque. À un tel point qu'elle ne veut plus dire grand-chose. N'importe quelle personne un peu calé en droit pourrait rapidement la mettre en pièces. Trop d'articles se contredisent, trop d'expressions sont ambigües. L'exemple le plus frappant est l'utilisation répétée de « le dictionnaire Freelang », dont on ne sait jamais si ce terme désigne le logiciel lui même ou les dictionnaires qu'il peut accueillir.

    J'ai l'impression que les utilisateurs et pire les auteurs des dictionnaires, n'ont pas pris conscience du peu de liberté que le créateur de Freelang a bien voulu leur accorder. Si tel avait été le cas, le nombre de dictionnaires proposé serait famélique. Lisez toujours un contrat avant d'en accepter les conditions. Si vous ne le comprenez pas, passez votre chemin.

    Alors préférez (Q)Stardict pour la lecture des dictionnaires numériques, et Linguae pour leur édition, qui eux sont vraiment libres et en vous prendront pas en traitre. Pour ne rien gâcher, ils sont mieux conçus que Freelang.

Suivre le flux des commentaires

Note : les commentaires appartiennent à ceux qui les ont postés. Nous n'en sommes pas responsables.