Les fonctionnalités d'édition de dictionnaires qu'offre Linguae sont actuellement sans égales à notre connaissance dans le domaine, au moins parmi les logiciels à code ouvert. Ce logiciel sous licence libre CeCILL a aussi pour objectif de permettre à des auteurs de dictionnaires informatiques de garder la maîtrise de leur travail, grâce à ses fonctionnalités simples de création, de modification, de conversion et de cryptage, à l'inverse de ce que proposent certains outils similaires dans le monde des logiciels propriétaires.
Développé en Python par Billig depuis août 2008, Linguae, bien qu'encore en version alpha, est déjà très fonctionnel. Linguae est un logiciel associé au projet "Polyglotte". Formats de dictionnaires actuellement supportés en lecture, écriture (édition du contenu) et conversion d'un format à l'autre :
- *.ling (format binaire Linguae)
- *.dict (format binaire StarDict)
- *.xdxf (format texte xml)
- *.wb (format binaire à champs de longueur fixe)
- *.ini (format texte des fichiers d'initialisation)
- *.csv, *.tab, *.txt (fichiers texte délimités)
Linguae accepte des greffons ("plug-ins”) sous la forme de modules Python utilisant un interfaçage logiciel simple. Les greffons sont destinés à apporter des fonctionnalités propres à une langue ou un groupe de langues ou de dictionnaires. Un seul greffon est pour le moment disponible : Declinator (déclinaisons, conjugaisons et traductions à partir d'un dictionnaire Latin à codage grammatical compatible), également libre (CeCILL). La création de nouveaux greffons est souhaitée.
Caractéristiques :
- Logiciel libre sous licence CeCILL
- Version courante : 0.0.25 Alpha (01/06/2009)
- Compatible multi-plateforme
- Compatible avec divers formats de dictionnaires, en lecture et en édition.
- Capacité multi-utilisateur sur ordinateur partagé (potentialité variable suivant la plateforme).
Lecture des dictionnaires :
- Lecture en format natif des divers formats supportés.
- Module d'aide à la traduction, utilisable quel que soit le dictionnaire.
- Gestion de relations internes entre les entrées (si le format le permet).
Édition du contenu des dictionnaires :
- Modification des entrées (entrée et notice).
- Ajout de nouvelle entrées.
- Déplacement libre des entrées dans le dictionnaire.
- Suppression d'entrées.
- Table de caractère Unicode intégrée.
- Édition des propriétés (métadonnées) du dictionnaire pour les formats le permettant.
- Tri paramétrable des dictionnaires.
- Ajout ou modification du contenu audio directement par l'interface.
- Association d'images gif aux entrées.
Gestion des dictionnaires :
- Création de nouveaux dictionnaires vides.
- Chemin de recherche et chemin du fichier de stockage principal paramétrables
- Création automatique de dictionnaires inverses.
- Croisement de dictionnaires (L1/L2 x L2/L3 -> nouveau dictionnaire L1/L3)
- Exportation des dictionnaires vers divers formats.
- Importation au format texte (CSV ou format texte dédié).
Recherche dans les dictionnaires :
- Recherche dans les entrées ou les notices ou les deux associées.
- Recherche des entrées "à la volée" en tapant le début du mot.
- Recherche itérative dans les entrées et les notices avec insensibilité optionnelle aux ligatures (avec ou sans sensibilité à la casse).
Interface :
- Interface redimensionnable
- Transparence réglable (inactif sur certaines plateformes).
- Affichage récursif du dossier de stockage dans un menu déroulant "Dictionnaires"
- Polices d'affichage paramétrables (indépendamment pour la liste d'entrées et la notice)
- Mémorisation de la taille et de la position de la fenêtre d'une utilisation à l'autre.
- Réouverture automatique du dernier dictionnaire ouvert.
- Réouverture automatique du dernier greffon ouvert.
Divers :
- Possibilité d'utiliser des greffons ("plug-ins")
- Recherche automatique de l'existence d'une nouvelle version.
Aller plus loin
- Linguae (291 clics)
- Polyglotte (projet associé) (105 clics)
- Declinator (greffon) (66 clics)
# c'est l'époque
Posté par BAud (site web personnel) . Évalué à 2.
- Dernièrement ce journal http://linuxfr.org/~cram51/28331.html Omnidic : traducteur pour téléphone portable sur mesures
- Un peu avant cette dépêche http://linuxfr.org/2009/05/21/25498.html Apertium intègre le premier traducteur automatique breton-français
Les dictionnaires sont-ils vraiment partagés ? Peut-être existe-t-il une page recensant les dictionnaires existants (sachant que ça peut servir dans le navigateur web[1], dans les traitements de texte / messageries, traducteurs, orthographe voire - rêvons un peu - grammaire...) ?
[1] http://linuxfr.org//2008/02/08/23666.html c'est Hunspell maintenant dans Firefox, OOo...
[^] # Re: c'est l'époque
Posté par B16F4RV4RD1N . Évalué à 3.
De plus, ce qui manque dans ces formats de fichier, c'est de pouvoir entrer le genre des noms, et d'indiquer également si le mot est un verbe, un nom, un adjectif, un adverbe...
Je voulais justement réaliser un dictionnaire pour utiliser avec stardic, du coup je vais essayer de voir ce que je peux faire avec linguae.
J'ai réalisé un PKGBUILD pour archlinux :
http://aur.archlinux.org/packages.php?ID=26937
Only wimps use tape backup: real men just upload their important stuff on megaupload, and let the rest of the world ~~mirror~~ link to it
[^] # Re: c'est l'époque
Posté par claudex . Évalué à 3.
Ça marche pas, il me dit que mon python n'est pas configurer pour Tk
« Rappelez-vous toujours que si la Gestapo avait les moyens de vous faire parler, les politiciens ont, eux, les moyens de vous faire taire. » Coluche
[^] # Re: c'est l'époque
Posté par B16F4RV4RD1N . Évalué à 2.
Only wimps use tape backup: real men just upload their important stuff on megaupload, and let the rest of the world ~~mirror~~ link to it
[^] # Re: c'est l'époque
Posté par claudex . Évalué à 2.
« Rappelez-vous toujours que si la Gestapo avait les moyens de vous faire parler, les politiciens ont, eux, les moyens de vous faire taire. » Coluche
[^] # Re: c'est l'époque
Posté par Sorbus . Évalué à 6.
Une page recensant les logiciels existants pour lecture/édition de dictionnaires ?
... il y en a une sur le site du projet "Polyglotte" :
[http://polyglotte.tuxfamily.org/doku.php?id=logiciels:dicos]
Mais... "un logiciel de gestion de dictionnaire ne sert pas à grand chose sans dictionnaire..."
"Internet fourmille de dictionnaires numériques, sous divers formats. Hélas, ils ne sont pas toujours faciles à dénicher, et les sites qui les hébergent ne sont pas toujours très clairs à comprendre." (extraits de l'aide de Linguae)
Une page recensant les dictionnaires numériques français ou bilingues intégrant le français ?
... on en trouve une sur le site du projet "Polyglotte" :
[http://polyglotte.tuxfamily.org/doku.php?id=donnees:dicos_bi(...)]
La grande diversité des formats nécessite des outils de conversion... pour pouvoir utiliser des dictionnaires numériques avec le logiciel de son choix. Il reste du travail à abattre... mais parmi d'autres outils, Linguae rend bien des services de ce point de vue.
Une page recensant les divers formats et les outils de conversion disponibles ?
... on en trouve une sur le site du projet "Polyglotte" :
[http://polyglotte.tuxfamily.org/doku.php?id=logiciels:polygl(...)]
Tout ceci est encore incomplet et imparfait... Mais dans ce vaste monde des dictionnaires numériques et des outils de lecture, édition, conversion, création de ces dictionnaires, une tentative de synthèse étaient nécessaires... Nous sommes preneurs de tout complément, amélioration... ou contribution.
[^] # Re: c'est l'époque
Posté par Pierre Jarillon (site web personnel) . Évalué à 6.
La seule façon de progresser est d'unir les deux spécialités : informaticien et linguiste. Ce n'est pas facile, j'ai essayé plusieurs fois sans succès.
J'ai ainsi été amené à tracer les grandes lignes d'un projet http://pjarillon.free.fr/eurolang/cetral-propos.fr.html dont la première étape est la constitution de dictionnaires de définition pour chacune des langues parlées en Europe.
J'espère que ce projet soit la première étape de cet ambitieux projet.
# Bien !
Posté par Axioplase ıɥs∀ (site web personnel) . Évalué à 5.
Maintenant, j'ai envie d'une chose et besoin d'une autre
1/ Des screenshots. J'ai envie de voir la tête que ça à, pour savoir si j'aurais le courage de tenter de l'essayer potentiellement. J'ai pas envie de quitter un dico qui marche et qui est acceptable pour un qui marche mais qui ne me parait pas du tout ergonomique.
2/ Le support epwing et compagnie, car j'utilise des dicos japonais et coréens et que c'est la référence.
En tout cas, merci pour cette dépêche !
[^] # Re: Bien !
Posté par Sorbus . Évalué à 5.
2/ Peux-tu donner quelques précisions sur le support epwing ? Lien ? Que permet ce support pour ces langues asiatiques ? On pourrait transmettre ces infos au développeur de Linguae...
Il me semble qu'au niveau des polices, ce logiciel prend déjà en charge beaucoup de choses. Mais epwing permet peut-être d'autres fonctionnalités ?
[^] # Re: Bien !
Posté par Axioplase ıɥs∀ (site web personnel) . Évalué à 5.
D'une manière générale, les dictionnaires électroniques au Japon utilisent ce format. Les logiciels (libres) comme ebview ou kanjidic le lisent aussi. Et comme le marché du dictionnaire électronique au Japon est *très* répandu, gérer ce standard est une condition sine qua non pour paraître sérieux vis-à-vis du japonais dans les logiciels linguistiques.
[^] # Re: Bien !
Posté par Sorbus . Évalué à 1.
Ebview :
"ebview is an EPWING CD-ROM dictionary viewer using libeb. It uses libeb and supports EPWING format. It can read multiple dictionary at same time and can search words on X11 cut-buffer automatically."
La dernière mise à jour de ebview aura bientôt 5 ans.
[http://sourceforge.net/projects/ebview]
Gitjen : gjiten is a Japanese dictionary for the Gnome Desktop. It also has a kanji dictionary; any combination of stroke number, radicals and search key can be used for kanji lookups. Requires dictionary files in edict format and a working X Input Method (e.g. kinput2) for Japanese input.
Les interfaces de Gitjen et Ebview ne semblent pas être traduites en français (je les ai en anglais). Je vois que dans /usr/share/gjiten/dics, les fichiers "edict" et "kanjidic" n'ont pas d'extension. Ces fichiers sont-ils des exemples de dictionnaires respectant les standard du format epwing. Pour aller plus loin, il faudrait trouver une documentation assez complète, en anglais, sur les spécifications du standard epwing.
Sais-tu si StarDict, logiciel libre de lecture de dictionnaires, gère le format epwing ?
P.S. : un autre lien utilse :
[http://www.ici-japon.com/cours_japonais/divers/le-japonais-a(...)]
# Copies d'écran
Posté par Sorbus . Évalué à 2.
[http://polyglotte.tuxfamily.org/doku.php?id=logiciels:polygl(...)]
# la paranoïa de Freelang
Posté par galereman . Évalué à 2.
Garder la maîtrise de son travail: tu ne crois pas si bien dire [http://www.freelang.com/dictionnaire/dic-copyrights.html]. À lire la licence de Freelang, on en vient à se demander si les auteurs des dictionnaires ont le droit de distribuer leur œuvre sous un autre format que le *.wb. Elle n'est pas seulement compliquée, elle est carrément paranoïaque. À un tel point qu'elle ne veut plus dire grand-chose. N'importe quelle personne un peu calé en droit pourrait rapidement la mettre en pièces. Trop d'articles se contredisent, trop d'expressions sont ambigües. L'exemple le plus frappant est l'utilisation répétée de « le dictionnaire Freelang », dont on ne sait jamais si ce terme désigne le logiciel lui même ou les dictionnaires qu'il peut accueillir.
J'ai l'impression que les utilisateurs et pire les auteurs des dictionnaires, n'ont pas pris conscience du peu de liberté que le créateur de Freelang a bien voulu leur accorder. Si tel avait été le cas, le nombre de dictionnaires proposé serait famélique. Lisez toujours un contrat avant d'en accepter les conditions. Si vous ne le comprenez pas, passez votre chemin.
Alors préférez (Q)Stardict pour la lecture des dictionnaires numériques, et Linguae pour leur édition, qui eux sont vraiment libres et en vous prendront pas en traitre. Pour ne rien gâcher, ils sont mieux conçus que Freelang.
Suivre le flux des commentaires
Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.