Articles : Apertium français-espagnol 0.8.0 vient de sortir
Posté par Youssef Oualmakran (page perso, ). Modéré le 07 mars 2008.
Le monde du logiciel libre ne compte que très peu de solutions de traduction automatique :
Apertium est une plateforme de traduction automatique libre et d'outils linguistiques conçue initialement pour des langues proches, comme par exemple la paire catalan - espagnol. La version 0.8.0 de la paire français-espagnol est sortie le 21 février 2008. Cette paire a bénéficié du soutien de l'entreprise Eleka Ingeniaritza Linguistikoa et a été développée par Prompsit.
- OpenLogos, projet peu actif ;
- Moses, qui réalise des traductions automatiques basées sur des statistiques ;
- Apertium, projet en GPL reposant sur une communauté active.
Apertium est une plateforme de traduction automatique libre et d'outils linguistiques conçue initialement pour des langues proches, comme par exemple la paire catalan - espagnol. La version 0.8.0 de la paire français-espagnol est sortie le 21 février 2008. Cette paire a bénéficié du soutien de l'entreprise Eleka Ingeniaritza Linguistikoa et a été développée par Prompsit.
Capture d'écran (445 hits)
Page officielle d'Apertium (288 hits)
Le wiki d'Apertium (101 hits)
Tester Apertium (194 hits)
Moses (89 hits)
OpenLogos (93 hits)
> Lire la dépêche (9 commentaires, moyenne: 2,6).
Vous avez demandé le commentaire #911802.




pratique
La traduction français espagnol me semble de bonne facture
http://xixona.dlsi.ua.es/apertium-unstable/navegador.php?mar(...)
Dommage que linuxes.org soit parqué cela aurait été l'occasion de diffuser notre site francophone préféré en une autre langue que le 1337 :-)
Pour ceux qui se disent, tiens c'est dommage pour un outil de traduction qu'il ne soit pas en français par défaut, il est bien disponible : http://xixona.dlsi.ua.es/apertium-unstable/fr
(tenir compte de la langue du navigateur et d'un cookie de la dernière langue sélectionnée par l'utilisateur pourrait être une amélioration sympathique ; par ailleurs toutes les paires n'apparaissent pas, bizarre :/ et il y a une petite typo dans le titre).
Je n'ai pas encore essayé le client, mais la traduction en ligne est d'ores et déjà dans mes signets http://wiki.eagle-usb.org/wakka.php?wiki=SemantiqueEtLangue (aux côtés de sensmotdire et shtooka, projets libres pour la conjugaison et la prononciation des verbes irréguliers).
Il est possible de suivre l'avancement avec le nombre de lemmes[1] par langue http://xixona.dlsi.ua.es/wiki/index.php/List_of_language_pai(...)
Il y a même l'esperanto : une idée pourrait être de systématiquement proposer l'esperanto comme langue cible, ce qui permettrait de toujours disposer d'une traduction lisible pour les sites web (bon faut se mettre à l'esperanto aussi...).
[1] http://fr.wikipedia.org/wiki/Lemme_(linguistique)
[^]Re: pratique
Merci pour le commentaire.
J'ai demandé que l'on corrige l'erreur d'orthographe qui vient dêtre faite. Apertium a la chance de compter parmi ces contributeurs un développeur très actif et dévoué.
En ce qui concerne l'auto-selection de la langue d'après les préférences du navigateur, elle devrait être ajoutée dans l'interface web qui devrait être ré-ecrite.
Au fait, vous pouvez contacter les développeurs sur le canal #apertium du serveur Freenode accessible via l'interface web http://xixona.dlsi.ua.es/cgi-bin/cgiirc/irc.cgi
[^]Re: pratique
Français-espagnol et espagnol-français viennent d'être ajoutés à http://xixona.dlsi.ua.es/apertium-unstable/fr/ et à http://xixona.dlsi.ua.es/apertium/fr/
[^]Re: pratique
Fort intéressant !
Dans quelle mesure (et avec quelle facilité ) on peut rajouter Catalan - Français ? (Oui, je suis à Barcelone )
[^]Re: pratique
Autant pour moi, il y est déjà dans la liste !
Merci beaucoup pour me faire découvrir cet outil!
[^]Re: pratique
> Il est possible de suivre l'avancement avec le nombre de lemmes[1] par langue
> http://xixona.dlsi.ua.es/wiki/index.php/List_of_language_pai(...)
> Il y a même l'esperanto : une idée pourrait être de systématiquement proposer
> l'esperanto comme langue cible, ce qui permettrait de toujours disposer d'une
> traduction lisible pour les sites web (bon faut se mettre à l'espéranto aussi...).
Oui, dommage qu'il n'y ait pas le couple fr<->eo et en général peu de couples avec EO pour l'instant, d'autant qu'il existe déjà des "traducteurs automatiques" chez http://lingvo.org/traduku/ , des dictionnaires (http://fr.Lernu.net/ , http://www.retavortaro.de/ , ... ) la base de lemmes est disponible.
[^]Re: pratique
Je vais d'abord expliquer brièvement l'organisation des données linguistiques.
Elles sont réparties en cinq fichiers XML
- un dictionnaire monolingue pour la langue source de la traduction. Ce dictionnaire comporte la liste des mots et le paradigme correspondant. Je m'explique, par exemple pour « chanter », les contributeurs ne vont pas indiquer toute la conjugaison, mais simplement dire que « chanter » se conjugue comme « aimer ». « aimer » est donc le paradigme de « chanter » et bien sûr aussi de « rouler », « donner », « danser », etc.
Les paradigmes contiennent des informations sur la morphologie des mots c'est-à-dire quelles sont les terminaisons des verbes, des noms, des adjectifs, etc selon qu'ils soient au singulier, pluriel, à la première personne, etc
- idem pour la langue cible de la traduction
- un dictionnaire bilingue qui associe un mot de la langue source et sa traduction dans la langue cible.
- des règles de transfert pour passer de la langue source à la langue cible. Ce sont en quelques sortes, les règles de grammaire.
- idem mais pour traduire en inversant la langue source et la langue cible.
Les dictionnaires monolingues sont déjà disponibles pour l'espéranto, l'anglais, le français et peuvent donc être réutilisés.
Pour les dictionnaires bilingues on peut se baser sur des outils automatiques disponibles dans Apertium pour les générer. Un exemple sera plus clair. Les pairs espagnol-espéranto espagnol-français existent.
Nous avons donc quelque part dans les dictionnaires bilingues d'Apertium (de manière schématique) « perro --> hundo » et « perro --> chien ». L'outil « crossdic » va générer automatiquement « hundo--> chien ».
Conclusion, se sont les règles de transferts qui sont les plus ardues. Mais des développeurs sont près à vous aider par email (https://lists.sourceforge.net/lists/listinfo/apertium-stuff) ou par irc. (http://xixona.dlsi.ua.es/cgi-bin/cgiirc/irc.cgi)
Les contributeurs pour la paire espéranto-français sont les bienvenues.