Faire un don ! | | style | statistiques | contactez-nous | plan | lettre d'information

: Apertium français-espagnol 0.8.0 vient de sortir

Posté par Youssef Oualmakran (page perso, ). Modéré le 07 mars 2008.
Le monde du logiciel libre ne compte que très peu de solutions de traduction automatique :
  • OpenLogos, projet peu actif ;
  • Moses, qui réalise des traductions automatiques basées sur des statistiques ;
  • Apertium, projet en GPL reposant sur une communauté active.

Apertium est une plateforme de traduction automatique libre et d'outils linguistiques conçue initialement pour des langues proches, comme par exemple la paire catalan - espagnol. La version 0.8.0 de la paire français-espagnol est sortie le 21 février 2008. Cette paire a bénéficié du soutien de l'entreprise Eleka Ingeniaritza Linguistikoa et a été développée par Prompsit.

> Lire la dépêche (9 commentaires, moyenne: 2,6).  

Vous avez demandé le commentaire #912248.

Synergies avec d'autres projets libres?

Posté par djano () le 10/03/2008 à 18:30. (lien). Évalué à 3.

Dites mois si je me trompe, mais en regardant cette page [1], ainsi que son équivalent anglais, il me semble que contribuer à une paire de langues existante revient a refaire une partie du travail réalisé dans un dictionnaire orthographique (notamment celui qui consiste a éliminer les doublons) en l'enrichissant des correspondances qui existent entre les termes des deux langues.

Si vous ne voyez pas de quoi je parle avec le dictionnaire d'orthographe, vous pouvez regarder cette discussion très intéressante qui explique comment c'est fait [2].
Vous pouvez aussi aller jeter un coup d'oeil sur le projet Dicollecte[1] qui vise à améliorer les dictionnaires orthographiques français pour OpenOffice.org et pour Firefox, Thunderbird et Seamonkey.

Donc je me demandais s'il ne serait pas possible pour ces projets de réutiliser des données?

Par ailleurs, je pense qu'Apertium doit disposer d'une compréhension de la grammaire de chaque langue, il semble naturel de penser qu'il soit possible de travailler de concert avec Language Tool pour construire des données ensemble et essayer de s'améliorer mutuellement?

[1] http://xixona.dlsi.ua.es/wiki/index.php/Comment_contribuer_%(...)
[2] https://linuxfr.org//comments/903125.html#903125
[3] http://dico.savant.free.fr

  • [^]Re: Synergies avec d'autres projets libres?

    Posté par Youssef Oualmakran (page perso, ) le 11/03/2008 à 14:51. (lien). Évalué à 1.

    Je vous invite à regarder ma réponse http://linuxfr.org/2008/03/07/23811.html#912480 pour une explication sur l'organisation des données linguistiques d'Apertium. Je vais apporter quelques compléments. Le problème des correcteurs orthographiques, c'est que la plupart ne contiennent pas d'information grammaticales, pas de paradigmes. C'est-à-dire que la conjugaison des verbes, les pluriels des noms, le féminin des adjectifs n'y sont pas présentes. Pour ceux qui contiennent des informations, il faudrait trouver des bénévoles pour convertir le format des paradigmes de correcteurs dans le format propre à Apertium.
    Ajouter des informations grammaticales et des règles de transfert demandent du temps.
    Pour ce qui est de la réutilisation des données d'Apertium qui sont en GPL, des idées sont déjà avancées par les développeurs d'Apertium notamment pour le « Google Summer Code ». http://xixona.dlsi.ua.es/wiki/index.php/Ideas_for_Google_Sum(...) La réutilsation de « language tool » se trouve sur la page concernant le Google Summer Code dans la section « Generating grammar checkers ».

    En résumé, Apertium recherche des personnes désireuses d'ajouter les fameux paradigmes et les règles de transfert.