Liens connexes

Dépêche modérée par

Dépêche éditée par

: Le libre et les mémoires de traduction

Posté par lejocelyn (). Modéré le 03 mars 2008.
1
Dans le monde de la traduction professionnelle, vous savez, les gens qui vous produisent des notices tellement bien écrites que, si vous avez le choix, vous préférez les lire en anglais, eh bien dans ce monde-là, il existe un outil intéressant (en fait, il y en a plusieurs, mais l'article se concentre sur l'un d'eux) : la mémoire de traduction.

Contrairement à ce que son nom pourrait suggérer, il s'agit bien d'un logiciel. Celui-ci permet aux traducteurs d'enregistrer au format TMX, un format XML standardisé et ouvert, la concordance entre un segment dans une langue source et un segment dans une langue cible.

Décrit ainsi, cela ne semble pas vraiment intéressant ? Vous vous demandez peut-être ce que cela apporte par rapport aux bibliothèques Gettext (NdM : voir les entrées Fuzzy ) ? Vous ne voyez pas en quoi cela aide un traducteur ?

Eh bien, lisez le reste de l'article.

Le système que je propose, Mémoires Libres, est utilisable dès à présent, il n'attend que des contributeurs et c'est le but de cette dépêche que d'en trouver. Bien sûr, je vais aussi contacter les listes de diffusion liées à la traduction de logiciels libres. N'hésitez pas à critiquer le projet, que ce soit au niveau du site Web, de son organisation ou autre chose, ça lui permettra d'avancer.

NdM : KBabel et POedit disposent aussi d'outils de recherche dans des dictionnaires de chaînes traduites. Le projet KAider (devenu Lokalize) ainsi que la présentation ci-dessous montrent ce qu'apportent des mémoires de traduction en plus.

> Lire la suite (12 commentaires, moyenne: 2,3).   [dépêche : 5659 caractères]

La mémoire de traduction est une interface qui enregistre dans un fichier chacune des correspondances que l'utilisateur établit lors de la traduction. La mémoire inscrit dans un fichier qu'un segment dans telle langue correspond à tel segment dans une autre langue.

En quoi cela aide-t-il le traducteur ? Lors de la traduction de son texte, la mémoire enregistre chaque concordance dans un fichier TMX et à chaque fois que le traducteur aborde un nouveau segment, la mémoire regarde dans les fichiers TMX s'il existe des traductions similaires, elle précise (à l'aide d'un taux) le degré de similitude entre les segments sources. Le traducteur sait donc comment il a traduit le (ou les) segment(s) similaire(s) et connaît les termes ou la tournure de phrase utilisés précédemment et la typographie employée.

Cependant, un traducteur, en particulier dans le monde du libre, ne travaille pas seul et l'un des intérêts des mémoires de traduction, c'est qu'elles permettent à une ou plusieurs équipes de traducteurs de collaborer. Ainsi, la mémoire de traduction conserve les choix de traduction (typographie, la phraséologie, la terminologie, les options, unités de mesure et sigles par exemple) dans les fichiers TMX et fournit un moyen de les partager au sein des équipes de traduction.

Un autre intérêt des mémoires de traduction est l'accumulation des fichiers TMX afin d'avoir accès lors de la traduction à un large panel de concordances. Par le biais d'un dépôt entreposant les fichiers TMX, le traducteur (ou l'équipe de traducteurs) possède un stock de concordances qui lui permet, à chaque fois qu'il aborde un nouveau projet (que ce soit un logiciel, une documentation, un site Web), de ne pas retraduire mais au contraire de s'inspirer de ce qui a déjà été fait.

J'espère qu'à ce stade, vous entrevoyez les possibilités dans le monde du logiciel libre. Il existe deux mémoires de traduction libres, à ma connaissance, l'une est OmegaT, un logiciel en Java (fonctionnant avec IcedTea), l'autre étant Lokalize (anciennement Kaider). OmegaT est celui que je connais le mieux, étant donné qu'il existe depuis quelques années et l'ayant déjà utilisé. C'est un logiciel stable, pratique et dont l'interface est plutôt simple lorsque le concept de mémoire de traduction est connu. C'est un logiciel à part entière (certaines mémoires de traduction sont intégrées dans l'interface de Word), il permet d'importer plusieurs fichiers TMX à la fois, de ne modifier que les caractères du texte et non sa mise en page, de faire une couche d'abstraction entre les formats de fichier à traduire et le fichier TMX par le biais d'un système de filtre. Cela permet d'utiliser ses fichiers TMX avec divers formats et donc une meilleure réutilisation de celles-ci.

Concernant Lokalize, je ne l'ai pas encore testé, celui-ci n'étant pas encore en version stable à ma connaissance, il semble cependant prometteur.

Maintenant que vous connaissez un peu les concepts, voyons l'application que je propose.
L'idée est d'avoir un système qui permette de partager et de gérer les fichiers TMX libres. Les problèmes sont multiples, licences différentes (la traduction d'un document devant avoir la même licence que le document source), gestion des contextes (une traduction n'ayant de sens que dans un certain contexte, un autre contexte aurait possiblement entraîné une autre traduction), gestion des langues bien-sûr :), et, évidemment, tous les problèmes liés à la gestion d'une communauté, communication, rapport d'erreurs et demande. J'ai donc mis en place un site afin de présenter le projet, un dépôt Subversion pour gérer les fichiers TMX et le gestionnaire de tâches Flyspray, il y a aussi des listes de diffusion.

Le format TMX et les mémoires de traduction ne gérant pas encore d'elles-mêmes la contextualisation des segments (c'est-à-dire un système de balises qui permettrait par exemple d'indiquer : ce segment a pour contexte la traduction de l'interface d'un navigateur Web), il me fallait penser à une solution dans mon coin et rapporter ce problème en amont en espérant qu'il soit pris en considération. Une interface PHP/Python/base de données avec une gestion des balises pourrait résoudre le problème mais préférant avoir quelque chose de rapidement utilisable (mes compétences en développement ne sont que naissantes), j'ai simplement crée un système de dossiers pour trier les fichiers TMX par domaine puis par projet. Ainsi un traducteur pourra facilement retrouver tous les fichiers TMX liés à un même domaine, il devra en revanche faire davantage d'efforts pour trouver les mémoires d'un même projet (KDE, GNOME).

Les objectifs de ce projet sont divers et ambitieux, tout d'abord aider la traduction des logiciels libres afin qu'elle soit plus rapide et permettre d'harmoniser les traductions entre les divers projets ; arrêter de voir sur les listes de diffusion des traducteurs de logiciels libres toujours les mêmes questions sur des termes, typographies et autres questions que les mémoires de traduction résoudraient naturellement. Sur le long terme, donner la possibilité aux distributions de choisir leur traduction, par le biais d'une gestion poussée des fichiers TMX, permettre à différents projets, tels que GNOME et KDE, d'harmoniser leurs traductions. Il est même possible qu'un jour des traductions soient l'objet de recommandations par Freedesktop, ceci afin d'améliorer l'accessibilité.

Cette discussion est archivée, il n'est plus possible de laisser des commentaires.

Note : les commentaires appartiennent à ceux qui les ont postés. Nous n'en sommes pas responsables.

bon article, mais le langage...

Posté par olivierweb (page perso, ) le 03/03/2008 à 09:28. (lien). Évalué à 4.

Merci pour cet article qui répond à ces questions que je me posais concernant TMX et KAider (devenu Lokalize ce que je ne savais pas).

In fine, si j'ai bien tout suivi, ce système c'est un KBabel collaboratif avec
* collaboration des traductions,
* partage de la mémoire
* moteur d'analyse linguistique.

En effet, KBabel dispose déjà d'une mémoire des traductions, affiche le taux de concordance, traduit si demandé ces concordances.

Pour ce qui est du projet, ça me semble vraiment intéressant.

Par contre, la définition des contextes sera sans doute un sujet à controverse : pourquoi le "Copier" du navigateur serait différent de celui du traitement de texte ou du gestionnaire de fichier ?

En tout cas, je pense que ce sujet (si ce n'est ce projet) est important pour permettre le développement des logiciels (libres) dans le monde non anglophone.

<aparté sur le langage>
Pour une fois, je vais me plaindre du niveau de langage. Ce texte est sensé être un article pas une pseudo discussion.
A-t-on gardé les cochons ensembles ? Les tournures de phrase m'ont choqué :

..., vous savez,...
...tellement bien écrites que, si vous avez le choix, ...
...eh bien...

En définitive, la première phrase est un peu difficile à lire.

...but... => objet
...ce qu'apportent des mémoires de traduction en plus... => ce qu'apportent en plus des mémoires de traduction
</langage>

Il n'y a pas encore de mémoires

Posté par lejocelyn () le 03/03/2008 à 10:25. (lien). Évalué à 2.

Je tiens à le préciser ici, il n'y a pas encore de mémoires TMX sur le SVN, je suis en train d'en faire mais les seules mémoires de traduction à ma disposition étaient issues de textes non-libres. Je ne voulais pas traduire sans mémoires, j'ai donc mis en place ce système et maintenant je commence à traduire (le client du jeu TA Spring : SpringLobby, je ferai un article sur ce jeu de stratégie méconnu.)

Note sur les notices

Posté par Perthmâd (Jabber id, page perso, ) le 03/03/2008 à 15:55. (lien). Évalué à 2.

Je ne suis pas d'accord : les notices en anglais sont assez souvent particulièrement gratinées (cf. par exemple http://www.engrish.com/ ), et peuvent représenter de véritables chefs-d'œuvre de l'absurde, des manifestes involontaires du surréalisme à l'orientale.

Au point qu'il vaut mieux les lire directement en 普通话 ou en にっぽんご!

Et pas que les notices, j'étais tombé un jour sur une page de man complètement incompréhensible de la main d'un noble codeur nippon. (Je ne retrouve malheureusement pas le nom du programme...)

L'i18n, mangézan™!

Déjà fait ?

Posté par olivierweb (page perso, ) le 03/03/2008 à 17:36. (lien). Évalué à 2.

En lisant la page en anglais ( http://en.wikipedia.org/wiki/Translation_memory#Freeware_2 ), je suis tombé sur http://mymemory.translated.net/, ton projet ne serait-il pas un doublon de celui-ci (mais en libre) ?

Traduction hors contexte ?

Posté par pshunter () le 03/03/2008 à 18:36. (lien). Évalué à 2.

Le contexte d'une traduction peut être particulièrement complexe. Je tiens à partager ici une perle, trouvée dans un antique logiciel de gravure de CD-ROM.

Le logiciel indiquait :

« Écrire l'état du tampon »

Qui était une traduction correcte, dans l'absolu, de :

« Write buffer status »

Mais la bonne traduction était :

« État du tampon d'écriture »

Est-ce qu'un système tel qu'il est proposé ici pourrait corriger ce genre d'erreurs ? Sans voir le contexte (boîte de dialogue de gravure) dans lequel le texte est présenté à l'utilisateur, comment le traducteur peut-il trouver la bonne traduction ?

Revenir en haut de page