Journal Les joies infinies des moteurs de traduction automatiques

Posté par  (site web personnel) . Licence CC By‑SA.
Étiquettes :
2
11
fév.
2022

J'ai essayé de traduire le texte suivant (paroles d'une chanson de Girls against boys, trouvées ici https://www.lyricsmania.com/glazed-eye_lyrics_girls_against_boys.html (v)ia l'interface web trouvée là : https://www.deepl.com (en faisant un copier/coller du texte ; UTF-8 a priori)

Le terme "Glazed-eye" est traduit parfois par
- Œil de glace (le plus fréquemment)
- Glazed-Eye (la première fois ?)
- Œil de bœuf (peut-être induit par le doublement de l'o bouclé dans la réponse du robot, ou de mes coordonnées géographiques ?)

Ça donne pareil chez vous, dans la vieille Europe continentale ?
Connaitriez-vous un truc qui marche un peu mieux pour traduire sans se contredire deux minutes plus tard qu'une IA ? (no politics, please)
Et qui soit plus de linuxien dans l'esprit, bien sûr, KISS de préférence.
Merci d'avance, les moules !

  • # pareil

    Posté par  (site web personnel) . Évalué à 5.

    pareil sur le continent…
    C'est curieux, la traduction finit par se stabiliser, mais au début ça oscille alors que le contexte ne change pas puisque les paroles ne font que se répéter encore et encore.
    Si on clique sur "Informel" ça a l'air mieux (au moins on échappe à l'oeil de boeuf) mais c'est payant, on ne voit que le début.

    Est-ce que la traduction serait plutôt "oeil vitreux" ?

    Habituellement, je suis impressionné par DeepL, en particulier pour le langage technique. Mais pour le langage poétique, c'est sûr que ça n'est pas formidable.

  • # Pareil de mon côté

    Posté par  (Mastodon) . Évalué à 6.

    Mais je ne suis pas certain que c'est DeepL qui soit à critiquer.

    En effet, c'est étrange d'avoir le même terme traduit différemment mais glazed-eye n'est pas forcément facile à traduire. Il n'y a pas de traduction unique de ce terme, loin de là.

    Cette instabilité te permet de te rendre compte qu'il y a hésitation dans la traudction par DeepL et cela te permet de vérifier les alternatives proposées par DeepL comme traduction qui sont bien nombreuses et de choisir celle qui te semble la plus adéquate.

    By the way, si vous connaissez des alternatives libres (et on desktop), je suis aussi preneur.

    Surtout, ne pas tout prendre au sérieux !

  • # mes deux centimes

    Posté par  . Évalué à 10.

    J'aurai dit "regard vitreux" plutôt que œil.

  • # Traduction libre

    Posté par  . Évalué à 4. Dernière modification le 12 février 2022 à 11:33.

    Pas forcément plus efficace dans tous les cas, mais en bien plus libre il y a https://libretranslate.com/

  • # Traduction changeante

    Posté par  . Évalué à 1.

    Je suppose que le moteur de traduction génère un ensemble de traductions avec un score. Et lorsque le score n'est pas significatif, il propose de manière semi-aléatoire les meilleures traductions afin que l'utilisateur la valide.

    • [^] # Re: Traduction changeante

      Posté par  . Évalué à 5.

      Je ne pense pas, c'est plutôt que que le modèle utilise du contexte autour du mot qui dépasse la phrase courante. Comme le couplet change entre les refrains, alors la traduction peut changer.

  • # Du point de vue du traducteur humain...

    Posté par  . Évalué à 10. Dernière modification le 12 février 2022 à 16:03.

    Du point de vue du traducteur humain… qui pratique son art à titre professionnel, ce n'est pas la joie non plus.

    Le recours aux moteurs de traduction machine s'est généralisé ces dernières années et personne n'y échappe. Certes, la qualité de ces moteurs s'est améliorée grâce à l'introduction de stratégies d'IA spécifiques aux différents moteurs. La perspective, pour les acteurs qui produisent des contenus et s'engagent dans une internationalisation de leurs activités, c'est de réduire les coûts de documentation tout en augmentant les volumes.

    Tout y passe : manuels utilisateurs de machines, contrats, catalogues de produits, etc., dans tous les secteurs possibles et imaginables.

    Comme on se rend bien compte que la qualité est dégradée par rapport à ce que fait un traducteur humain, on emploie ces derniers à faire de la post-édition (PE ou post-editing). Un travail ingrat, dans lequel il faut se farcir les conneries et contresens de la machine, qui effectivement, d'un 'segment' à l'autre, traduit avec une grande variabilité.

    Exemples de contresens : dans un document juridique dont j'ai fait la post-édition, il était question de "cannibalisation" dans un contexte de maintenance de machines. Le moteur de traduction a traduit naïvement par "cannibalisme". Pas top. L'enjeu est donc de détecter ce genre de loupés sémantiques, dans une phrase qui est pour le reste syntaxiquement correcte.

    Les grands acteurs du commerce (Ebay, Amazon, et Aliexpress, etc.) s'y sont mis et de fait, tous font appel à la traduction machine. Sans oublier l'"industrie" culturelle. Dans ce secteur, je ne citerai que Netflix, qui a défrayé la chronique, suite à des ratés dans la post-édition de sous-titres d'un film coréen ([1, 2]).

    Certains font post-éditer. Parmi eux, certains le font faire par des petites-mains, en recourant aux plateformes de crowdworking, qui elles aussi sous-sous-traitent. Les conditions de travail y sont déplorables. J'en ai fait. C'est un travail de soutier, ingrat au possible. J'en fais à l'instant même, c'est comme les OGM, il y en a vraiment partout.

    Bref, les consommateurs grand public et les acheteurs professionnels obtiennent ce pour quoi ils payent : des produits bas de gamme, produits à gros volumes, dans des usines exploitant leurs ouvriers, et, à tous les échelons de ces acteurs globaux, on pressure et rogne sur les budgets.

    Mais le plus intéressant, ce sont les dessous de l'innovation technologique : ce qui est vendu comme une réussite et un acquis de l'IA c'est en fait, dans les coulisses, et pour une grande part, de l'intelligence humaine exploitée sans vergogne, et de la sueur de crowdworkers, noyée dans un océan de médiocrité.

    [1] https://marketresearchtelecast.com/translators-criticize-netflix-for-automated-subtitles-of-the-squid-game/179179/
    [2] https://beta.ataa.fr/blog/article/le-sous-titrage-francais-de-roma

    • [^] # Re: Du point de vue du traducteur humain...

      Posté par  (site web personnel) . Évalué à 10.

      « Bref, les consommateurs grand public et les acheteurs professionnels obtiennent ce pour quoi ils payent : des produits bas de gamme, produits à gros volumes, dans des usines exploitant leurs ouvriers, et, à tous les échelons de ces acteurs globaux, on pressure et rogne sur les budgets. »

      Le consommateur a parfois bon dos : en France avec le prix unique du livre, les prix auraient-ils subitement descendus ? Pourtant à chaque fois que je lis une traduction récente, je frémis, je peste… Que d'incohérences, de phrases qui nécessitent de retourner à la langue originelle pour être comprises. Ne faudrait-il pas incriminer aussi les mécanismes de décision (marchés, acteurs professionnels, politiques, etc) ? Car à part lire en version originale, le client n'a guère le choix.

      « IRAFURORBREVISESTANIMUMREGEQUINISIPARETIMPERAT » — Odes — Horace

  • # Ce commentaire est tardif

    Posté par  (site web personnel) . Évalué à 2.

    Merci pour vos retours dans les différents commentaires. C'était instructif et les différents points de vue m'ont permis de comprendre plein de choses.
    Ça m'a également rassuré de voir que ce n'était pas lié à ma position géographique. C'était vraiment l'une des questions que je me posais, j'ai tellement l'habitude qu'on m'envoie des liens qui sont "indisponibles dans mon pays" que je me demandais si la réponse donnée par le moteur dépendait (ou pas) de ça.
    Me voilà donc rassuré de voir que ça marche aussi mal partout dans le monde !

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.