Forum général.hors-sujets Envie de traduire automatiquement un livre et de le faire imprimer

Posté par  . Licence CC By‑SA.
Étiquettes :
2
21
nov.
2022

Bonjour à tous,

J'ai découvert récemment un bouquin en anglais que je trouve passionnant et que j'aimerai traduire et imprimer pour un usage privé (pas pour le revendre).

N'étant ni traducteur, ni imprimeur, je voudrai bien sûr passer par des outils existants et je me suis dis que la communauté linuxfr avait sans doute quelques conseils à donner sur ce sujet :).

Voici donc plein de questions en vrac :

  1. Est-ce légal de traduire et d'imprimer un livre à titre personnel ?
  2. Je voulais le faire traduire automatiquement, quel logiciel/site conseillez vous ? J'ai déjà entendu parlé ici de DeepL, est-ce toujours une référence ? Pour info, le livre que je veux traduire c'est de l'histoire des sciences avec pas mal de termes techniques et médicaux
  3. Je peux avoir le livre sous plusieurs format : epub, pdf. Quel est le format le plus adapté pour une traduction automatique ? Et pour le faire imprimer ? C'est pratique d'imprimer du epub ?
  4. Enfin, est-ce que vous avez des bons site d'imprimeurs en ligne pour des ouvrages type livre avec quelques graphiques et schéma ? J'en avais testé un plutôt bien pour imprimer un livre sous format numérique, mais le souci c'est qu'il ajoutait sur chaque page un truc genre : "ce document est la propriété exclusive de…" pas trop gênant, mais si on peut faire sans c'est mieux. J'imagine que c'est pour éviter des problèmes légaux.

Voilà, si vous avez une réponse à l'une de ces questions ça m'intéresse !

Bonne journée,
Andréas

  • # Licence !

    Posté par  (Mastodon) . Évalué à 6.

    Première question fondamentale : sous quelle licence est cette œuvre ?

    Bon, on partira du principe qu'il s'agit d'une œuvre protégée "classique", donc chez toi et pour toi tu fais ce que tu veux (encore heureux), mais tu ne pourras pas le diffuser ensuite (vendu ou pas ça ne change rien) à qui que ce soit.

    En théorie, la théorie et la pratique c'est pareil. En pratique c'est pas vrai.

    • [^] # Re: Licence !

      Posté par  . Évalué à 2.

      Oui, désolé je n'ai pas précisé la licence, mais c'est une œuvre de droit "classique" et c'est un éditeur américain.
      Merci pour la réponse en tout cas.

  • # Traduction et format

    Posté par  (site web personnel, Mastodon) . Évalué à 6.

    DeepL est, effectivement, un excellent traducteur mais:

    • cela dépend des langues (de l'anglais vers le français c'est bon),
    • en utilisation gratuite c'est limité à quelque chose comme 5000 caractères,
    • de toute façon, sauf à avoir des traducteurs spécialisés (et je ne sais pas ce qui existe), dès lors que le vocabulaire (mots ou sens) devient spécifique, il y a des risques (normaux) de mauvaise traduction.

    Concernant les formats :

    • pdf pour l'impression et la lecture sur écran,
    • epub pour la lecture sur liseuse ou ordiphone et les outils d'assistance,
    • utiliser un traitement de texte pour le texte qui pourra ensuite servir aux usages ci-dessus.

    « Tak ne veut pas quʼon pense à lui, il veut quʼon pense », Terry Pratchett, Déraillé.

    • [^] # Re: Traduction et format

      Posté par  . Évalué à 1.

      Merci pour la réponse, pour DeepL il semble que la limite soit maintenant de 500 000 caractères par mois pour un usage gratuit, ce qui est vraiment pas mal.

      Je vais donc essayer d'extraire automatique le contenu textuel, le faire traduire via l'API DeepL, puis le mettre en page.

      Bon je crois que pour la mise en page ça sera du LibreOffice, je sais qu'il y a Scribus mais je ne le maîtrise pas. Je sais qu'il y a aussi LaTeX qui pourrait être une solution très élégante, mais pareil, je me suis encore jamais penché dessus. Puis je cherche surtout à avoir le contenu textuel, tant pis si la mise en page est pas top, je veux pas faire le boulot d'éditeur. J'espère d'ailleurs que le livre sera un jour traduit.

      • [^] # Re: Traduction et format

        Posté par  (site web personnel, Mastodon) . Évalué à 4.

        Astuce pour LibreOffice (qui est un outil de PAO, suffit de savoir le manier) : préférer la plupart du temps un ancrage des illustrations au paragraphe plutôt qu'au caractère et protéger la position quand le résultat va tout à fait bien.

        « Tak ne veut pas quʼon pense à lui, il veut quʼon pense », Terry Pratchett, Déraillé.

        • [^] # Re: Traduction et format

          Posté par  . Évalué à 1.

          Merci pour le conseil, c'est vrai que mon usage de Writer se limite au strict minimum.
          Bon tout de même je ne fais pas comme ma femme, j'utilise les styles pour les titres au lieu d'appliquer manuellement une taille et une police à chaque fois, mais à part ça je ne sais pas faire grand chose !

    • [^] # Re: Traduction et format

      Posté par  (site web personnel) . Évalué à 1. Dernière modification le 22 novembre 2022 à 11:19.

      « DeepL est, effectivement, un excellent traducteur […] »

      …qui ravivera ardemment, en l'esprit du lecteur, le souvenir de cette maxime « traduire c'est trahir ». Ou bien y aurait-il eu d'immense progrès récemment ?

      Juste au cas où et histoire de vérifier mon a priori négatif je viens de faire un test. Après m'être vu demandé de changer mon navigateur pour ouvrir Edge ou de télécharger DeepL pour widows, la traduction d'une phrase prise au hasard dans un texte donne un charabia délicat à comprendre. Franchement, DeepL semble clairement un palliatif, mais pas une panacée. À lui seul il justifie le légalisme le plus strict pour la traduction de texte soumis au droit d'auteur : n'infligez ça à personne.

      « IRAFURORBREVISESTANIMUMREGEQUINISIPARETIMPERAT » — Odes — Horace

      • [^] # Re: Traduction et format

        Posté par  (Mastodon) . Évalué à 2. Dernière modification le 24 novembre 2022 à 00:20.

        Les préjugés ont la vie dure. DeepL (dont je ne suis pas actionnaire) est considéré, pour les combinaisons de langue qu'il couvre, comme le plus performant des outils NMT (neural machine translation) sur le marché à l'heure actuelle. La bascule des moteurs de TA vers le modèle neuronal (2016) a changé la donne par rapport aux modèles antérieurs. Depuis les progrès n'ont cessé (mais nous ne voyons que ce qui veut bien être mis à notre disposition sous forme gratuite) et il n'y a pas jusqu'aux maisons d'édition littéraires qui commencent à lorgner vers ce type d'application. Alors, oui, qui dit automatisation, dit 'erreur' et nécessité d'une post-édition par un relecteur humain - d'après l'enquête de terrain de la SFT (Société française des traducteurs) qui vient de sortir, la part de la post-édition dans la demande globale de traduction en France est déjà de 25 % - absorber en 5 ans un quart du marché de la traduction, c'est pas mal… C'est que cela ne doit pas être si mauvais que cela. Se fonder sur une phrase tirée au hasard pour tester un moteur de TA ne peut évidemment rien nous apprendre. Les modèles neuronaux étant fondés sur l'apprentissage profond, il suffit de les entraîner correctement pour qu'ils produisent la plupart du temps une langue fluide et adaptée au contenu. Du reste, dans les corrections à apporter, un des risques majeurs est que la langue est parfois si fluide que le post-éditeur ou la post-éditrice ne voit pas certaines erreurs (contresens par ex.) produites par la machine. Du reste encore, ce sont les mêmes modèles neuronaux qui commencent à prendre en charge la création automatique de contenus dans une langue (la trad. c'est l'étape suivante). Alors, oui, je ne crois pas aux miracles et parfois, je rigole bien de ce que la machine réussit à nous sortir, mais il faut prêter garde à ne pas jeter le bébé avec l'eau du bain.
        Signalons au passage que si LibreOffice est utilisé pour le format, il existe une extension nommée PageTranslate qui propose l'accès à divers moteurs de TA en ligne (après il faut détenir ou payer la clé d'accès (API) à certains, mais j'ai justement testé l'extension il y a une semaine avec le moteur Pons (je ne sais pas quel moteur se cache derrière) sur un chapitre entier d'un ouvrage universitaire en sciences humaines de l'anglais au français et le résultat était plus qu'acceptable - sans clé à fournir ni barrière de péage (mais je ne sais pas si cela va durer longtemps…).

        • [^] # Re: Traduction et format

          Posté par  (site web personnel) . Évalué à 1.

          Oui, de manière général les préjugés ont la vie dure.
          Sur le fond : DeepL peut probablement faire des traductions de qualité pas déraisonnables, je n'en disconvient nullement. J'accorderai volontiers d'ailleurs le qualificatif professionnel : « DeepL peut faire des traductions de qualité professionnelle. » Qui d'entre nous d'ailleurs n'est jamais tombé de sa chaise en parcourant une traduction de ce niveau ?

          Comme vous l'explicitez vous-même (est-ce un préjugé de votre part ?), cela est très loin d'une qualité excellente (EX CŒLUM… pardonnez du peu) :

          « […] qui dit automatisation, dit 'erreur' et nécessité d'une post-édition par un relecteur humain […] Du reste, dans les corrections à apporter, un des risques majeurs est que la langue est parfois si fluide que le post-éditeur ou la post-éditrice ne voit pas certaines erreurs (contresens par ex.) produites par la machine. »

          Donc sur la forme nous paraissons d'accord : « traduire c'est trahir ». Préjugé ? Alors que vous semblez certainement bien mieux connaître le sujet que votre serviteur.
          Sur le fond nous agréons également : DeepL produit assurément des traductions de qualité commercial. Le marché le prouve ; nul n'en débat.

          Nonobstant me permettrais-je encore de relever accessoirement que :
          1) Nous ne parlions visiblement pas de la même chose.
          Vous écrivez :

          « DeepL (dont je ne suis pas actionnaire) est considéré, pour les combinaisons de langue qu'il couvre, comme le plus performant des outils NMT (neural machine translation) sur le marché à l'heure actuelle. »

          Ce que je ne contestais nullement, n'ayant même pas une ombre de présomption de connaissance en la matière. De mon côté, je commentais l'expression « excellent traducteur ». Le travail de ce dernier étant directement publiable. DeepL peut bien être le meilleur de sa catégorie sans pour autant offrir un service équivalent à ce dernier. Quant aux lois du marché qui permettent sa conquête si aisée par DeepL,

          2) M'ayant lu, vous n'ignoriez pas que mon préjugé est confirmé par l'expérience. Visiblement, même sur une seule phrase choisie au hasard, sans difficulté particulière, d'un texte de notoriété raisonnable, et pour lequel de nombreuses traductions existent certainement, DeepL m'a fourni un résultat médiocre. À partir de là, faut-il encore considérer qu'il s'agisse de préjugés ? Même si nous nous accordons assurément sur le fait qu'il ne s'agisse nullement d'une évaluation exhaustive. Impossible de d'adhérer à la qualification d'excellence : ce qui dépasse ou, a tout le moins, atteint à la perfection.

          « IRAFURORBREVISESTANIMUMREGEQUINISIPARETIMPERAT » — Odes — Horace

          • [^] # Re: Traduction et format

            Posté par  (Mastodon) . Évalué à 4.

            2) M'ayant lu, vous n'ignoriez pas que mon préjugé est confirmé par l'expérience. Visiblement, même sur une seule phrase choisie au hasard, sans difficulté particulière, d'un texte de notoriété raisonnable, et pour lequel de nombreuses traductions existent certainement, DeepL m'a fourni un résultat médiocre. À partir de là, faut-il encore considérer qu'il s'agisse de préjugés ? Même si nous nous accordons assurément sur le fait qu'il ne s'agisse nullement d'une évaluation exhaustive. Impossible de d'adhérer à la qualification d'excellence : ce qui dépasse ou, a tout le moins, atteint à la perfection.

            Je suis curieux de connaître la phrase test.

            Surtout, ne pas tout prendre au sérieux !

        • [^] # Re: Traduction et format

          Posté par  (site web personnel, Mastodon) . Évalué à 4. Dernière modification le 24 novembre 2022 à 10:15.

          Oh, l’expérience semble avoir été menée pour conforter les préjugés :)

          Je suis en train d’utiliser l’extension PageTranslate dans LibreOffice, à mon grand étonnement, ça traduit sans me demander un accès à quoi que ce soit. La qualité de la traduction m’épate, et ce d’autant plus que le texte traduit est un copier-coller de pdf (donc avec des retours à la ligne intempestifs).

          Pour compléter, cela fait un certain temps que les outils de traduction automatique sont utilisés dans le domaine de la traduction professionnelle. Ils sont, notamment, intégrés dans les tarifications des traductions : l’outil fait une première traduction rapide et il revient ensuite aux traducteurs et aux traductrices de peaufiner le travail. Les tarifs sont plus bas quand un outil de traduction automatique est utilisé.

          « Tak ne veut pas quʼon pense à lui, il veut quʼon pense », Terry Pratchett, Déraillé.

          • [^] # Re: Traduction et format

            Posté par  (site web personnel, Mastodon) . Évalué à 3.

            le texte traduit est un copier-coller de pdf (donc avec des retours à la ligne intempestifs).

            C'était un peu ma crainte par rapport au PDF… Tu as plus de chance que moi : j'ai directement déversé le PDF dans l'interface en ligne de DeepL et il s'en est sorti assez bien (5 ou 6 sur 10)

            Pour compléter, cela fait un certain temps que les outils de traduction automatique sont utilisés dans le domaine de la traduction professionnelle. […]

            Je confirme pour l'avoir constaté depuis une petite dizaine d'années.

            “It is seldom that liberty of any kind is lost all at once.” ― David Hume

          • [^] # Re: Traduction et format

            Posté par  . Évalué à 2.

            Traduction automatique avec DeepL intégrée dans LibreOffice 7.5 :

            J'ai voulu tester PageTranslate sur la future version 7.5 de LibreOffice. J'ai trouvé que ça ne marchait pas bien, pas la traduction mais l'intégration de l'extension qui a fait planter LibreOffice. Du coup je l'ai désinstallée et là j'ai réalisé qu'il restait dans le menu Outils de Writer une fonction « Translate ». Après enquête et vérification que ce n'est pas un résidu de PageTranslate, j'ai découvert qu'une fonction de traduction automatique avec DeepL a été ajoutée mi-octobre. Inutile de chercher, il n'y a rien dans les release notes et j'ai eu du mal à trouver le commit. Mais une fois récupéré une clé API gratuite (pour 500000 caractères par mois), je dois dire que ça fonctionne plus bien.

  • # Deepl

    Posté par  (site web personnel) . Évalué à 3.

    Deepl a été utilisé avec succès pour la traduction en français d'un livre sur l'I.A. Pour un livre d'histoire, plus littéraire (?), ce sera peut être plus problématique.

    Le format le plus adapté me semple l'ePub qui n'est qu'un ensemble de fichiers html zippés. Tu pourras ensuite traduire les fichiers html par Deepl puis utiliser l'éditeur Sigil pour retoucher la traduction et peaufiner la mise en page. Si le fichier original est protégé par DRM il te faudra d'abord faire sauter la protection.

    • [^] # Re: Deepl

      Posté par  (site web personnel, Mastodon) . Évalué à 4.

      Pour l'impression c'est le pdf qui permet de garder la mise en page d'origine, c'est fait pour. Ce n'est pas le cas de l'epub (qui n'est pas fait pour ça d'ailleurs). Et je ne connais pas d'imprimerie qui accepte l'epub.

      « Tak ne veut pas quʼon pense à lui, il veut quʼon pense », Terry Pratchett, Déraillé.

      • [^] # Re: Deepl

        Posté par  . Évalué à 1.

        Oui au départ, je pensais aussi utilisé le ePub, mais même pour l'extraction des caractères pour la traduction, ça ne semble pas le bon format.

      • [^] # Re: Deepl

        Posté par  (site web personnel, Mastodon) . Évalué à 2.

        Colargol parle de pouvoir éditer du HTML sémantique (avec Sigil) et donner ces fichiers (découpage par chapitre ?) directement à traduire (à DeepL). Il sera toujours temps de convertir en PDF avant imprimerie. Sauf si tu sous-entends qu'on peut éditer et passer en traduction directement le PDF ?

        “It is seldom that liberty of any kind is lost all at once.” ― David Hume

  • # Commentaire supprimé

    Posté par  . Évalué à 1. Dernière modification le 28 novembre 2022 à 07:53.

    Ce commentaire a été supprimé par l’équipe de modération.

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.