Forum général.cherche-logiciel multiple/série de odt, concaténer/fusionner?

Posté par  (Mastodon) . Licence CC By‑SA.
Étiquettes :
2
28
sept.
2023

bonjour

je cherche un moyen simple, probablement via ligne de commande, pour concaténer (aka fusionner) des documents odt (ou docx reconvertis via libreoffice) en un seul fichier
l'idée étant justement de le faire en une seule manip', meme si le temps de traitement serait un peu long, un peu comme pdftk fait (pdftk cat fichier1 fichier2 output sortie.pdf)

cependant je trouve vraiment pas, et les quelques "outils web" permettant de le faire ne semblent pas fonctionner..

une idée? merci :)

  • # préciser le besoin

    Posté par  . Évalué à 6.

    Je vois déjà une difficulté par rapport à concaténer des pdf : quel effet est attendu sur la mise en page ?

    Exemple 1 : le doc 1 se termine au milieu d'une page. Est-ce que la suite (le doc2) doit être insérée à la page suivante (donc avec un saut de page forcé avant) ou bien directement à la suite du dernier paragraphe de doc1 ?

    Exemple 2 : que faut-il faire s'il y a une table de matière dans plusieurs des documents ? Les laisser (que va donner leur mise à jour), les supprimer, ne garder que la première ou la dernière ?

    Exemple 3 : que fait-on si le style corps de texte de doc2 est différent du style corps de texte du doc 1, par exemple si les polices d'écriture sont différentes ?

    Ce sont des problèmes que les documents maîtres savent normalement traiter (c'est plutôt fait pour ça), mais je ne sais pas si on peut ensuite exporter en un doc unique.
    On peut aussi jouer avec des sections liées : une section par document à insérer.

    Avant de faire ça en automatique, je pense qu'il faut faire les concaténations à la main pour être bien au clair sur le résultat attendu.

    • [^] # Re: préciser le besoin

      Posté par  (site web personnel, Mastodon) . Évalué à 2.

      une difficulté par rapport à concaténer des pdf

      On retrouve la même problématique (en PDF) avec tous les exemples listés… Les automates font de la concaténation bête et méchante et ne conviennent donc pas pour tous les scénarios.

      “It is seldom that liberty of any kind is lost all at once.” ― David Hume

      • [^] # Re: préciser le besoin

        Posté par  . Évalué à 4.

        Certes, mais la mise en page d'un pdf n'est pas censée être modifiable et dans ce cas on attend plutôt une concaténation toute simple où on ajoute les pages existantes les unes derrière les autres.

        • [^] # Re: préciser le besoin

          Posté par  (site web personnel, Mastodon) . Évalué à 2.

          La fusion de pdf1 ayant sa table des matières et pdf2 ayant la sienne est des plus étranges quand on fait une concaténation simple.
          Mieux, on peut réarranger les pages avec certains outils, mais le résultat n'est pas toujours convaincant avec les signets et les tables de matières. En tout cas dans mes essais.
          On peut avoir aussi pdf1 qui se termine par trois lignes sur une page et qu'on a envie de fusionner avec pdf2 qui ne comporte qu'une page de cinq lignes.

          “It is seldom that liberty of any kind is lost all at once.” ― David Hume

          • [^] # Re: préciser le besoin

            Posté par  . Évalué à 3.

            Bien sûr, on peut avoir envie de ça, mais ignorer volontairement le fait que le format PDF est prévu pour ne pas permettre ça, c'est juste perdre son temps. Si on veut réarranger un nouveau document il faut le faire à partir des sources des pdf.

    • [^] # Re: préciser le besoin

      Posté par  (Mastodon) . Évalué à 3.

      la plupart des concaténations effectuées avec pdftk étaient des procédures toutes simples pour des besoins tout simples, de quelques dizaines/centaines de pages, de documents sans sommaires ni sensibilités de mise en page particulières

      je recherche grosso modo le meme outil, pour des odt/docx..

      • [^] # Re: préciser le besoin

        Posté par  (site web personnel) . Évalué à 3.

        Est-ce qu'une combinaison en deux commandes pourrait convenir ?

        libreoffice --convert-to pdf *.odt
        pdftk *.pdf cat output grostasdefeuilles.pdf

        « IRAFURORBREVISESTANIMUMREGEQUINISIPARETIMPERAT » — Odes — Horace

        • [^] # Re: préciser le besoin

          Posté par  (Mastodon) . Évalué à 2.

          est il possible de rester en odt, quitte à reconvertir le dernier (unifié) par la suite?

          • [^] # Re: préciser le besoin

            Posté par  (site web personnel) . Évalué à 2. Dernière modification le 28 septembre 2023 à 21:41.

            Ben justement pas (que je sache)…

            On ne se rend parfois pas compte à quel point les bons vieux outils facilitent les opérations un peu ésotériques. Le jour où j'ai voulu fusionner un ensemble d'énoncés, deux ou trois \input{} dans un en-tête LaTeX…

            « IRAFURORBREVISESTANIMUMREGEQUINISIPARETIMPERAT » — Odes — Horace

            • [^] # Re: préciser le besoin

              Posté par  . Évalué à 3.

              On peut faire ça dans LibreOffice avec un document maître ou avec des sections.

              Cependant la question initiale était en fait de savoir comment concaténer des fichiers odt sans passer par son éditeur de fichiers odt. Cependant "concaténer" ne dit pas précisément ce qu'on veut faire. Pour mettre bout à bout des fichiers qui encodent des documents, il faut se demander comment on accroche chaque document au précédent et ce que cela signifie pour le document final et non pas seulement pour le fichier.

  • # solution

    Posté par  (Mastodon) . Évalué à 2.

    finalement, j'ai "robotisé" l'ordinateur avec un script qui "insère un texte" (via le menu fichier>insérer) dans soffice writer, et qui récupère (et supprime) un par un chaque document du dossier
    il a tourné toute la nuit, mais ça a l'air d'avoir fonctionné

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.