Journal Édition PDF?

Posté par .
Tags : aucun
0
25
nov.
2003
Est-ce que quelqu'un sait s'il est possible de modifier un PDF existant avec Acrobat (et non pas seulement de le créer)? Voire même, mieux, s'il existe un moyen d'extraire le contenu d'un .pdf depuis linux (genre sortir les images et les polices, typiquement)?
  • # Re: Édition PDF?

    Posté par (page perso) . Évalué à 5.

    Koffice est capable d'ouvrir les pdf. C'est encore du beta, mais c'est de mieux en mieux...

    Par contre, tu ne pourras pas choper les polices avec ça. T'es sûr que les polices sont inclues dans le document? il n'utilise pas les polices du système?

    Je ne sait pas trop, ni ce que donne l'extraction des images. Pour les images, une solution pas très propre consiste à convertir le pdf en ps, puis à ouvrir le ps avec The Gimp, en choissant judicieusement la résolution...

    Mais ce qui est chiant, c'est que la plupart du temps, les images inclues dans un pdf sont super compressées...
    • [^] # Re: Édition PDF?

      Posté par . Évalué à 1.

      Sinon le Gimp peut ouvrir les PDF.

      Et si les images sont compressées, c'est que PDF les stocke en JPEG. Si ton logiciel est bien fait, tu dois pouvoir choisir le niveau de compression.
      • [^] # Re: Édition PDF?

        Posté par . Évalué à 1.

        En effet, l'import PostScript de Gimp peut charger du PDF. Par contre, c'est inutilisable pour ce que je veux faire, du fait que ça rasterise le document.

        Je voudrais conserver la structure, mais je crois qu'aucun outil (libre, du moins) ne peut faire ça. Quand j'aurais du temps, je regarderais ce que les libs PDF (ou PS) sont capables de faire...
  • # Re: Édition PDF?

    Posté par . Évalué à 3.

    * modifier du PDF ? no idea, même OpenOffice ne le fait pas (n'ose pas ? ...)

    * extraction vers HTML :

    1) commandes du package xpdf :
    - pdftotext
    - pdfimages
    - pdffonts
    - pdftops
    - etc.
    http://www.foolabs.com/xpdf/(...)

    2) http://pdftohtml.sourceforge.net/(...)
    pas mal, ça crée des pages HTML avec plein de DIV pour placer les textes de façon absolue, à la même place que leur place dans la page PDF

    3) parser pour htdig : doc2html qui contient pdf2html
    http://www.htdig.org/files/contrib/parsers/(...)
    • [^] # Re: Édition PDF?

      Posté par . Évalué à 1.

      Je suis assez impressioné par pdftops, mais si éditer le .ps à la main ensuite, c'est lourd.

      Pour préciser mon besoin: je suis rôliste à mes heures perdues (de moins en moins, donc), et je cherche à imprimer des feuilles de jeu.

      Donc soit je photocopie celle dispo dans le bouquin de rêgles, mais le résultat est désastreux (c'est rien de le dire).

      Soit je prends le .pdf fourni par l'éditeur (White Wolf), et la, qualité parfaite. En revanche, c'est la feuille de la version anglaise, et ça me plait pas. Donc je voudrais traduire le .pdf, mais de préférence sans le rasteriser.

      Donc concrètement, passer en PostScript et trifouiller le résultat avec emacs, ça pourrait le faire. Mais je flaire que juste modifier le texte ne suffira pas, il faudra aussi modifier des paramêtres de taille, ce genre de choses...
      • [^] # Re: Édition PDF?

        Posté par . Évalué à 1.

        Franchement, j'ai bien peur qu'un logiciel pour modifier du PDF ne te suffira pas. Si c'est pour traduire pourquoi ne n'adresses-tu pas directement à l'éditeur qui pourrait te fournir la doc en RTF. (ça se fait assez courament surtout si tu te proposes de faire cela gratuitement...)

        Sinon une solution consisterait à extraire le texte, puis les images du PDF (avec un des logiciels sus-cités) et à refaire la mise ne page dans un logiciel du style d'Open Office.

        Le PDF n'est pas fait pour être éditable (du fait même de sa structure interne). Ca peut se modifier mais cela reste globalement du bidouillage (au moins au niveau texte). AMHA, le top du top en la matière pour modifier du PDF, c'est Pitstop de Enfocus, mais c'est payant, et je pense que ça fonctionne uniquement que sous Windows et Mac.
        • [^] # Re: Édition PDF?

          Posté par . Évalué à 1.

          Franchement, j'ai bien peur qu'un logiciel pour modifier du PDF ne te suffira pas. Si c'est pour traduire pourquoi ne n'adresses-tu pas directement à l'éditeur qui pourrait te fournir la doc en RTF. (ça se fait assez courament surtout si tu te proposes de faire cela gratuitement...)

          C'est une (bonne) idée, mais techniquement ça me satisfait pas ;)

          Sinon une solution consisterait à extraire le texte, puis les images du PDF (avec un des logiciels sus-cités) et à refaire la mise ne page dans un logiciel du style d'Open Office.

          Deux problèmes: d'une part, il faut extraire les polices (ou les acheter), et d'autre part toute la partie graphique du document est faite en vectoriel. Donc tintin pour l'exportation OOo.

          Le PDF n'est pas fait pour être éditable (du fait même de sa structure interne). Ca peut se modifier mais cela reste globalement du bidouillage (au moins au niveau texte).

          Ça me dérange assez peu que ce soit du bidouillage, la modification que je veux faire est vraiment pas violente.

          AMHA, le top du top en la matière pour modifier du PDF, c'est Pitstop de Enfocus, mais c'est payant, et je pense que ça fonctionne uniquement que sous Windows et Mac.

          Je vais regarder de ce coté là, à tout hasard. Merci.
    • [^] # Re: Édition PDF?

      Posté par . Évalué à 1.

      http://pdftohtml.sourceforge.net/(...)

      Merci pour le tuyau, je cherchais un programme comme ça depuis longtemps. J'ai abandonné les convertisseurs TeX -> HTML, ils sont vraiment trop merdiques.

Suivre le flux des commentaires

Note : les commentaires appartiennent à ceux qui les ont postés. Nous n'en sommes pas responsables.