Forum général.général Remise en page d'un document pdf

Posté par  .
Étiquettes : aucune
0
11
sept.
2011

Bonjour,

J'ai récupéré un pdf pas super agréable à lire ici : http://sites.google.com/site/travauxdehervethis/applications-technologiques/fiches-cuisine
Je me demandais si quelqu'un avait une idée pour rendre sa lecture plus agréable sans passer par la case copier coller de chaque bout de texte. Si on exporte le texte sa donne ceci : 

Damie      Un damier, c’est une alternance        Tailler des bâtonnets de blanc
r          de carrés noirs et blancs, dans        de seiche. Les tremper dans
bidime     les deux directions de l’espace.       une poudre de curry et les
nsionn     En cuisine ? Il suffit d’alterner      aligner dans un film plastique
el         deux éléments, de nature               transparent. Bien serrer le
           différente.                            film, et cuire au four vapeur,
           On peut imaginer des damiers           afin que les bâtonnets se
           de texture, de goût, de ce que         soudent.
           l’on veut qui ait un sens              Puis mettre au froid. Pour
           culinaire.                             servir, couper des tranches
                                                  perpendiculaires aux fibres.
                                                  On peut aussi alterner des
                                                  bâtonnets de deux sortes :
                                                  carottes et poisson, par
                                                  exemple.
                                                  Ou bien encore produire deux
                                                  purées gélifiées, que l’on
                                                  détaille en dés, lesquels sont
                                                  déposés en alternance.

  • # Python

    Posté par  . Évalué à 2.

    Une première idée, ça peut être de faire un petit script qui prend ton texte en colonne comme ici, et qui découpe chaque ligne en 3 colonnes (pas trop difficile puisqu'il y a plusieurs espaces entre les colonnes). Ainsi, tu stockes chaque colonne dans une liste différence, et à la fin tu peux afficher chaque colonne comme un paragraphe.

    Ça ne devrait pas prendre cinq minutes à coder si tu connais python, mais certes ça n'est pas idéal s'il te faut copier/coller le texte pour le donner à ton script. Une solution de dépannage en quelques sortes...

    • [^] # Re: Python

      Posté par  . Évalué à 3.

      Pour ça je dirai plutôt du perl avec un truc du genre
      @col =~ /(.+?) +(.+?) +(.+?)/ ;

      ou mieux un

      @col = split(" +", $line );

      enfin bref un truc simple quoi ;)

      Il ne faut pas décorner les boeufs avant d'avoir semé le vent

      • [^] # Re: Python

        Posté par  . Évalué à 2.

        Je connais python à un niveau débutant confirmé (pas terrible en quelque sorte) mais perl pas du tout. Du coup je ne sais pas comment me servir de tes commandes.

  • # coreutils

    Posté par  (site web personnel) . Évalué à 1.

    sinon en utilisant la vénérable commande fmt

    pdftottext recette.pdf - | fmt

    Je trouve le résultat assez sympa :p

  • # pdfMasher

    Posté par  . Évalué à 2.

    Il a été conçu précisément pour répondre à la problématique que tu soulève : remettre de l'ordre dans le flux de texte (d'objets) d'un pdf.
    Ça exporte en markdown, html et epub (sa finalité).
    Petit bémol, il ne sais pas traiter les graphiques.
    Je ne sais plus qui l'a mentionné ici en premier mais je l'en remercie.

    • [^] # Re: pdfMasher

      Posté par  . Évalué à 2.

      j'ai testé pdfmasher mais le pdf est vraiment trop bancal pour arriver à quelque chose sans prise de tête.

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.