Bonjour,
J'ai récupéré un pdf pas super agréable à lire ici : http://sites.google.com/site/travauxdehervethis/applications-technologiques/fiches-cuisine
Je me demandais si quelqu'un avait une idée pour rendre sa lecture plus agréable sans passer par la case copier coller de chaque bout de texte. Si on exporte le texte sa donne ceci :
Damie Un damier, c’est une alternance Tailler des bâtonnets de blanc
r de carrés noirs et blancs, dans de seiche. Les tremper dans
bidime les deux directions de l’espace. une poudre de curry et les
nsionn En cuisine ? Il suffit d’alterner aligner dans un film plastique
el deux éléments, de nature transparent. Bien serrer le
différente. film, et cuire au four vapeur,
On peut imaginer des damiers afin que les bâtonnets se
de texture, de goût, de ce que soudent.
l’on veut qui ait un sens Puis mettre au froid. Pour
culinaire. servir, couper des tranches
perpendiculaires aux fibres.
On peut aussi alterner des
bâtonnets de deux sortes :
carottes et poisson, par
exemple.
Ou bien encore produire deux
purées gélifiées, que l’on
détaille en dés, lesquels sont
déposés en alternance.
# Python
Posté par vermillon . Évalué à 2.
Une première idée, ça peut être de faire un petit script qui prend ton texte en colonne comme ici, et qui découpe chaque ligne en 3 colonnes (pas trop difficile puisqu'il y a plusieurs espaces entre les colonnes). Ainsi, tu stockes chaque colonne dans une liste différence, et à la fin tu peux afficher chaque colonne comme un paragraphe.
Ça ne devrait pas prendre cinq minutes à coder si tu connais python, mais certes ça n'est pas idéal s'il te faut copier/coller le texte pour le donner à ton script. Une solution de dépannage en quelques sortes...
[^] # Re: Python
Posté par fearan . Évalué à 3.
Pour ça je dirai plutôt du perl avec un truc du genre
@col =~ /(.+?) +(.+?) +(.+?)/ ;
ou mieux un
@col = split(" +", $line );
enfin bref un truc simple quoi ;)
Il ne faut pas décorner les boeufs avant d'avoir semé le vent
[^] # Re: Python
Posté par Nonolapéro . Évalué à 2.
Je connais python à un niveau débutant confirmé (pas terrible en quelque sorte) mais perl pas du tout. Du coup je ne sais pas comment me servir de tes commandes.
# coreutils
Posté par serge_sans_paille (site web personnel) . Évalué à 1.
sinon en utilisant la vénérable commande
fmt
pdftottext recette.pdf - | fmt
Je trouve le résultat assez sympa :p
# pdfMasher
Posté par steph1978 . Évalué à 2.
Il a été conçu précisément pour répondre à la problématique que tu soulève : remettre de l'ordre dans le flux de texte (d'objets) d'un pdf.
Ça exporte en markdown, html et epub (sa finalité).
Petit bémol, il ne sais pas traiter les graphiques.
Je ne sais plus qui l'a mentionné ici en premier mais je l'en remercie.
[^] # Re: pdfMasher
Posté par Nonolapéro . Évalué à 2.
j'ai testé pdfmasher mais le pdf est vraiment trop bancal pour arriver à quelque chose sans prise de tête.
Suivre le flux des commentaires
Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.