Journal manipuler des PDF

Posté par  . Licence CC By‑SA.
Étiquettes :
68
15
fév.
2022

salut

il parait que pour avoir un karma à +1 et avoir enfin des posts visible, il faut participer au site, soit avoir des super note soit faire des journaux pas trop mauvais.

je tente ma chance !!

  • imprimer des bordereau collissimo
  • imprimer en A5 ou A6 plusieurs pdf
  • réduire la taille d'un pdf rapidement (facilement) surtout si vous en avez 200 a effectuer

1 er problème

avec collissimo les borderaux sont au format A5 portrait sur une page A4 avec un coté qui n'est pas utile pour nous, à gauche le bordereau, à droite de l'administratif. nous utilisons des feuilles autocollants A4 avec 2 cotés A5, du coup nous devons jeter la moitié de la feuille qui contient des infos administrative.

exemple de bordereau https://fliphtml5.com/qjarh/srhz/basic (site pris au pif sur internet)

du coup nous utilisons 2 lignes de commande pour supprimer la partie inutile et comme mon imprimante n'arrive pas à attraper cette feuille autocollante sans papier je déplace le bordereau sur la droite pour que l'imprimante attrape le papier.

mutool poster -x 2 Colissimo.pdf a5.pdf
pdfnup --nup 2x1 --openright=true --outfile a5.pdf '1'

mutools separe la feuille A4 en 2 page A5 et pdfnup prend la première page et la place a droite \o/
mutools est fourni avec mupdf et pdfnup nécessite pdflatex

2eme problème imprimer en A5 ou a6

j'ai des dizaine de document PDF à imprimer juste pour pouvoirs travailler dessus souvent il n'y a pas trop d'info dessus, dommage. Je les lie ensemble et je les imprime soit en A6 sur du A4 soit en A5

pdfunite *.pdf sortie.pdf

pdfnup --nup 2x2 sortie.pdf --column=true --landscape --outfile final.pdf
_____________^ 4 pages par A4 -> A6

pdfunite *.pdf sortie.pdf
pdfnup --nup 2x1 sortie.pdf --landscape --outfile final.pdf
_____________^ 2 pages par A4 -> A5

petit bémol le format d'entré est important, si la mise en page est portrait sur le document initial il faut ajouter l'option : --no-landscape à la place de --landscape et vous avec un beau pdf qui regroupe tous vos document, peu importe le nb de page

vous pouvez aller jusqu'a 5x5 voir plus pour ceux qui ont des bon yeux.

pdfunite sert a relier les pdf entre eux dans l'esprit un outil une tâche.

3 eme probleme

j'ai besoin de compresser souvent des pdf d'autre entreprise qui scan comme des gorets leurs documents et cela me prend plusieurs Mega octets par page. parfois j'utilise des outils en ligne mais c'est assez moyen pour la sécurité. et je n'ai jamais été pleinement satisfait de image magick coté rapidité et facilité d'avoir un résultat plutôt jolie.

vips copy mondocument.pdf[dpi=72,n=26] mondocument.tif[compression=jpeg,Q=40]
tiff2pdf -p A4 -n -z -x 100 -y 100 -o mondocument-compressé.pdf mondocument.tif

vous ne le savez peut être pas mais vips est beaucoup beaucoup plus rapide que image magick, le format tiff aussi :p, le document compressé est plus facile à régler avec les options d'après moi, il accepte les documents avec plusieurs page. et le rendu est normal facilement, pas comme avec convert

1)n=26 est la pour selectionner une page particulière ici page 26, sinon ne pas placer l'options
2)ne rêvez pas vous ne pouvez pas choisir la compression c'est jpeg obligatoire
3)la qualité va de 0 à 100 c'est parfaitement linéaire au rendu.

les options de tiff2pdf sont obligatoire sinon il y a une erreur en sortie, sauf pour x et y; vous pouvez modifier le tiff mais attention au format d'enregistrement, il y a plein de tif possible, ca risque de coincer.

conclusion: en réalité nous utilisons cela sous wsl avec des scripts pour les utilisateurs qui sont plutôt très content, à la fin du script on lance adobe pdf qui ouvre le document PDF généré sous wsl ils ont juste à l'imprimer.

  • # vips mieux que gs ?

    Posté par  (site web personnel) . Évalué à 5.

    J’ai pour habitude d’utiliser :

    gs -dNOPAUSE -dQUIET -dBATCH -sDEVICE=pdfwrite -dPDFSETTINGS=/ebook -sOutputFile=output.pdf input.pdf

    pour la compression de pdf (par exemple dans mes scripts nautilus.

    vips est vraiment plus intéressant que gs ?

  • # corrections

    Posté par  (site web personnel, Mastodon) . Évalué à 10.

    soit faire des journaux pas trop mauvais.

    Tu as bien fait de tenter ta chance et ce journal est plutôt bien dans le fond. :) Je note juste quelques remarques sur la forme…


    Il faut faire de vrais titres et non des paragraphes en gras…
    Et on en profite pour mettre en exposant… et mettre quelques majuscules…

    avant après
    **1 er problème** # 1^er problème : imprimer des bordereau Collissimo
    **2eme problème imprimer en A5 ou a6** # 2^ème problème : imprimer en A5 ou a6
    **3 eme probleme** # 3^ème problème : réduire la taille d'un PDF rapidement (facilement)

    Si des modos passent par là, ce serait cool de faire la correction (ce qui en prime devrait générer un sommaire automatique.)


    Il ne faut pas utiliser le bouton « Quotes » pour cet usage
    > exemple de commande
    Mais plutôt le bouton « Code Block » juste à côté (ça indente de quatre espaces) ou directement les triples apostrophes inversés (et tu peux du coup préciser la coloration syntaxique mais ça change pas grand chose ici) après avoir sauté une ligne
    ```sh
    exemple de commande
    ```
    Là tu as de la chance que tes commande ne comportent pas de blancs soulignés ou d'astérisques ou tout autre combinaison de caractères qui serait interprété comme du markdown… (qui au passage a été bien casse-pied pour rédiger cette partie)

    Du coup, il faut en profiter pour mettre en commentaire les commentaires, histoire que la coloration syntaxique les traite comme tel.

    pdfunite *.pdf sortie.pdf  
    pdfnup --nup 2x2 sortie.pdf --column=true --landscape --outfile final.pdf
    #____________^^^ 4 pages par A4 -> A6
    
    pdfunite *.pdf sortie.pdf
    pdfnup --nup 2x1 sortie.pdf --landscape --outfile final.pdf
    #____________^^^ 2 pages par A4 -> A5

    Dans le même esprit, tu peux distinguer les commandes et les options en les entourant d'un apostrophe inversé

    si la mise en page est portrait sur le document initial il faut ajouter 
    l'option `--no-landscape` à la place de `--landscape` et vous avez un beau

    C'est un peu chiant tout ça, mais le résultat en vaut la peine et parfois au delà de toute espérance (accessibilité tout ça) :-)


    Pour les listes numérotés, c'est le point (suivi de l'espace) et non la parenthèse… et en sautant une ligne avant et après comme tu as fait. La différence est que ce sera une vraie liste qui sera générée (aussi bien accessibilité que rendu cohérent) et en bonus tu n'as plus à te soucier des numéros exacts car ce sera dans l'ordre.

    1. n=26 est la pour sélectionner une page particulière ici page 26, sinon ne pas placer l'options
    1. ne rêvez pas vous ne pouvez pas choisir la compression c'est JPEG obligatoire 
    1. la qualité va de 0 à 100 c'est parfaitement linéaire au rendu.

    Mais ici l'ordre importe peu …donc mettre des * à la place des 1. devrait suffire.


    Je vois que tu es contre les majuscules en début de phrase… :-)

    “It is seldom that liberty of any kind is lost all at once.” ― David Hume

    • [^] # Re: corrections

      Posté par  . Évalué à 8. Dernière modification le 16 février 2022 à 10:42.

      Je vois que tu es contre les majuscules en début de phrase… :-)

      je suppose que tu parles des majuscules après les points de suspension… ça ne me semble pas si systématique que ça:

      Les points de suspension sont suivis d’une majuscule lorsqu’ils équivalent à un point; ils sont suivis de la minuscule quand on leur attribue la valeur d’une virgule ou d’un point-virgule. Il va sans dire que l’emploi de la majuscule après les points de suspension est parfois affaire d’interprétation personnelle :

      Nous comptions aller jusqu’à Québec… Mais à Trois-Rivières, le mauvais temps nous a forcés à arrêter.
      J’étais énervée, j’ai bu du café… beaucoup trop de café.

      https://www.btb.termiumplus.gc.ca/redac-chap?lang=fra&lettr=chapsect6&info0=6.7.6

      • [^] # Re: corrections

        Posté par  . Évalué à 6.

        Non non, il parle bien des majuscules en début de phrase. Jette un oeil au journal :-).

        • [^] # Re: corrections

          Posté par  . Évalué à 1. Dernière modification le 17 février 2022 à 09:05.

          Oui, tu as raison, ma remarque était idiote.

          • [^] # Re: corrections

            Posté par  . Évalué à 4.

            Elle était très intéressante (j'ignorais la subtilité sur les "…" dans la langue de Molière).

  • # DjVu

    Posté par  (site web personnel) . Évalué à 10.

    Pour les documents numérisés, le format DjVu est particulièrement utile, parce qu'il permet de stocker des documents, même en très haute définition, avec un poids modéré. Pour cela, un document y est stocké en trois ou quatre couches superposées :

    • un arrière-plan en couleur, en définition plutôt faible, compressé genre JPEG-2000 ;
    • un « masque » bitonal (noir ou blanc, pas de gris), en haute définition, compressé genre JBIG2 ;
    • un premier-plan en couleur, en définition plutôt faible, compressé genre JPEG-2000 ;
    • au besoin, une couche invisible de caractères issus d'une OCR.

    Pour stocker un document numérisé en DjVu, l'étape cruciale est donc celle qui fera cette séparation en couches. Jusqu'à présent, j'utilisais didjvu. Malheureusement, comme pas mal d'outils liés à ce format, ce n'est que moyennement maintenu, et en particulier, c'est resté en Python 2 pour le moment.

    C'est tout de même très efficace, je stocke sans problème des documents numérisés en 1200 points par pouce dans moins de 100 kio par page. Et pour ceux qui ne lisent pas le PDF, pas de problème, on peut exporter un document DjVu en PDF, ce qui prend beaucoup plus de place, ou même n'exporter que son « masque » bitonal en PDF, pour un poids à peu près identique au DjVu.

    Ce qui se fait en DjVu pourrait maintenant se faire en PDF, vu que ce format prend en charge les images en JPEG-2000 et en JBIG2, et qu'on doit bien pouvoir leur associer un masque alpha pour les superposer. Seulement, il n'y a aucun outil, libre en tout cas, pour faire ça en PDF.

    • [^] # Re: DjVu

      Posté par  . Évalué à 3. Dernière modification le 19 février 2022 à 23:49.

      Impressionnant. Je viens de tester sur un scan de 50 pages photocopiées de textes manuscrits. J'ai scanné en 600 dpi et le pdf pèse 357 Mo. Le fichier DjVu produit par pdf2djvu (disponible dans les dépôts d'Ubuntu 20.04) avec l'option --dpi=600 pèse lui seulement 17,2 Mo, soit 20 fois moins. Le texte est un peu flou par rapport au pdf, mais parfaitement lisible.
      Je suis bluffé.

    • [^] # Re: DjVu

      Posté par  . Évalué à 2.

      pas mal d'outils liés à ce format, ce n'est que moyennement maintenu

      C'est balo pour un format de stockage. C'est pour ça que je l'ai abandonné perso.

      https://linuxfr.org/users/barmic/journaux/y-en-a-marre-de-ce-gros-troll

  • # Petit outil qui ne mange pas de pain...

    Posté par  . Évalué à 3.

    A toutes fins utiles, voici un petit script python qui permet de calculer l'ordre des pages pour imprimer des livrets de toutes sortes avec les options de base d'une imprimante (Par exemple, des livrets A6… après, il faut éventuellement découper…)
    (l'idée est de dire "je veux imprimer un livret (donc du recto verso) avec plus de deux pages par feuille", quel est l'ordre des pages à utiliser pour que si j'imprime en recto verso, les rectos et les versos de mes petites pages tombent bien l'un en face de l'autre…)

    https://python.developpez.com/telecharger/detail/id/6927/Organiser-les-pages-pour-imprimer-des-livrets-avances

    Je m'en sers surtout si je dois imprimer des diaporamas… là, 4 diapos par page, c'est rarement trop petit.
    En A6 livret, c'est la classe.

  • # Impression en A5

    Posté par  . Évalué à 1.

    Si quelqu'un peut m'aider…
    Imprimer en A5, oui, mais la plupart des PDF comportent des marges énormes, ça fait certes plus joli vu de loin, mais comment les réduire pour améliorer la lisibilité?

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.