Journal De l'affichage des documents

Posté par  . Licence CC By‑SA.
14
2
avr.
2021

Bonjour Nal,

Si tu vis sur le même fuseau horaire que moi, aujourd'hui c'est vendredi, et vendredi c'est le jour du reconfinement des journaux qui dénoncent grave.

Le problème

Ma thèse est la suivante : Word, LibreOffice Writer, Adobe Acrobat Reader ainsi que tous les lecteurs PDF sont de bons gestionnaires d'impression, mais en termes d'affichage de documents, ils sont catastrophiques1. Quelles en sont les raisons ?

  • Ils raisonnent par pages, ce qui est adapté au papier, beaucoup (…)

Contrat vaccinal Commission européenne / AstraZeneca, comment (ne pas) masquer les infos d'un PDF

Posté par  (site web personnel) . Édité par Ysabeau 🧶 et Pierre Jarillon. Modéré par Ysabeau 🧶. Licence CC By‑SA.
31
31
jan.
2021
Sécurité

En 2012, j’avais écrit cette dépêche Rapport PDF de l’Hadopi, ou comment (ne pas) masquer une adresse IP qui montrait une erreur de caviardage d’information d’un document au format PDF par l’HADOPI, et qui discutait ensuite des deux mythes autour des fichiers PDF : une prétendue inaltérabilité et le caviardage à la truelle.

L’actualité récente nous permet de revenir une nouvelle fois sur le sujet.

  • cela pourrait être à propos de cette discussion surréaliste sur un réseau social bien connu (« (question) vous pensez qu’on peut lire sous le bloc noir de ce document administratif ? (réponse) des fois le caviardage est mal fait (riposte) arrêtez d’aider les administrations ») ;
  • mais je pense surtout à la Commission européenne qui a publié une version caviardée du contrat vaccinal avec AstraZeneca, version qui est plus bavarde que prévu. L’info serait accessible « en utilisant simplement la fonction signets d’Acrobat Reader », comme évoqué ou plus largement dans la presse 1, 2, 3, 4, 5, 6, ou 7), et si le document en ligne a été remplacé, une copie de la première version est toujours en ligne.

Profitons-en pour rappeler que depuis sa version 6.3, LibreOffice offre une fonction de caviardage (voir les annonces dans ce journal et cette dépêche).

Forum Linux.debian/ubuntu TABULA

Posté par  . Licence CC By‑SA.
2
11
mai
2020

Bonjour,
Je souhaitai poster un commmentaire a propos de Tabula sur linux.fr mais j ai pas trouver comment faire…. le sujet est peut etre clos depuis le temps.

Je suis sous ubuntu18.04 avec un HP630 de 2015 (ca rame un peu mais ca marche) …. Ubuntu a jour via synaptic.

J'ai fait un formulaire pdf via libreoffice calc 6.0 et je souhaiterai recuperer les données dans un CSV ce qui m'a conduit a installer Tabula.

J'arrive a récuperer toutes les (…)

ClicPDF — pour aider les gens à télétravailler…

Posté par  . Édité par Davy Defaud et Xavier Teyssier. Modéré par Pierre Jarillon. Licence CC By‑SA.
Étiquettes :
19
23
mar.
2020
Bureautique

Allez, moi aussi j’y vais de mon bidule pour cette période de confinement… Étant proche d’une personne qui demande à ses collaborateurs, clients et autres personnes qui l’entourent de lui envoyer des documents divers et variés, je me suis rendu compte comme ça pouvait être compliqué (formats de fichiers, courriels en vrac, etc.). Alors, je me suis lancé dans un petit délire perso :

  • un téléphone mobile ;
  • une photo du document ;
  • téléversement sur un serveur relai temporaire (rétention entre 4 h et 4 h 59) ;
  • une mise à disposition Web.

Pas d’authentification, pas de vérifications, un peu de PirateBox dans l’idée, du Lufi aussi un peu, mon objectif perso était de voir comment coder une appli minimaliste en NativeScript, et ensuite voir si ça intéresserait cinq personnes ou cinquante…

L’application mobile est en cours de validation sur les Google bidule et Apple truc, j’aimerais un coup de pouce pour la proposer sur F‑Droid, le code source est disponible (release early, je n’ai même pas encore pris le temps de coller tous les en‑têtes GNU GPL, c’est pas bien)… Si vous avez un Android débridé — « rooté » —, vous pouvez installer l’APK, mais c’est mieux si vous recompilez les sources.

Un bon gros coup de pouce pour le code serveur ne serait pas de refus, vu que j’ai fait ça à la triple‑rache (méthode connue).

Pourquoi une rétention entre 4 h et 4 h 59 ? Tout simplement que le cron de nettoyage est lancé par cron.hourly. :-)

La doc est en cours d’écriture (comme tout le reste)… J’essaye de vous faire le topo pour les développeurs en premier, histoire que si ça éveille des vocations ça puisse rapidement vous aider à démarrer !

Happy hacking’!

Forum Linux.général Extraction de données de factures fournisseurs

Posté par  . Licence CC By‑SA.
2
22
oct.
2019

Bonjour, je suis à la recherche d'un outil (logiciel, librairie) pour extraire les données de factures pour import dans Dolibarr. Je cherche une solution qui n'oblige pas à déterminer des zones de traitement OCR. Je vous remercie de votre aide sur ce sujet. Hélène

Forum général.cherche-logiciel OCR sur des factures en PDF et tableau

Posté par  . Licence CC By‑SA.
6
3
oct.
2019

Bonjour,

J'essaye de mettre en place l'import automatique de facture fournisseur dans mon CRM (Dolibarr)
J'uilise actuellement pdf2json pour récupérer les infos du pdf et ensuite je traite tout via du php dans Dolibarr. C'est pas pratique, ça ne fonctionne pas à tout les coups, je cherche donc une solution de remplacement.
La difficulté est de suivre le formatage du pdf source et en particulier les tableaux (changement de ligne, de colonne, dimensions différentes suivant les factures pour un même (…)

Forum général.cherche-logiciel LiquidText

Posté par  . Licence CC By‑SA.
Étiquettes :
1
2
oct.
2019

Bonjour à tou-te-s,

Quelqu'un connaît-il une alternative libre à LiquidText ? Il s'agit d'une "app" pour iPad qui permet de lier des documents, des extraits, des annotations de manière graphique, pour ce que j'en sais…

Le site AlternativeTo propose comme seule alternative libre et utilisable sous GNU/Linux le logiciel "Docear". Malheureusement, celui-ci semble ne plus être développé/maintenu.

Je n'ai rien trouvé d'autre qui semble équivalent.

Ou peut-être une combinaison de logiciels existants ou une autre manière d'arriver au même résultat (…)

Lancement de Formatux v2 : supports de cours GNU/Linux libres

Posté par  . Édité par Davy Defaud, Ysabeau 🧶, Benoît Sibaud et ZeroHeure. Modéré par ZeroHeure. Licence CC By‑SA.
43
18
sept.
2019
Linux

Logo Formatux

Formatux propose des supports de cours GNU/Linux sous licence Creative Commons BY-SA et Art libre à destination des formateurs ou des personnes désireuses d’apprendre à administrer un système GNU/Linux en autodidacte, au format HTML, PDF ou EPUB.

Forum général.cherche-logiciel Connaissez vous une alternative à Utopia Documents ?

Posté par  . Licence CC By‑SA.
2
3
sept.
2019

Bonjour à tous,

Je suis à la recherche d'un logiciel qui serait une alternative à Utopia Documents.

Pour ceux qui ne connaissent pas Utopia Documents est un logiciel Libre, qui est un genre liseuse pour article scientifique. Il analyse les articles scientifiques au format PDF donne des compléments d'information à partir de mots clefs trouvés dans l'article. Et permets de lier l'article en cours de lecture avec d'autres articles, sur le PC ou même en ligne. Ce qui est assez (…)

Première version stable pour WeasyPrint

Posté par  . Édité par ZeroHeure, Davy Defaud et palm123. Modéré par Pierre Jarillon. Licence CC By‑SA.
54
9
nov.
2018
Python

WeasyPrint est un générateur de documents : il transforme des pages HTML/CSS en PDF. Il peut être utilisé en ligne de commande ou comme bibliothèque Python. Et son histoire est très intéressante, laisse‐moi donc te la conter…

Journal Première version stable pour WeasyPrint

Posté par  . Licence CC By‑SA.
Étiquettes :
45
9
nov.
2018
Ce journal a été promu en dépêche : Première version stable pour WeasyPrint.

WeasyPrint est un générateurs de documents : il transforme des pages HTML/CSS en PDF. Il peut être utilisé en ligne de commande ou comme bibliothèque Python. Et son histoire est très intéressante, laisse-moi donc te la conter…

Un peu d'histoire

WeasyPrint est né il y a environ 8 ans. J'avais dans mon entreprise un besoin de générer des rapports, des présentations et des factures automatiquement, avec une mise en page un peu travaillée.

Nous avions alors testé pas mal de (…)

Journal Télécharger tous les fichiers PDF d’un site web

Posté par  (site web personnel) . Licence CC By‑SA.
15
5
avr.
2018

Il y a quelque temps j'ai eu besoin de télécharger tous les PDF d'un gros site web, et puis d'un autre…

J'ai cherché un moment comment obtenir ce que je voulais avec wget mais sans grand succès, soit wget explore récursivement le site en téléchargeant toutes les pages, soit il ne récupère que les fichiers voulus, mais je n'ai pas trouvé comment associer les deux comportements (et il serait logique que wget ait besoin de télécharger les pages du site (…)

Journal 'Markdown presentation processor' (ou de l'intérêt des fichiers texte).

Posté par  (site web personnel) . Licence CC By‑SA.
22
25
fév.
2018

Cherchant à réaliser une présentation vidéo, et utilisant déjà par ailleurs Writer de Libre Office, je me suis naturellement tourné vers Impress pour cela. C'est peut-être un très bon logiciel dans le genre, mais, personnellement, le fait de devoir m'occuper, en même temps, et du contenu, et de sa mise en forme, le peu de motivation que je pouvais avoir disparaissait comme neige au soleil. C'est la première fois que je rédigeais une telle présentation, et c'est le genre (…)