Forum général.cherche-logiciel OCR sur des factures en PDF et tableau

Posté par  . Licence CC By‑SA.
6
3
oct.
2019

Bonjour,

J'essaye de mettre en place l'import automatique de facture fournisseur dans mon CRM (Dolibarr)
J'uilise actuellement pdf2json pour récupérer les infos du pdf et ensuite je traite tout via du php dans Dolibarr. C'est pas pratique, ça ne fonctionne pas à tout les coups, je cherche donc une solution de remplacement.
La difficulté est de suivre le formatage du pdf source et en particulier les tableaux (changement de ligne, de colonne, dimensions différentes suivant les factures pour un même (…)

Forum Astuces.divers Ré-indexer un pdf

Posté par  (site web personnel, Mastodon) . Licence CC By‑SA.
Étiquettes :
5
18
jan.
2024

Salut,

Je me demandais s'il existait un truc magique pour (re)mettre l'index d'un document PDF.

Pour être concret, j'ai ce pdf qui est une datasheet d'un microcontrôleur (muni d'un eFPGA) qui a bien le sommaire. Le texte est sélectionnable et peut-être copié/collé. Le sommaire est même «cliquable» pour aller directement à la page correspondante.

Cependant il n'y a pas d'index avec les numéros de pages affichables avec son visualiseur préféré (evince chez moi).

Sauriez vous s'il existe un truc «magique» (…)

Forum général.cherche-logiciel Quel logiciel pour Modifier des fichiers PDF ?

Posté par  (site web personnel) . Licence CC By‑SA.
5
13
déc.
2021

Bonjour,

Toujours dans le cadre de notre projet pour 140 ordinateurs "pédagogiques" "hors ligne" (cf.journal), je cherche un logiciel pour manipuler les PDF (modifier l’ordre des pages, les tourner pivoter, supprimer des pages, ajouter des pages d’un autre PDF, etc.)

Le système sera Debian Sid Gnome et j’ai comme habitude d’installer, PDF mod
Mais par ici, ils indiquent “This software is unmaintained and has been archived”.

Qu’en pensez-vous ?

Auriez-vous d’autres logiciels à me suggérer ?

Merci (…)

Forum Linux.général Quels outils pour des PDF en CMYK ? (Scribus)

Posté par  (site web personnel) . Licence CC By‑SA.
3
11
mai
2017

Bonjour,

J'utilise Scribus avec un système GNU pour réaliser des brochures. Car la structure au-sein de laquelle je travail souhaite n'utiliser que des logiciels libres (pour les raisons "éthiques").

Nous avons ici une imprimante multifonction qui imprimer en CMYK.

Lorsque nous imprimons à partir de RGB, le pilote ou l'imprimante converti en CMYK donc.

Mais lorsque nous imprimons à partir de Scribus, les couleurs CMYK sont envoyées telles quelles, et c'est appréciable car nous obtenons alors des couleurs proches de (…)

Forum général.cherche-logiciel Une solution pour scan et archivage de document pour fainéant

Posté par  . Licence CC By‑SA.
Étiquettes :
3
27
mai
2015

Cher forum bonjour, tu m'as manqué,

Je suis à la recherche d'une solution (logiciel ou ensemble de logiciel) pour archiver toute la paperasse qui commence à m'envahir. Les fonctions que je recherche:
- scan le plus simple possible
- génération d'un pdf indexable
- OCR pour archivage du PDF avec indexation et classement automatique en fonction de mots clef (un classement dans une simple arborescence de répertoire serait suffisante)
- possibilité de récupérer les PDF facilement en dehors de la (…)

Forum Linux.général Solution libre pour PDF "cherchable" (OCR) ?

2
18
nov.
2014

Bonjour,

Je cherche à savoir s'il est raisonnable d'espérer pouvoir compter sur une solution à base de logiciel libre pour ajouter automatiquement (traitement par lot) un calque textuel (via OCR) dans un PDF.

En gros, c'est une option que propose certains multifonction, nommé Searchable PDF. Cette option à un coût et ici, nous pension l'avoir négociée dans l'offre mais ce n'est pas le cas. Le prestataire demande un supplément, etc.

Lorsque nous scannons, un fichier PDF est placé dans un (…)

Forum Linux.debian/ubuntu TABULA

Posté par  . Licence CC By‑SA.
2
11
mai
2020

Bonjour,
Je souhaitai poster un commmentaire a propos de Tabula sur linux.fr mais j ai pas trouver comment faire…. le sujet est peut etre clos depuis le temps.

Je suis sous ubuntu18.04 avec un HP630 de 2015 (ca rame un peu mais ca marche) …. Ubuntu a jour via synaptic.

J'ai fait un formulaire pdf via libreoffice calc 6.0 et je souhaiterai recuperer les données dans un CSV ce qui m'a conduit a installer Tabula.

J'arrive a récuperer toutes les (…)

Forum général.cherche-logiciel Indexeur de PDF

Posté par  (site web personnel, Mastodon) . Licence CC By‑SA.
Étiquettes :
2
11
nov.
2013

Chers tous,

je suis à la recherche d'une façon d'avoir online un formulaire pour chercher dans une collection de PDF (les archives du linux journal :) eux-même online également (en interne). Je voudrais au moins trouver un soft qui index les PDF; je peux coder la recherche moi-même s'il le faut. L'idée, pour les curieux, est de permettre à tous mes collègues et à moi-même d'accéder à ces archives et de pouvoir y trouver facilement et rapidement ce qu'on y (…)

Forum Linux.général Comment ajouter des polices de caractères dans un fichier PDF existant ?

Posté par  (site web personnel) . Licence CC By‑SA.
2
29
oct.
2015

Si j'ai un fichier PDF qui n'intègre pas certaines polices de caractères utilisées, je pourrai moi-même installer certaines polices de sorte à pouvoir l'ouvrir correctement. Mais si le but est de pouvoir le transmettre à une tierce personne qui pourrait ne pas être capable de comprendre le problème et installer elle-même les polices, est-il possible "d'injecter", "d'ajouter" les polices dans le fichier pdf ?
Genre :
pdffontmagic --add andlso.ttf simpo.ttf trado.ttf --input elebda3.net-3135.pdf --output elebda3.net-3135bis.pdf

Un logiciel permettant cela existe-t-il ?

Ou (…)

Forum général.cherche-logiciel Connaissez vous une alternative à Utopia Documents ?

Posté par  . Licence CC By‑SA.
2
3
sept.
2019

Bonjour à tous,

Je suis à la recherche d'un logiciel qui serait une alternative à Utopia Documents.

Pour ceux qui ne connaissent pas Utopia Documents est un logiciel Libre, qui est un genre liseuse pour article scientifique. Il analyse les articles scientifiques au format PDF donne des compléments d'information à partir de mots clefs trouvés dans l'article. Et permets de lier l'article en cours de lecture avec d'autres articles, sur le PC ou même en ligne. Ce qui est assez (…)

Forum Linux.débutant traitement de texte document odt vers pdf

Posté par  . Licence CC By‑SA.
Étiquettes :
2
10
jan.
2024

Bonjour, j'ai un document (2 pages de texte et photos), je souhaite le convertir en pdf, je ne comprends pas pourquoi quand j'utilise le convertisseur disponible dans libre office writter, ce convertisseur me parle de microsoft windows?
Et lorsque j'utilise la fonction "exporter directement ou au format pdf" ça fonctionne mais uniquement pour la première page (bien qu'à chaque fois, j'ai sélectionné "tout" ou carrément inscrit pages 1-2?
J'aimerais pouvoir signifier aux créateurs de ce logiciel les défauts pratiques constatés.