Forum général.cherche-logiciel site de reconnaissance ocr, vs tesseract?

Posté par  (Mastodon) . Licence CC By‑SA.
Étiquettes :
6
25
sept.
2023

bonjour

j'ai découvert ce weekend un peu par hasard conv3rti0 (sans vouloir faire de pub) pour "extraire" la partie texte de quelques pages imprimées il y a un certain temps
le résultat est bluffant ; je m'interroge, commnent cela fonctionne?
j'ai bien vu le résultat de tesseract, qui s'en sort pas trop mal, mais pour des textes bien clairs, et malheureusement la mise en forme est rarement de mise.

je m'interroge donc : y a t-il un équivalent à ce (…)

Forum Linux.général Solution libre pour PDF "cherchable" (OCR) ?

2
18
nov.
2014

Bonjour,

Je cherche à savoir s'il est raisonnable d'espérer pouvoir compter sur une solution à base de logiciel libre pour ajouter automatiquement (traitement par lot) un calque textuel (via OCR) dans un PDF.

En gros, c'est une option que propose certains multifonction, nommé Searchable PDF. Cette option à un coût et ici, nous pension l'avoir négociée dans l'offre mais ce n'est pas le cas. Le prestataire demande un supplément, etc.

Lorsque nous scannons, un fichier PDF est placé dans un (…)