Forum général.cherche-logiciel site de reconnaissance ocr, vs tesseract?

Posté par  (Mastodon) . Licence CC By‑SA.
Étiquettes :
6
25
sept.
2023

bonjour

j'ai découvert ce weekend un peu par hasard conv3rti0 (sans vouloir faire de pub) pour "extraire" la partie texte de quelques pages imprimées il y a un certain temps
le résultat est bluffant ; je m'interroge, commnent cela fonctionne?
j'ai bien vu le résultat de tesseract, qui s'en sort pas trop mal, mais pour des textes bien clairs, et malheureusement la mise en forme est rarement de mise.

je m'interroge donc : y a t-il un équivalent à ce "service web", en logiciel libre sous linuxie, type tesseract moderne/évolué, sans forcément passer par une IA monstre ou datavore?

merci!

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.