Lien Au Japon, un OCR léger pour lire les livres anciens sans ordinateur puissant

Posté par vida18 le 29 juin 2026 à 18:48.

Étiquettes :

5

29

juin

2026

https://actualitte.com/article/132321/technologie/au-japon-un-ocr-leger-pour-lire-les-livres-anciens-sans-ordinateur-puissant

Lien Adding a feature because ChatGPT incorrectly thinks it exists

Posté par thoasm le 09 juillet 2025 à 14:37.

Étiquettes :

16

9

juil.

2025

https://www.holovaty.com/writing/chatgpt-fake-feature/

Lien Un outil en ligne pour extraire le texte d'images ou de PDF, et tournant localement (via sebsauvage)

Posté par antistress (site web personnel) le 05 avril 2024 à 16:32.

Étiquettes :

6

5

avr.

2024

https://tools.simonwillison.net/ocr?language=fra

Forum général.cherche-logiciel site de reconnaissance ocr, vs tesseract?

Posté par tkr (Mastodon) le 25 septembre 2023 à 00:22. Licence CC By‑SA.

Étiquettes :

6

25

sept.

2023

bonjour

j'ai découvert ce weekend un peu par hasard conv3rti0 (sans vouloir faire de pub) pour "extraire" la partie texte de quelques pages imprimées il y a un certain temps
le résultat est bluffant ; je m'interroge, commnent cela fonctionne?
j'ai bien vu le résultat de tesseract, qui s'en sort pas trop mal, mais pour des textes bien clairs, et malheureusement la mise en forme est rarement de mise.

je m'interroge donc : y a t-il un équivalent à ce (…)

Forum général.cherche-logiciel cherche logiciel d'OCR

Posté par tkr (Mastodon) le 27 juin 2023 à 13:24. Licence CC By‑SA.

Étiquettes :

1

27

juin

2023

bonjour

je cherche un logiciel qui serait multipalteformes au possible, et qui permettrait, sans internet/navigateur, d'extraire le texte d'une image/photo, si cela est possible?

en connaissez vous un?
merci

Lien Les logiciels de manipulation de PDF sous Linux: annoter, signer numériquement, OCR, couper

Posté par dzecniv le 06 avril 2023 à 00:47.

-2

6

avr.

2023

Forum général.cherche-logiciel Logiciel pour traiter automatiquement des questionnaires papiers

Posté par lejocelyn (site web personnel) le 23 février 2023 à 11:40. Licence CC By‑SA.

Étiquettes :

3

23

fév.

2023

Bonjour,

dans le cadre de mes recherches de terrain, je souhaite faire circuler des questionnaires aux gens, et ensuite pouvoir reconnaitre automatiquement leur contenu.

J'ai vu le logiciel AMC (https://www.auto-multiple-choice.net/index.fr), qui en le détournant un peu, pourrait en partie faire le travail, mais comme je souhaiterais avoir des champs textes également, l'outil risque d'être un peu limité.

Je réfléchis également à mettre en place un traitement automatisé via Python. Si vous avez des suggestions à ce niveau, je (…)

Forum général.cherche-logiciel Reconnaissance optique

Posté par abgech le 01 juillet 2021 à 17:30. Licence CC By‑SA.

Étiquettes :

1

juil.

2021

Bonjour,

Mon problème :

J'ai un mode d'emploi d'un appareil en italien (langue que je ne connais pas) et impossible de m'en procurer en français ou en anglais.

Alors j'ai eu l'idée de numériser le mode d'emploi, d'en faire une reconnaissance optique et de soumettre le résultat à un traducteur automatique, même si le résultat est approximatif, je pourrais me débrouiller.

Ce qui me manque, c'est le logiciel OCR sous Linux, libre bien entendu. C'est un domaine que je ne (…)

Journal Scanner et OCR sans passer par le cloud

Posté par ploum (site web personnel, Mastodon) le 02 mars 2021 à 11:42. Licence CC By‑SA.

Étiquettes :

8

2

mar.

2021

Salut Nal,

Je vais avoir besoin de régulièrement scanner des documents pour les transformer en texte sur un ordi Linux.

Je suis donc à la recherche d’une solution qui me permette de facilement scanner et faire de l’OCR. J’aimerais que le résultat soit transmis sous forme de texte brut.

Cependant, je me rends compte que beaucoup de solutions utilisent le cloud or cette solution doit pouvoir fonctionner avec une connexion Internet très intermittente. Par contre, la création d’un réseau local (…)

Lien Internet Archive passe au logiciel libre pour numériser livres et journaux du XIXe siècle

Posté par Colargol le 01 décembre 2020 à 09:19.

Étiquettes :

7

1

déc.

2020

https://www.zdnet.fr/blogs/l-esprit-libre/internet-archive-passe-au-logiciel-libre-pour-numeriser-livres-et-journaux-du-xixe-siecle-39913975.htm

Forum Linux.général Extraction de données de factures fournisseurs

Posté par hservant le 22 octobre 2019 à 20:35. Licence CC By‑SA.

Étiquettes :

2

22

oct.

2019

Bonjour, je suis à la recherche d'un outil (logiciel, librairie) pour extraire les données de factures pour import dans Dolibarr. Je cherche une solution qui n'oblige pas à déterminer des zones de traitement OCR. Je vous remercie de votre aide sur ce sujet. Hélène

Forum général.cherche-logiciel OCR sur des factures en PDF et tableau

Posté par zedS le 03 octobre 2019 à 08:36. Licence CC By‑SA.

Étiquettes :

6

3

oct.

2019

Bonjour,

J'essaye de mettre en place l'import automatique de facture fournisseur dans mon CRM (Dolibarr)
J'uilise actuellement pdf2json pour récupérer les infos du pdf et ensuite je traite tout via du php dans Dolibarr. C'est pas pratique, ça ne fonctionne pas à tout les coups, je cherche donc une solution de remplacement.
La difficulté est de suivre le formatage du pdf source et en particulier les tableaux (changement de ligne, de colonne, dimensions différentes suivant les factures pour un même (…)

Paperwork 1.1

Posté par Jérôme Flesch (site web personnel) le 01 février 2017 à 08:37. Édité par Davy Defaud, ZeroHeure, palm123 et Nils Ratusznik. Modéré par claudex. Licence CC By‑SA.

Étiquettes :

70

1

fév.

2017

Paperwork est un programme de gestion de documents personnels (papiers et PDF) conçu par un flemmard pour les flemmards. Il s’agit d’une interface graphique conçue avec une idée en tête : « scan & forget » (« numériser et puis voilà fini »). Lire, trier et indexer les papiers est un travail de machine, pas d’humain.

Cette nouvelle version inclut principalement des optimisations et quelques corrections de bogues. Une version pour Windows est également disponible. Plus de détails se trouvent en seconde partie.

Paperwork 1.0

Posté par Jérôme Flesch (site web personnel) le 09 novembre 2016 à 15:30. Édité par Davy Defaud, Nils Ratusznik, ZeroHeure et palm123. Modéré par Ontologia. Licence CC By‑SA.

Étiquettes :

88

9

nov.

2016

Paperwork est un programme de gestion de documents papiers (et PDF) conçu par un flemmard pour les flemmards. Il s’agit d’une interface graphique conçue avec une idée en tête : « scan & forget » (« numériser et puis voilà fini »). Lire, trier et indexer les papiers est un travail de machine, pas d’humain.

Journal Reconnaissance d'écriture à main levée

Posté par bubar🦥 le 15 octobre 2016 à 09:13. Licence CC By‑SA.

Étiquettes :

34

15

oct.

2016

Bonjour Nal,

Quelques mots pour signaler que PhatWare, société éditrice de logiciels de reconnaissance d'écriture à main levée, et de prises de notes, vient de libérer le moteur de son logiciel phare « WritePad ». Logiciel permettant d'écrire à main levée sur une surface tactile, ou bien avec un stylet, et qui assure une reconnaissance de caractères afin de transposer l'écriture à main levée en texte.

« WritePad Handwriting Recognition Engine » est désormais disponible, sous licence GPLv3, pour GNU/Linux, Android (…)

Tous les contenus étiquetés avec « ocr »