Faire un don ! | | style | statistiques | contactez-nous | plan | lettre d'information

Liens connexes

Dépêche modérée par

Dépêche éditée par

: État des lieux de la reconnaissance de caractères libre (OCR)

Posté par José JORGE (Jabber id, page perso, ). Modéré le 25 mai 2007.
Un contributeur bénévole à Mandriva, Austin Acton, a pris le temps de tester toutes les solutions libres d'OCR (ou ROC pour Reconnaissance Optique de Caractères) disponibles, dans un article en anglais.

Pour les francophones, en voici une synthèse, l'article étant plus complet (avec à la clé, graphiques de comparaison et copies d'écran de chaque produit testé).

Les tests ont porté sur la phrase "The quick brown Métis jumped over the fluffy Finance Manager" permettant de tester quelques pièges classiques pour la reconnaissance, ainsi que les accents, le tout décliné :
  • en différentes polices, de différentes tailles
  • avec des scans en noir et blanc ainsi que nuances de gris
  • le tout à différentes résolutions (ce qui entre en ligne de compte plus qu'on ne pourrait le croire)

> Lire la dépêche (28 commentaires, moyenne: 2,5).  

GOCR est le seul logiciel à reconnaître les caractères accentués, mais n'obtient que 94% de réussite dans la phrase de test. Il est la seule option actuellement pour un texte en français ; la bonne nouvelle, c'est qu'il est disponible dans toutes les distributions.

Clara OCR et OCRE lui ont semblé encore inutilisables.

OCRAD obtient 97%, mais semble incapable de reconnaître les accents.

Tesseract (logiciel libéré par HP en 2006) obtient 99%, en n'ayant échoué que sur les accents.

Ocropus utilise Tesseract et obtient le même résultat. Ses fonctionnalités à venir et le support de Google font qu'il est le plus prometteur.

"Pour le fun", il a aussi essayé la version de démonstration d'un OCR commercial pour Linux : Aspire OCR. Il obtient 91% .

Cette discussion est archivée, il n'est plus possible de laisser des commentaires.

Note : les commentaires appartiennent à ceux qui les ont postés. Nous n'en sommes pas responsables.

mise-en-page

Posté par Étienne Bersac (Jabber id, page perso, ) le 25/05/2007 à 09:57. (lien). Évalué à 6.

Bonjour,

À noter que ce teste ne traite que la reconnaissance de caractère, mais aucunement l'analyse de la mise en page de document (pour extraire les images du texte, remettre en forme un tableau, etc.). Évidemment, il n'y a pas d'analyse de document sans ROC, mais il faut reconnaître à OCRopus son avancé la dessus. D'autant que la reconnaissance d'OCRopus n'est autre que celle de tesseract (pour le moment).

Cet été, un étudiant travail sur la reconnaissance vocale pour pilote le bureau Gnome : http://code.google.com/soc/gnome/appinfo.html?csaid=4F64D394(...) . Gageons que le libre va rattraper son retard dans ces deux domaines cruciaux dans l'avenir de l'informatique.

Étienne

--
E Ultreïa !

Très peu significatif

Posté par nimnim () le 25/05/2007 à 12:05. (lien). Évalué à 3.

C'est un peu rapide de conclure sur le test d'une phrase, sans aucun formattage, qui vient d'être imprimée sur du papier propre.

Dans la vraie vie on fait de la ROC sur des documents que l'on n'a pas en version électronique, qui sont passés par X fax/copieurs, ont des taches/marques/plis, ont été posés de travers à l'une des étapes, etc

De même déduire le support du Français à partir de la reconnaissance d'une lettre accentuée... MDR

Quand à faire de l'analyse de mise en page... si déjà on était capable de récupérer le texte de base proprement. Une analyse de mise en page partielle fait plus de travail que reformatter du simple texte manuellement.

Austin Acton lit cette nouvelle

Posté par Pierre Jarillon (page perso, ) le 25/05/2007 à 18:10. (lien). Évalué à 2.

Austin est un canadien anglophone mais il comprend et parle français (quand c'est nécessaire). Il vient de m'écrire :
"« Ah! Des commentaires interessants! » après avoir lu cet article.

Groklaw utilise Tesseract pour scanner les pdf

Posté par oliv () le 26/05/2007 à 11:55. (lien). Évalué à 3.

Cet article a quelques mois, et décrit l'utilisation de Tesseract par Groklaw pour scanner des documents pdf (dépositions, motions, décisions de tribunaux). Un script est même fourni pour aider. Il semble que Tesseract soit très satisfaisant pour ces documents "du monde réel".
http://www.groklaw.net/article.php?story=20061210115516438

Reconnaissance de caractères pour écriture manuelle

Posté par François BOTTIN () le 27/05/2007 à 15:06. (lien). Évalué à 3.

Je profite de cet article pour m'informer un peu pour un projet que j'ai en tête depuis quelques temps...

Contexte : je suis archer, et je trouve que le logiciel existant fourni par la fédération est une catastrophe : saisie des résultats difficile (quasi obligation d'utiliser la souris lors de la saisie de masse par exemple), limitation de l'OS utilisable (le format d'échange est un « format standard Excel », j'espère que c'est du csv mais je n'ai pas pu voir le détail), nombreux bugs...

Mon idée : je voudrais lancer un projet pour le suivi de compétition qui remplacerait le logiciel actuel. Mais comme la fédération ne voudra certainement pas valider un logiciel qui a été réalisé par trois gars dans un garage, il faut qu'il ait des fonctionnalités supérieures à celui existant. Je pensais alors à la lecture automatique des feuilles de marque.

Les feuilles de marque se composent principalement d'un tableau, avec la marque de chaque flèche par case, puis le total de la volée (une volée est un groupe de 3 ou 6 flèches pour les compétitions les plus classiques), puis le cumul. Une marque est soit « M » (manqué) lorsque la flèche est hors du blason, ou un nombre entre un et dix.

Je me posais donc la question de la faisabilité d'une reconnaissance d'écriture manuelle pour les feuilles de marque, sachant que je remarque souvent des erreurs de calcul lors des cumuls... Les feuilles seraient numérisées et analysées et dès qu'une incohérence marque/cumul est détectée, l'opérateur reprendrait la main et utiliserait son propre système de reconnaissance pour trancher (ses yeux et son cerveau). Il faudrait également détecter la présence de rouge dans une case (modification par un arbitre).

Aujourd'hui, les archers et marqueurs signent leur feuille de marque en fin de tir et cela vaut pour acceptation du résultat... Cela ne me satisfait pas.

Est-ce que quelqu'un connaitrait un outil permettant de faire une reconnaissance ciblée ? Les zones à reconnaitre pouvant être facilement délimitées par une détection de la grille.

Question bonus : est-ce que d'autres archers souhaiteraient mettre en place ce projet avec moi ?

OCR & video

Posté par apossium () le 29/05/2007 à 16:55. (lien). Évalué à 1.

une question...

a de nombreuses reprises j'ai cherché sur le net une solution pour faire de la capture video (avec camera + carte d'acquisition ou webcam seul) et de la reconnaissance de caractères...

je suis certain que ce genre de solution existe, notamment pour la lecture de code barre par video (et pas lecteur code barre)
mais en libre ??
j'ai tenté a partir de plusieurs appli, utiliser des pipes mais entre les pb de carte d'acquisition (ou de webcam), les passages de parametres, les formats, la compilation des sources etc ... je ne m'en sort pas

si vous avez une idée, ou tenté cette experience

merci par avance

--
Ad Augusta, Per Augusta

Revenir en haut de page