Journal Google et logiciel OCR Open Source

Posté par  (site web personnel) .
0
5
sept.
2006
Google a annoncé aujourd'hui avoir ouvert le code du logiciel Tesseract.
Celui ci est un logiciel de reconnaissance de caractères développé par HP entre 1985 et 1995. Ils ont corrigé quelques petits bugs avant de faire l'annonce.

Selon l'article, il s'agissait du meilleur logiciel d'OCR à son époque. Reste que c'était il y a 10 ans ... Depuis les logiciels d'OCR ont progressé, arrivent a détecter différents blocs de texte, les images etc...

Souhaitons longue vie à ce projet, il (…)

Forum général.général Tests sur tesseract (OCR Open Source

Posté par  (site web personnel) .
0
18
juil.
2008
Bonsoir,

Souhaitant évaluer l'existant en matière d'OCR Open Source, j'ai procédé au test de tesseract via pytesser.

Résultat ici: http://www.robertviseur.be/news-20080717.php

Pas vraiment concluant, en fait. Il faut vraiment des grosses lettres bien espacées pour avoir une reconnaissance correcte...

Bref, je voudrais avoir votre avis sur ce test: est-ce que la technologie n'est vraiment pas au point, est-ce que je m'y prends mal, est-ce que tesseract est bien pour d'autres usages, etc?

Merci pour votre feedback!