OCR sous Linux : comparatif
La reconnaissance optique de caractère (OCR en version anglaise) est un domaine méconnu du monde Linuxien. Pourtant il existe des solutions pour ceux qui veulent éviter la corvée de retaper les documents qu'ils désirent intégrer. Le site LinuxWorld a réalisé un essai comparatif de trois solutions: GOCR et Kooka (basé sur GOCR) qui sont libres et OCR Workshop qui est une solution propiriétaire.
# Re: OCR sous Linux : comparatif
Posté par corn . Évalué à 10.
http://www.kde.org/apps/kooka/(...)
http://jocr.sourceforge.net/(...)
[^] # Re: OCR sous Linux : comparatif
Posté par Yannick . Évalué à 10.
http://www.claraocr.org/(...)
[^] # Re: OCR sous Linux : comparatif
Posté par Nÿco (site web personnel) . Évalué à 0.
[^] # Re: OCR sous Linux : comparatif
Posté par Jerome Alet (site web personnel) . Évalué à 10.
Gocr est cependant nettement plus simple à utiliser.
# s/trois/deux/
Posté par Infernal Quack (site web personnel) . Évalué à 4.
L'association LinuxFr ne saurait être tenue responsable des propos légalement repréhensibles ou faisant allusion à l'évêque de Rome, au chef de l'Église catholique romaine ou au chef temporel de l'État du Vatican et se trouvant dans ce commentaire
[^] # Re: s/trois/deux/
Posté par JSL . Évalué à 10.
[^] # Re: s/trois/deux/
Posté par Ramso . Évalué à 10.
mais je suis sûr qu'il y a d'autres solutions libres (et proprios).
[^] # Re: s/trois/deux/
Posté par Hansolo (site web personnel) . Évalué à 10.
Mais je dois dire que je suis relativement déçu. Après de nombreux essais, je dois dire que je n'ai pas eû la patience d'attendre que gocr fasse son travail : la reconnaissance des caractères semble TRES longue. Il m'est arrivé de faire un essai sur un seul caractère pourtant bien représentatif (document scanné de bonne facture) et après avoir fait mouliner pendant environ 15 min, je ne suis pas allé plus loin. C'est dommage.
Traveling through hyperspace isn't like dusting crops, boy.
[^] # Re: s/trois/deux/
Posté par Benjamin . Évalué à 9.
[^] # Re: s/trois/deux/
Posté par Hansolo (site web personnel) . Évalué à 5.
Traveling through hyperspace isn't like dusting crops, boy.
[^] # Re: s/trois/deux/
Posté par jm trivial (site web personnel) . Évalué à 2.
D'autres paramètres sont configurables: la taille minimum pour qu'un ensemble de points soit considéré comme faisant parti d'une lettre, et le seuil à partir duquel un point est concidéré comme foncé...
De plus, gocr ne gère par défaut que le pnm par défaut, il faut faire la conversion (sauf si le support des autres formats a été installé...)
# Re: OCR sous Linux : comparatif
Posté par Nicolas Boulay (site web personnel) . Évalué à 10.
J'ai rapidement essayer gocr. Vu les nombres de signes dans tout les sens, cela ressemblait plus à de l'ASCII art ou du Warlordz mais pas à un text scanné !
"La première sécurité est la liberté"
[^] # Re: OCR sous Linux : comparatif
Posté par Manuel Menal . Évalué à 10.
GOCR a des performances tout à fait correctes sur un texte imprimé assez clairement et numérisé sans trop de parasites. Il a peu ou pas de post-traitement, il utilise des outils purement "mécaniques" (d'autres diront "algorithmiques") relevant à peine de ce qu'on appelle l'IA, et a des capacités d'apprentissage à peu près inexistantes. Ça reste cependant, à ce jour, l'outil d'OCR le plus efficace sous GNU/Linux, les fondements, plus anciens, d'un GNU OCR étant été oubliés de tous, et aujourd'hui plutôt .. à revoir de fond en comble.
Clara est aussi assez étrange. Il s'agit effectivement d'un projet pour apprendre, et le moins qu'on puisse dire est qu'il ne suit pas des règles courantes. Même à l'utilisation, ça se révèle plutôt .. déroutant :-) Cependant, c'est assez intéressant puisqu'on voit bien les phases de "blobification", etc. etc.
J'ai pour ma part été amené à réaliser un logiciel d'OCR plus « classique » pour GNU/Linux, utilisant simplement quelques procédés simples de pré-traitement - gradient et transformée de Hough, convolve - un réseau de neurones (avec possibilité d'apprentissage supervisé donc, mais aussi non-supervisé au dessus d'un certain seuil de confiance), et une vérification de post-traitement basique de l'ordre du dictionary search, pour l'instant. J'y travaille toujours dans mon temps libre - ce projet a été réalisé pour les Travaux Personnels Encadrés de Terminale scientifique, et aujourd'hui il n'est pas vraiment utilisable par quelqu'un d'autre que moi, parce que je fais mes fichiers de description du RN et de l'activation (y'a possibilité de persistence du RN, donc d'apprentissage par une application externe, mais aussi de persistence des niveaux d'activation) à la main, et de toutes façons il ne sera pas distribué tant que je n'aurai pas clairement établi l'origine de bouts de code repris pour Hough. De toutes façons, je travaille sur des mécanismes de post-traitement plus « intelligents », sur une interface graphique agréable et instructive, et je passe pas mal de temps à faire des tests pour voir ce qui pourrait améliorer en règle générale.
De façon générale, il est aujourd'hui plus performant, avec mon réseau de neurones, que gocr et que clara, et s'adapte très bien au changement de polices. Mais je ne parle pas de reconnaissance d'écriture manuscrite, c'est un _tout_ autre problème.
Enfin, just my 2 cents, et je ferai une news quand il sera prêt pour son first time. :-)
[^] # Re: OCR sous Linux : comparatif
Posté par Pierre Jarillon (site web personnel) . Évalué à 8.
Linus a dit : release often ! Je crois qu'il a raison et tu seras peut être étonné d'avoir de l'aide !
[^] # Re: OCR sous Linux : comparatif
Posté par spart . Évalué à 9.
D'où vient le RN, si ce n'est pas indiscret ? Amygdalia ?
Misère, et pas le moindre petit morceau de source à grignoter... :-]°
[^] # Re: OCR sous Linux : comparatif
Posté par Manuel Menal . Évalué à 10.
J'avoue avoir terriblement hésité, mais je me suis dit que ce serait plus drôle .. :-p
D'où vient le RN, si ce n'est pas indiscret ? Amygdalia ?
(Pour ceux qui ne sont pas « dans le bain », Amygdala <http://amygdala.sourceforge.net/(...)
Non. J'y ai bien pensé, j'ai bien suivi Amygdala, et j'ai lu le code activement. Je fus très intéressé, je le serai sans doute dans le futur : le premier problème est, j'aurais sans aucun doute (et j'ai eu, ça n'a pas manqué) à changer le code de mon RN, et pour ça, il faut que je sois parfaitement à l'aise avec le source. Le code d'Amygdala n'est pas illisible comme l'est beaucoup de code dans ce domaine, mais il est en C++, qui n'est pas tout à fait un langage que j'apprécie.
Je me voyais mal me piquer des crises de nerf sur du C++ :-) D'autant plus que bon, de toutes façons, il aurait fallu que je fasse des bindings, le reste de mon programme étant en C. (allez, j'avoue, y'aura du Guile pour les scripts d'extension .. :-) Bref, trop de boulot. J'ai donc fait ma propre implémentation (à partir d'anciens exercices à moi) assez simple, d'un réseau de neurones. Il est assez performant, bien que très simple. Assez adaptable, puisqu'il lit tout dans un fichier (dont je devrais changer le format, je pense (peut-être du XML, pour faire `in' ? :-) ), mais c'est vrai qu'il pourrait être plus performant. Je le retravaillerais avec l'aide d'Amygdala, et si un jour quelqu'un fait de bons bindings pour Amygdala en C, alors .. je céderai, et jetterai mon petit kibi de lignes de codes, et mon réseau entraîné à bloc pour être aussi performant que voulu le jour de la soutenance, à la poubelle. :-)
À vrai dire, le seul bout de code repris et pas complètement réécrit est pour Hough; à part l'import PGM ASCII, pour lequel je me suis inspiré de The Gimp. Hmm, il serait bien d'avoir une bibliothèque qui puisse m'ouvrir n'importe quelle image et me la filer dans un format qui me conviendrait .. Si quelqu'un a déjà testé, ou a des préférences, etc., you're welcome !
Misère, et pas le moindre petit morceau de source à grignoter... :-]°
Même Kilobug a été prié de rm -Rf'er le code que j'avais laissé sur son laptop pour l'occas' de la soutenance .. :-) Pour l'instant, ça serait pas grand chose, de toutes façons, et surtout inutilisable. Allez, patientez et laissez moi coder.
J'en profite pour répondre à Pierre :
Linus a dit : release often ! Je crois qu'il a raison et tu seras peut être étonné d'avoir de l'aide !
Oui, mais en l'espèce, faudra attendre que (1) ça ait un bon potentiel (2) ça soit légalement distribuable (je suis pas développeur mplayer.). Ce que Linus a oublié de préciser, c'est que le moment où l'on met les sources en ligne pour la première fois joue un rôle absolument essentiel dans la survie ou non du projet : tout, dans la communauté du libre, passe par la réputation, et si le projet fait bonne impression, ça va vite. Sinon, ça pèse contre lui bien longtemps. Donc, voilà, quoi.
[^] # Re: OCR sous Linux : comparatif
Posté par Manuel Menal . Évalué à 10.
[^] # Re: OCR sous Linux : comparatif
Posté par Manuel Menal . Évalué à 10.
Bon, ceci dit, ce sont bien les conneries du système des XPs qui sont en jeu ici. Dommage simplement que, malgré des propositions concrètes, il n'y ait pas eu de discussions et de réflexion à ce propos. (et le "envoie un patch" est un peu facile)
[^] # Re: OCR sous Linux : comparatif
Posté par Yves (site web personnel) . Évalué à 3.
Yves.
[^] # Re: OCR sous Linux : comparatif
Posté par Pierre Tramo . Évalué à 4.
Mais de quoi veux-tu parler, enfin ?
/o\
[^] # Re: OCR sous Linux : comparatif
Posté par Infernal Quack (site web personnel) . Évalué à 7.
Tu l'as connecté à ton cerveau ? :)
L'association LinuxFr ne saurait être tenue responsable des propos légalement repréhensibles ou faisant allusion à l'évêque de Rome, au chef de l'Église catholique romaine ou au chef temporel de l'État du Vatican et se trouvant dans ce commentaire
[^] # Re: OCR sous Linux : comparatif
Posté par Gauthier (Mastodon) . Évalué à 2.
# Rippage de sous-titres
Posté par tgl . Évalué à 10.
Les sous-titres des dvds sont en fait des vilains bitmaps. Heureusement, grâce à "subtitleripper", qui utilise GOCR, on peut les convertir en de gentils formats textes légers, et lisibles par mplayer et autres xines. L'idéal pour épater vos cyber-amis cinéphiles, forcement amateurs de divx en VOSTF...
http://subtitleripper.sourceforge.net/(...)
</le_saviez_vous_?>
[-1] parceque ce commentaire est vraiment niais mais [+1] parceque il pourrait intérresser ceux qui ne le savais pas, donc [0].
Suivre le flux des commentaires
Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.