tag:linuxfr.org,2005:/tags/reconnaissance_caract%C3%A8res/publicLinuxFr.org : les contenus étiquetés avec « reconnaissance_caractères »2023-10-27T14:43:12+02:00/favicon.pngtag:linuxfr.org,2005:Post/439052023-10-26T13:30:18+02:002023-10-26T13:41:23+02:00Lister les livres/DVD/... présents sur une étagère à partir d'une simple photos<p>Salut,</p>
<p>Quand on commence à avoir beaucoup de livres/BD/DVD/… sur des étagères il devient galère de les ranger et surtout de savoir si on a une œuvre et où elle se trouve.</p>
<p>Pour simplifier et automatiser cette gestion des œuvres physiques je voulais prendre en photos chaque étagère et faire/utiliser un logiciel de reconnaissance de caractère pour lire les titre sur les tranches.</p>
<p>Pensez vous que ça soit faisable/facile et est-ce que ça existe déjà ?</p>
<p>Typiquement, est-ce que c'est facile d'établir la liste des DVD présent dans cette image :</p>
<p><img src="//img.linuxfr.org/img/68747470733a2f2f7777772e66616269656e6d2e65752f706172746167652f6476642e6a7067/dvd.jpg" alt="photo de pochettes de DVD rangées dans une étagère" title="Source : https://www.fabienm.eu/partage/dvd.jpg"></p>
<p>thx</p>
<div><a href="https://linuxfr.org/forums/programmationautre/posts/lister-les-livres-dvd-presents-sur-une-etagere-a-partir-d-une-simple-photos.epub">Télécharger ce contenu au format EPUB</a></div> <p>
<strong>Commentaires :</strong>
<a href="//linuxfr.org/nodes/133738/comments.atom">voir le flux Atom</a>
<a href="https://linuxfr.org/forums/programmationautre/posts/lister-les-livres-dvd-presents-sur-une-etagere-a-partir-d-une-simple-photos#comments">ouvrir dans le navigateur</a>
</p>
martonihttps://linuxfr.org/nodes/133738/comments.atomtag:linuxfr.org,2005:Diary/396252021-03-02T11:42:10+01:002021-03-02T11:42:10+01:00Scanner et OCR sans passer par le cloudLicence CC By‑SA http://creativecommons.org/licenses/by-sa/4.0/deed.fr<p>Salut Nal,</p>
<p>Je vais avoir besoin de régulièrement scanner des documents pour les transformer en texte sur un ordi Linux.</p>
<p>Je suis donc à la recherche d’une solution qui me permette de facilement scanner et faire de l’OCR. J’aimerais que le résultat soit transmis sous forme de texte brut.</p>
<p>Cependant, je me rends compte que beaucoup de solutions utilisent le cloud or cette solution doit pouvoir fonctionner avec une connexion Internet très intermittente. Par contre, la création d’un réseau local est tout à fait envisageable.</p>
<p>La solution idéale serait pour moi un scanner qui sauve dans sa mémoire les textes scannés. Je peux ensuite y accéder à ma guise via une connexion USB mass storage.</p>
<p>Mais je n’ai rien trouvé de tel.</p>
<p>Du coup, y’a-t-il des conseils pour une solution qui fasse cela (sous Linux, bien entendu, et sans drivers propriétaires)</p>
<div><a href="https://linuxfr.org/users/ploum/journaux/scanner-et-ocr-sans-passer-par-le-cloud.epub">Télécharger ce contenu au format EPUB</a></div> <p>
<strong>Commentaires :</strong>
<a href="//linuxfr.org/nodes/123451/comments.atom">voir le flux Atom</a>
<a href="https://linuxfr.org/users/ploum/journaux/scanner-et-ocr-sans-passer-par-le-cloud#comments">ouvrir dans le navigateur</a>
</p>
ploumhttps://linuxfr.org/nodes/123451/comments.atomtag:linuxfr.org,2005:Diary/369132016-10-15T09:13:12+02:002016-10-15T09:53:55+02:00Reconnaissance d'écriture à main levéeLicence CC By‑SA http://creativecommons.org/licenses/by-sa/4.0/deed.fr<p>Bonjour Nal,</p>
<p>Quelques mots pour signaler que <a href="http://www.phatware.com/">PhatWare</a>, société éditrice de logiciels de reconnaissance d'écriture à main levée, et de prises de notes, vient de libérer le moteur de son logiciel phare « WritePad ». Logiciel permettant <a href="https://fr.wikipedia.org/wiki/Reconnaissance_de_l%27%C3%A9criture_manuscrite">d'écrire à main levée</a> sur une surface tactile, ou bien avec un stylet, et qui assure une reconnaissance de caractères afin de transposer l'écriture à main levée en texte.</p>
<p>« <em>WritePad Handwriting Recognition Engine</em> » est désormais disponible, sous licence GPLv3, pour GNU/Linux, Android, iOS, MacOS, Windows, et ça ne serait pas trop étonnant qu'il compile aussi sur FreeBSD tranquillement. Il est compilable pour les plateformes Intel x86 & x86-64, ARM & ARM64, MIPS. Les paquetages de reconnaissance linguistique sont également de la partie : allemand, anglais (uk/us), danois, espagnol, français, hollandais, indonésien, italien, portugais, et bien plus ..</p>
<p>À noter que le sdk est fourni séparément, et que celui-ci ne dispose pas de beaucoup de documentations, qui ont été conservé «en interne exclusivement». À noter enfin qu'il s'agit d'une double licence, une licence commerciale restant disponible auprès de l'éditeur initial. </p>
<p>« <em>WritePad Handwriting Recognition Engine</em> » est prévu pour s'interfacer avec d'autres outils et logiciels, typiquement ceux que l'on trouve pour les systèmes mobiles dans leurs apps store respectifs, par exemple il dispose de son propre correcteur orthographique interne et peut utiliser un outil de dictionnaire externe, mais aussi pour l'intégration de sa fonction principale dans un éditeur de textes externes, etc .. </p>
<p>Alors ? un petit WritePad intégré à Gnome et/ou Kde, accessible depuis LibreOffice et Firefox, reconnaissons à main levée que ça aurait belle mine, non ? ;-) </p><div><a href="https://linuxfr.org/users/bubar/journaux/reconnaissance-d-ecriture-a-main-levee.epub">Télécharger ce contenu au format EPUB</a></div> <p>
<strong>Commentaires :</strong>
<a href="//linuxfr.org/nodes/110286/comments.atom">voir le flux Atom</a>
<a href="https://linuxfr.org/users/bubar/journaux/reconnaissance-d-ecriture-a-main-levee#comments">ouvrir dans le navigateur</a>
</p>
bubar🦥https://linuxfr.org/nodes/110286/comments.atomtag:linuxfr.org,2005:News/374262016-07-12T11:16:29+02:002016-07-12T11:16:28+02:00GNU/Linux a son OCR de qualitéLicence CC By‑SA http://creativecommons.org/licenses/by-sa/4.0/deed.fr<div><p>Un des grands reproches faits aux systèmes GNU/Linux par les utilisateurs déficients visuels était l'absence d'un logiciel de reconnaissance optique de caractères (<a href="https://fr.wikipedia.org/wiki/OCR" title="Définition Wikipédia">OCR</a>). Après avoir simplifié l'accès à GNU/Linux et avant d'y avoir implémenté des synthèses vocales de haut niveau, la société Hypra a résolu la question de l'OCR. En partenariat avec l'entreprise <a href="https://fr.wikipedia.org/wiki/ABBYY">Abbyy</a>, elle propose désormais un outil pour reconnaître les documents images issus du Web ou les documents numérisés et afficher leur contenu dans LibreOffice plutôt que dans un visionneur d'images.</p>
<p>L'outil est fourni sous forme d'un binaire. Puis chacun peut le lancer en ligne de commande. Pour ceux qui ont MATE et qui veulent du très simple, Hypra fournit un paquet Debian, installable sur tous systèmes. Il ajoute l'entrée au menu contextuel de caja, le gestionnaire de fichiers. Hypra fournit aussi, avec le paquet, la ligne à ajouter à ses raccourcis pour lancer le scanner par simple raccourci clavier (fonctionne sur tous les bureaux). Ce dispositif installé en fait la suite OCR la plus simple du monde PC puisqu'un raccourci ou une commande du menu contextuel suffit à lancer le scanner, la reconnaissance et l'affichage dans LibreOffice. Avec stockage des images.</p>
<p>Enfin, précisons que l'outil est bien sûr disponible dans le <a href="//linuxfr.org/news/que-devient-hypra">Système à Accès Universel</a>.</p>
<p>Et le prix? Il est vendu 150€. Légèrement moins cher que Nuance OmniPage ou Abbyy FineReader (tous deux propriétaires) sous Windows dans leur version complète, il est la seule offre illimitée, sur GNU/Linux, à ce prix. Jusqu'ici Abbyy proposait simplement une version en ligne de commandes limitée à 12000 pages par an. La version illimitée coûtait 3000 €. C'est donc un bon début insufflé par cette entreprise sociale et solidaire, qui contribue à rendre le monde du libre accessible à tous en retirant les barrières à l'entrée.</p>
<p><strong>NdM.:</strong> il est ici question d'une couche d'interface libre pour ajouter la gestion d'un moteur OCR propriétaire à <a href="http://git.hypra.fr/hypra/ocrizer">ocrizer</a>. Il existe par ailleurs d'autres moteurs libres d'OCR, <a href="https://en.wikipedia.org/wiki/Comparison_of_optical_character_recognition_software">plus ou moins avancés et/ou maintenus</a>.</p>
<pre><code>$ dpkg --info ocrizer-finereader_0.1.4-8_all.deb
(...)
Section: contrib/graphics
(...)
Description: Finereader engine support for ocrizer
This package installs the glue between the abby proprietary command line tool
and ocrizer, and makes finereader an available engine.
</code></pre></div><ul><li>lien nᵒ 1 : <a title="http://hypra.fr" hreflang="fr" href="https://linuxfr.org/redirect/97678">Site d'Hypra</a></li><li>lien nᵒ 2 : <a title="http://mate-desktop.org" hreflang="en" href="https://linuxfr.org/redirect/97679">MATE</a></li></ul><div></div><div><a href="https://linuxfr.org/news/gnu-linux-a-son-ocr-de-qualite.epub">Télécharger ce contenu au format EPUB</a></div> <p>
<strong>Commentaires :</strong>
<a href="//linuxfr.org/nodes/109515/comments.atom">voir le flux Atom</a>
<a href="https://linuxfr.org/news/gnu-linux-a-son-ocr-de-qualite#comments">ouvrir dans le navigateur</a>
</p>
TexouBenoît SibaudclaudexNils Ratusznikhttps://linuxfr.org/nodes/109515/comments.atomtag:linuxfr.org,2005:Post/346712014-11-18T16:59:36+01:002014-11-18T16:59:36+01:00Solution libre pour PDF "cherchable" (OCR) ?<p>Bonjour,</p>
<p>Je cherche à savoir s'il est raisonnable d'espérer pouvoir compter sur une solution à base de logiciel libre pour ajouter automatiquement (traitement par lot) un calque textuel (via OCR) dans un PDF.</p>
<p>En gros, c'est une option que propose certains multifonction, nommé Searchable PDF. Cette option à un coût et ici, nous pension l'avoir négociée dans l'offre mais ce n'est pas le cas. Le prestataire demande un supplément, etc.</p>
<p>Lorsque nous scannons, un fichier PDF est placé dans un dossier partagé (Samba) sur un serveur GNU/Linux Debian. Et donc, je me disais qu'il y avait peut-être déjà une solution à base de logiciel libre pour passer l'image matricielles contenue dans le PDF dans un OCR (genre Tesseract, OCRopus ou GOCR) et ajouterait le texte obtenu au bon endroit comme un calque (layer en anglais) dans un nouveau fichier PDF, en plus de l'image (nouveau fichier). C'est ce que fait l'option payant dans le multifonction, sauf qu'ici, ça se ferait au niveau du multifonction.</p>
<p>Je cherche également par moi-même sur le web mais je trouve rien pour l'instant…, sauf les certaines pièces du puzzle (poppler-utils → pdfimage pour extraire l'image ; Tesseract pour l'OCR ; …) dans l'idée de créer un nouveau logiciel… Mais peut-être existe-t-il déjà ?</p><div><a href="https://linuxfr.org/forums/linux-general/posts/solution-libre-pour-pdf-cherchable-ocr.epub">Télécharger ce contenu au format EPUB</a></div> <p>
<strong>Commentaires :</strong>
<a href="//linuxfr.org/nodes/104006/comments.atom">voir le flux Atom</a>
<a href="https://linuxfr.org/forums/linux-general/posts/solution-libre-pour-pdf-cherchable-ocr#comments">ouvrir dans le navigateur</a>
</p>
Space_e_manhttps://linuxfr.org/nodes/104006/comments.atomtag:linuxfr.org,2005:Diary/348832014-04-12T11:16:13+02:002014-04-12T11:16:13+02:00Comment récupérer les sous-titres d'un enregistrement de la TNT: mini-tutoLicence CC By‑SA http://creativecommons.org/licenses/by-sa/4.0/deed.fr<p>Bonjour,</p>
<p>Un petit journal pour vous expliquer comment récupérer les sous-titres DVB des chaînes télé françaises et les convertir sous forme d'un fichier texte srt. J'ai pas mal galéré, donc je me suis dit qu'un petit tuto pourrait être utile.</p>
<h2 id="pré-requis-">Pré-requis: </h2>
<p>je suppose que vous avez un fichier .ts contenant la video et les sous-titres. Normalement, vlc ou totem sont capables d'afficher ces sous-titres.<br>
Si vous découpez un fichier, attention au découpage, certains logiciels perdent la piste de sous-titres au découpage (par exemple dvbcut). Pour ma part, je coupe avec un dd if=$entree of=$sortie ibs=100000 skip=$taille count=$c.</p>
<h2 id="installation">Installation:</h2>
<p>Vous aurez besoin du logiciel de reconnaissance de caractères tesseract, ainsi que d'outils de création de sous-titres: sous debian, ce sont les paquets tesseract, tesseract-ocr-fra, ogmrip.</p>
<p>Je suppose également que java est installé.</p>
<p>Ensuite, il faut récupérer une version très récente de ProjectX.<br>
La version dans les dépots a un bug</p>
<p><a href="http://forum.dvbtechnics.info/showthread.php?t=32024">http://forum.dvbtechnics.info/showthread.php?t=32024</a></p>
<p>Une fois ProjectX.zip téléchargé, sauvez-le sous<br>
/usr/local/share/projectx/ProjectX.jar<br>
sudo mkdir /usr/local/share/projectx/lib<br>
cd /usr/local/share/projectx/lib<br>
sudo wget <a href="http://mirrors.ibiblio.org/pub/mirrors/maven/commons-net/jars/commons-net-1.3.0.jar">http://mirrors.ibiblio.org/pub/mirrors/maven/commons-net/jars/commons-net-1.3.0.jar</a></p>
<h2 id="utilisation">Utilisation:</h2>
<p>Mettre le fichier .ts dans un sous-répertoire (pleins de fichiers vont être créés), puis lancer </p>
<p>java -jar /usr/local/share/projectx/ProjectX.jar</p>
<p>File: sélectionner le fichier ts</p>
<p>Cliquer sur Prepare, puis Presettings, </p>
<p>Onglet Output: tout décocher, sauf subpicture<br>
Onglet Subtitle: cocher "additional export as Vobsub", choisir la Fonte (je prends courier). Dans l'onglet "simulate DVB Subpictures IRD Color Model", je prends UkFreeview(mc). Vous pouvez tenter d'autres combinaisons, mais un mauvais choix peux amener à des sous-titres que le logiciel de reconnaissance ne saura pas traiter (en particulier le choix par défaut ne convient pas).</p>
<p>On peut fermer l'onglet, et lancer le traitement avec la touche en forme de triangle. Dans la fenêtre de log, vous pouvez controler le nombre de sous-titres reconnus.</p>
<p>On ouvre maintenant un terminal dans le répertoire utilisé:</p>
<p>b="mon_fichier.sup"<br>
l="fra"<br>
subp2tiff --sid=0 -n $b<br>
for i in *.tif; do tesseract $i $i -l $l; done<br>
subptools -s -w -t srt -i $b.xml -o $b.srt</p>
<p>Et c'est fini, il n'y a plus qu'à éditer le fichier .srt pour corriger les petites erreurs.</p><div><a href="https://linuxfr.org/users/mac_is_mac/journaux/comment-recuperer-les-sous-titres-d-un-enregistrement-de-la-tnt-mini-tuto.epub">Télécharger ce contenu au format EPUB</a></div> <p>
<strong>Commentaires :</strong>
<a href="//linuxfr.org/nodes/101851/comments.atom">voir le flux Atom</a>
<a href="https://linuxfr.org/users/mac_is_mac/journaux/comment-recuperer-les-sous-titres-d-un-enregistrement-de-la-tnt-mini-tuto#comments">ouvrir dans le navigateur</a>
</p>
mac_is_machttps://linuxfr.org/nodes/101851/comments.atomtag:linuxfr.org,2005:Diary/327312012-06-19T13:01:09+02:002012-06-23T17:31:08+02:00[pub] MALODOS 1.3Licence CC By‑SA http://creativecommons.org/licenses/by-sa/3.0/deed.fr<p>Nombreux sont ceux qui, je le sait, attendaient fébrilement l'arrivée prochaine de la version 1.3 de MALODOS. qu'il soient satisfait, c'est enfin arrivé. Pour les autres, sachez que vous attendiez tout aussi fébrilement cette annonce, mais n'en n'aviez pas conscience, c'est tout.</p>
<p>Tout ça pour dire que j'annonce ici fièrement l'arrivée d'une nouvelle mouture de mon logiciel de gestion de document personnel, le mal nommé (mais je m'en fous) MALODOS.<br />
Les plus attentifs d'entre vous se souviendront avec émotion des <a href="http://linuxfr.org/users/davguez/journaux/pub-malodos-12-beta-1">journaux précédents</a> expliquant <a href="http://linuxfr.org/users/davguez/journaux/pub-sortie-dun-logiciel-de-gestion-de-document-%C3%A9lectronique">par le menu</a> l'idée <a href="http://linuxfr.org/users/davguez/journaux/pub-sortie-de-malodos-10">du logiciel</a>, que je résume rapidement ici pour ceux qui n'auraient pas particulièrement envie de se taper les trois <a href="http://linuxfr.org/recherche?utf8=%E2%9C%93&q=malodos">journaux précédents</a>.<br />
Donc, MALODOS est un logiciel développé en python/wxwidgets, disponible sous licence GPL v3 , permettant de scanner vos documents papier, pour ensuite sauvegarder sous forme électronique les contenus en question avec toutes les possibilités offertes par ce mode d'archivage : recherche par mots-clefs / corps du texte (MALODOS s'interface avec n'importe quel OCR utilisable en ligne de commande, des modèles étant fournis en standard pour Tesseract, ocropus, hocr et gocr).<br />
Il est aussi possible de créer des archives contenant tout ou partie des documents ainsi que la sous-base de donnée associée sous forme d'un zip portable.</p>
<p>La nouvelle version apporte un lot relativement conséquent de nouveautés, à savoir :</p>
<ol><li>Possibilité de sauvegarder les documents en bmp/jpg/tiff/png (avant ça n'était que disponible en lecture, mais seulement pdf en écriture).Évidemment, pour les documents multipages, seuls le pdf et le tiff sont acceptés.</li>
<li>Possibilité d'ajouter un scan ou le contenu d'un fichier à la fin d'un document existant</li>
<li>Possibilité de regrouper plusieurs documents en un seul.</li>
<li>Ajout d'un panier virtuel dans lequel on ajoute des documents (par double clique ou via une icone idoine). Ensuite les différentes options tels que le regroupement, la suppression, la création d'un zip portable, etc… peuvent être automatiquement appliquée à l'ensemble des documents du panier</li>
<li>Ajout d'une fenêtre permettant de construire une requête pas à pas (pour ceux qui ont du mal avec les écritures du genre description=voiture AND date>21/05/2010 )</li>
<li>Possibilité de faire des recherche non pas sur des mots entiers mais sur des parties de mots (genre "constitu" trouve aussi "anticonstitutionel", désolé pour l'exemple pourris ;-)</li>
<li>et quelques corrections de bug évidemment</li>
</ol><p>Voilà il me reste encore beaucoup de choses en tête, en particulier la possibilité de chiffrer la base de donnée et les documents générés, ainsi que la possibilité d'un mode en ligne. Mais pour l'instant, il faut surtout que je mette à jour la documentation qui est pour le moins sommaire.<br />
Il faut aussi que je termine de faire un vrai package python avec setup et tout. Pour l'instant, celui que j'ai fait me supprime le répertoire /usr si je lui demande de désinstaller le logiciel, du coup je me demande si c'est publiable tel quel et dans le doute, principe de précaution oblige, j'évite d'effacer le système de mes chers utilisateurs ayant des velléités de départ.</p>
<p>Voilà voilà, courrez vite télécharger</p><div><a href="https://linuxfr.org/users/davguez/journaux/pub-malodos-1-3.epub">Télécharger ce contenu au format EPUB</a></div> <p>
<strong>Commentaires :</strong>
<a href="//linuxfr.org/nodes/94566/comments.atom">voir le flux Atom</a>
<a href="https://linuxfr.org/users/davguez/journaux/pub-malodos-1-3#comments">ouvrir dans le navigateur</a>
</p>
david guezhttps://linuxfr.org/nodes/94566/comments.atomtag:linuxfr.org,2005:Diary/309722011-04-07T18:28:38+02:002011-04-07T18:28:38+02:00[PUB] Sortie de MALODOS 1.0Licence CC By‑SA http://creativecommons.org/licenses/by-sa/3.0/deed.fr<p>Bonjour a tous,<br />
Comme je l'avais déjà signalé dans un ancien <a href="http://linuxfr.org/users/davguez/journaux/pub-sortie-dun-logiciel-de-gestion-de-document-%C3%A9lectronique">journal</a>, je développe en ce moment un logiciel de <a href="http://fr.wikipedia.org/wiki/GED" title="Définition Wikipédia">GED</a>(<a href="http://fr.wikipedia.org/wiki/Gestion_%C3%A9lectronique_des_documents">http://fr.wikipedia.org/wiki/Gestion_%C3%A9lectronique_des_documents</a>) (Gestion Électronique de Document).<br />
Après quelques itérations le logiciel me semble à présent mûr pour une utilisation réelle. Le code source, sous licence GNU GPL 3 est disponible <a href="http://code.google.com/p/malodos/downloads/list">ici</a>
ainsi qu'une ébauche de documentation <a href="http://sites.google.com/site/malodospage/home">ici</a></p>
<p>Je commence à présent à l'utiliser de et je n'ai pas encore trouvé de gros bugs (quelques détails quand même)<br />
Par contre il manque encore cruellement d'une recherche plain texte, qui sera l'objet de la suite de mes développements, avec quelques petites améliorations que j'ai en tête.</p>
<p>Tous les retours, rapports de bugs, etc... sont les bienvenues, si le cœur vous en dit.</p>
<p>Merci, vous pouvez éteindre votre ordinateur.</p><div><a href="https://linuxfr.org/users/davguez/journaux/pub-sortie-de-malodos-10.epub">Télécharger ce contenu au format EPUB</a></div> <p>
<strong>Commentaires :</strong>
<a href="//linuxfr.org/nodes/85565/comments.atom">voir le flux Atom</a>
<a href="https://linuxfr.org/users/davguez/journaux/pub-sortie-de-malodos-10#comments">ouvrir dans le navigateur</a>
</p>
david guezhttps://linuxfr.org/nodes/85565/comments.atomtag:linuxfr.org,2005:News/277762011-01-14T15:06:20+01:002011-01-14T15:06:20+01:00GNU ddrescue 1.14 et GNU Ocrad 0.21<div><b>GNU ddrescue</b> est un logiciel permettant de copier le contenu d'un fichier ou d'un disque vers une autre destination, tout en essayant au passage de résoudre les problèmes d'intégrité de données lorsqu'il rencontre des erreurs de lecture. Il permet notamment d'essayer de récupérer des données d'un disque dur défaillant ou d'un CD-ROM abîmé. La version 1.14 est sortie ce 12 janvier, apportant notamment les améliorations suivantes sous forme d'options :
<br />
<ul><li><i>-R, --reverse</i> qui inverse le sens de la copie ;
<br />
</li><li><i>-E, --max-error-rate</i> qui arrête ddrescue lorsque la taille des erreurs augmente trop rapidement.</li></ul>
<br />
<br />
<b>GNU Ocrad</b> est un projet plus jeune, du même auteur que ddrescue, de logiciel et de bibliothèque de <a href="http://fr.wikipedia.org/wiki/reconnaissance optique de caractères" title="Définition Wikipédia">reconnaissance optique de caractères</a> basé sur une méthode particulière d'extraction. Il a pour objectif de permettre de récupérer du texte dans toutes les langues connues en <a href="http://fr.wikipedia.org/wiki/UTF-8">UTF-8</a> depuis une image, tout en sachant repérer les blocs et colonnes typiques des textes imprimés. La version 0.21 est sortie ce 11 janvier, améliorant sensiblement la qualité et la documentation de l'outil.</div><ul><li>lien nᵒ 1 : <a title="http://www.gnu.org/software/ddrescue/ddrescue.html" hreflang="en" href="https://linuxfr.org/redirect/70543">GNU ddrescue</a></li><li>lien nᵒ 2 : <a title="http://www.gnu.org/software/ocrad/ocrad.html" hreflang="en" href="https://linuxfr.org/redirect/70544">GNU Ocrad</a></li><li>lien nᵒ 3 : <a title="http://lists.gnu.org/archive/html/bug-ddrescue/2011-01/msg00032.html" hreflang="en" href="https://linuxfr.org/redirect/70545">Annonce de ddrescue 1.14</a></li><li>lien nᵒ 4 : <a title="http://lists.gnu.org/archive/html/bug-ocrad/2011-01/msg00001.html" hreflang="en" href="https://linuxfr.org/redirect/70546">Annonce de Ocrad 0.21</a></li><li>lien nᵒ 5 : <a title="http://savannah.gnu.org/users/antonio" hreflang="fr" href="https://linuxfr.org/redirect/70547">Projets de Antonio Diaz Diaz</a></li></ul><div></div><div><a href="https://linuxfr.org/news/gnu-ddrescue-114-et-gnu-ocrad-021.epub">Télécharger ce contenu au format EPUB</a></div> <p>
<strong>Commentaires :</strong>
<a href="//linuxfr.org/nodes/26688/comments.atom">voir le flux Atom</a>
<a href="https://linuxfr.org/news/gnu-ddrescue-114-et-gnu-ocrad-021#comments">ouvrir dans le navigateur</a>
</p>
Denis Dordoignehttps://linuxfr.org/nodes/26688/comments.atomtag:linuxfr.org,2005:Diary/281892009-04-26T17:22:21+02:002009-04-26T17:22:21+02:00Scanners sous Linux : coma dépassé ?
J'ai eu l'occasion d'étudier un peu l'état des scanners ces derniers temps.<br />
<br />
Le projet SANE = dernière mise à jour : février 2008. Il n'y a donc plus d'améliorations à faire ?<br />
<br />
Le projet scanbuttond (gestion des boutons du scanner) = en léthargie depuis 2007. Mon vieux scanner basé sur Avision, qui devrait fonctionner avec, n'est pas reconnu par ce démon.<br />
<br />
L'intégration correcte de Tesseract (OCR à peu près utilisable) dans les distributions : à faire.<br />
<br />
J'ai vu ici même quelqu'un qui avait commencé à écrire (je ne retrouve pous le post) des améliorations de SANE, en particulier pour gérer directement les boutons du scanner depuis SANE. Ça a abouti à quelque chose ?<div><a href="https://linuxfr.org/users/delafond/journaux/scanners-sous-linux-coma-d%C3%A9pass%C3%A9.epub">Télécharger ce contenu au format EPUB</a></div> <p>
<strong>Commentaires :</strong>
<a href="//linuxfr.org/nodes/54522/comments.atom">voir le flux Atom</a>
<a href="https://linuxfr.org/users/delafond/journaux/scanners-sous-linux-coma-d%C3%A9pass%C3%A9#comments">ouvrir dans le navigateur</a>
</p>
gerard delafondhttps://linuxfr.org/nodes/54522/comments.atomtag:linuxfr.org,2005:Post/255552008-07-18T02:18:52+02:002008-07-18T02:18:52+02:00Tests sur tesseract (OCR Open Source
Bonsoir, <br />
<br />
Souhaitant évaluer l'existant en matière d'OCR Open Source, j'ai procédé au test de tesseract via pytesser. <br />
<br />
Résultat ici: <a href="http://www.robertviseur.be/news-20080717.php">http://www.robertviseur.be/news-20080717.php</a><br />
<br />
Pas vraiment concluant, en fait. Il faut vraiment des grosses lettres bien espacées pour avoir une reconnaissance correcte...<br />
<br />
Bref, je voudrais avoir votre avis sur ce test: est-ce que la technologie n'est vraiment pas au point, est-ce que je m'y prends mal, est-ce que tesseract est bien pour d'autres usages, etc?<br />
<br />
Merci pour votre feedback!<div><a href="https://linuxfr.org/forums/general-general/posts/tests-sur-tesseract-ocr-open-source.epub">Télécharger ce contenu au format EPUB</a></div> <p>
<strong>Commentaires :</strong>
<a href="//linuxfr.org/nodes/80139/comments.atom">voir le flux Atom</a>
<a href="https://linuxfr.org/forums/general-general/posts/tests-sur-tesseract-ocr-open-source#comments">ouvrir dans le navigateur</a>
</p>
Robert VISEURhttps://linuxfr.org/nodes/80139/comments.atomtag:linuxfr.org,2005:News/238272008-03-11T11:00:00+01:002008-03-11T11:00:00+01:00GNOME Scan 0.6 : vulgariser la numérisation<div>Alors que <a href="http://www.gnome.org/projects/gnome-print/">GNOME print</a> et maintenant <a href="http://library.gnome.org/devel/gtk/stable/Printing.html">GtkPrint</a> offrent une solution efficace pour l'impression, simple tant pour le développeur que pour l'utilisateur, <a href="http://www.gnomefr.org/">GNOME</a> manque toujours cruellement d'une solution de numérisation en phase avec ses impératifs d'ergonomie, de simplicité, d'accessibilité et de modularité. Gnome Scan ambitionne de combler ce besoin et je vous propose d'en savoir (beaucoup) plus en lisant la suite de cet article.</div><ul><li>lien nᵒ 1 : <a title="http://www.gnome.org/projects/gnome-scan/index" hreflang="fr" href="https://linuxfr.org/redirect/56285">Page de GNOME Scan</a></li><li>lien nᵒ 2 : <a title="http://ftp.gnome.org/pub/GNOME/sources/gnome-scan/0.6" hreflang="en" href="https://linuxfr.org/redirect/56286">Téléchargement</a></li><li>lien nᵒ 3 : <a title="http://blogs.gnome.org/gnome-scan/" hreflang="en" href="https://linuxfr.org/redirect/56287">Journal du développement</a></li><li>lien nᵒ 4 : <a title="http://bugzilla.gnome.org/enter_bug.cgi?product=gnome-scan" hreflang="en" href="https://linuxfr.org/redirect/56288">Rapporter une anomalie</a></li><li>lien nᵒ 5 : <a title="http://bersace03.free.fr/pub/GNOME/Scan/Review/" hreflang="en" href="https://linuxfr.org/redirect/56289">Revue des interfaces de numérisation</a></li><li>lien nᵒ 6 : <a title="http://linuxfr.org/2008/03/10/23822.html" hreflang="fr" href="https://linuxfr.org/redirect/56290">GNOME 2.22</a></li></ul><div>Contrairement à l'impression, la numérisation reste un domaine utilisé principalement par les professionnels et les passionnés, certains utilisateurs la fuient tout simplement. On s'épargnera la description de la situation sous les systèmes d'exploitations propriétaires. Sous GNU/Linux, la décision a été prise il y a de nombreuses année de décharger le noyau du support des scanners, il sera géré en espace utilisateur. Le projet <a href="http://www.sane-project.org/">SANE</a> est l'API et l'implémentation de référence pour le support des scanners sous GNU/Linux et plus. SANE est indépendant de l'interface. De nombreuses interfaces sont apparues : un exemple en GTK+ fourni avec SANE, un fork de ce dernier baptisé XSane et développé par Oliver Rauch, OpenOffice dispose d'une interface rudimentaire au dessus de SANE, <a href="http://kooka.kde.org/">Kooka</a> pour <a href="http://fr.kde.org/">KDE</a> 3, <a href="http://eikazo.berlios.de/">Eikazo</a> en py/gtk, etc. GNOME est le grand absent de cette liste, et les distributions orientées GNOME se sont rabattues sur XSane. Ce logiciel reproduit certaines erreurs de conception de plusieurs logiciels fournis avec les scanners : un logiciel tiers qui veut s'intégrer partout et centraliser tous les accès au scanner.
<br />
<br />
<a href="http://www.advogato.org/article/741.html">Mark Finlay</a> avait commencé le projet GNOME Scan en 2004, mais il mourut avant de pouvoir donner vie aux <a href="http://bersace03.free.fr/pub/Images/Captures/Gnome/Scan/Mark%20Finlay/">maquettes d'un logiciel de numérisation</a>. Ross Burton at Alan Horkan s'étaient jurés d'accomplir ce projet en sa mémoire. Finalement en mars 2006, après des pérégrinations autour de la numérisation, je lance la discussion sur la conception d'une bibliothèque proposant la numérisation clef en main pour les développeurs et une interface facile pour les utilisateurs. Martin Schön m'aida beaucoup dans les discussions sur l'architecture du projet. Le projet démarre, prend forme dans le cadre du Google Summer of Code 2006 sous la houlette de Vincent Untz (aussi connu sous le nom de « Dieu »). Un long cycle de développement aboutit, vers Noël 2006 à Gnome Scan 0.4. La 0.4 reste une preuve de principe : la numérisation dans une bibliothèque, ça a du sens. Les premiers problèmes se posent : le logiciel n'est pas assez flexible face à la diversité des scanners, de l'utilisation de la numérisation et de la disparité des pilotes de scanner SANE.
<br />
<br />
Le printemps 2007 est l'occasion de repenser GNOME Scan pour qu'il soit plus modulaire et plus flexible. Après quelques semaines de brouillonnage et de diagramme, je me lance dans la réécriture du projet. Une fois de plus, Google apporte son soutien financier et Vincent Untz son soutien psychologique. Août 2007, une ébauche de greffon <a href="http://abiword.org/">AbiWord</a> intègre la numérisation et la <a href="http://fr.wikipedia.org/wiki/Reconnaissance_optique_de_caract%C3%A8res"><abbr title="Reconnaissance optique de caractères">ROC</abbr></a> directement dans AbiWord. Ryan Paul gratifie cette nouvelle d'un article sur Ars Technica. Moment de gloire. AbiScan reste cependant une preuve de principe s'appuyant sur des technologies très fraîches : <a href="http://code.google.com/p/ocropus/">OCRopus</a>, <a href="http://gegl.org">GEGL</a> et GNOME Scan. Après le <abbr title="Google Summer of code">GSoC</abbr>, la décision est prise de suivre le cycle de GNOME et de calquer la numérotation de version sur celle de GNOME. La branche 0.5 est donc une branche instable qui aboutira sur la 0.6, stable (en terme d'utilisation, pas d'API).
<br />
<br />
La phrase maîtresse de GNOME Scan est : <b>« Rendre la numérisation aussi simple que l'impression tant pour les utilisateurs que pour les développeurs. »</b>
<br />
<br />
Comme prévu, en parallèle avec GNOME 2.22, GNOME Scan 0.6 sort, traduit en 15 langues dont 6 à 100%. Cette version apporte un jeu de fonctionnalités très pertinent :<ul><li> Une interface de numérisation simple, réciproque de l'impression
<br />
</li><li> Un traitement des images adapté aux grosses résolutions grâce à GEGL, conçu pour <a href="http://gimp.org">Gimp</a>
<br />
</li><li> Une API extensible pour l'adapter aux spécificités de l'application
<br />
</li><li> Un utilitaire de numérisation pour enregistrer dans une image
<br />
</li><li> Un greffon Gimp pour numériser dans un nouvelle image ou dans un nouveau calque.
<br />
</li><li> Une infrastructure prête pour le futur : branchement à chaud, traitement d'image, multiples API d'accès au scanner, etc.
<br />
</li><li> Par défaut, rotation et amélioration automatique des couleurs sont proposées.
<br />
</li><li> Une interface optimisée pour la numérisation de masse, rapide et efficace avec la prise en charge des chargeurs de document, la réduction de l'interaction avec le logiciel si l'utilisateur doit manipuler lui-même les pages à numériser, etc.
<br />
</li><li> L'enregistrement automatique des options de numérisation par application.</li></ul>Le futur est prometteur, plein de choses sont à améliorer, à tous les niveaux. La 0.8 prévue pour GNOME 2.24 en septembre prochain devrait recevoir beaucoup de consolidation de l'API, amélioration du support des scanners (options évoluées, disparité des scanners, branchement à chaud, boutons matériels et optimisations de l'interface comme la possibilité de revenir en arrière, la réduction du nombre de popup, etc.)
<br />
<br />
GNOME Scan utilise désormais l'infrastructure de gnome.org pour les sources, le téléchargement, la page web, le suivi des bug, le blog, etc. Des paquets deb sont disponibles pour Ubuntu dans ma <a href="http://launchpad.net/~bersace/+archive">PPA</a> pour gutsy. Je migre désormais en Hardy pour la suite du développement.
<br />
<br />
<b>Un travail collaboratif</b>
<br />
<br />
GNOME Scan est vraiment au cœur de la pile de numérisation du bureau. En amont, il y a SANE, <a href="http://hal.freedesktop.org/">HAL</a>, OCRopus et GEGL ; en aval il y a Gimp, AbiWord, Evolution, OpenOffice, F-Spot et tant d'autres applications qui gagneraient à intégrer la numérisation. En théorie, toute application qui imprime devrait numériser.
<br />
<br />
GNOME Scan fut le premier projet à s'appuyer sur GEGL, ce qui lui donna un coup de pouce non négligeable. Aujourd'hui, GIMP tire aussi partie de GEGL. Cela prouve que l'intuition des développeurs de GIMP de créer un GStreamer de l'image était juste. KDE traîne toujours des tableaux interminables d'octets pour faire transiter les images dans libkscan !
<br />
<br />
<b>Le cas SANE</b>
<br />
<br />
SANE a de nombreux mérite, mais pose également quelques soucis. Le standard de SANE est très minimal et n'évolue quasiment pas. De sorte que l'idée d'une version 1.2 avant la 2.0 a eu du mal à faire son chemin. L'évolution de SANE depuis 10 ans a été d'implémenter de nouveaux pilotes et de corriger les bugs. Or il y a clairement des manques dans SANE voire des erreurs conceptuelles qu'il faut résoudre, tant du point de vue du développeur de pilote que du développeur d'interface.
<br />
<br />
En tant qu'interface, GNOME Scan est en butte à quelques problèmes :
<br />
<ul><li> Les pilotes sont très très très disparates. Certains se contentent d'exposer les registres de la puce, d'autres proposent des options de haut-niveau mais incomplètes. Le nommage des options est anarchique.
<br />
</li><li> Le concept d'option est utilisé pour représenter les capteurs, les options et les groupe d'options, dans la même structure, au final, c'est l'interface qui doit faire le tri.
<br />
</li><li> SANE ne parle quasiment pas des évènements matériels (boutons, capteur, etc.). La seule chose qu'une interface peut connaître, c'est qu'une option est définie par le matériel plutôt que par le logiciel. Aucune sémantique n'est donnée, de sorte que l'interface ne peut pas savoir à quelle action correspond l'évènement : "numériser", "annuler", "éjecter", "automatique", "papier inséré", "couvercle ouvert" ? Il y a tant de possibilités !</li></ul>Au final, les pilotes n'exposent pas toutes les capacités du matériel, plus ou moins selon la volonté du développeur, et de manière incohérente. C'est très pénible lorsque l'on veut maîtriser un minimum l'interface pour offrir à l'utilisateur un logiciel intelligent et non un simple configurateur de pilote.
<br />
<br />
<b>HAL</b>
<br />
<br />
Actuellement je développe le support des scanners dans HAL grâce au travail effectué dans SANE pour publier un fdi depuis la 1.0.19. C'est encore dans un git local et j'ai l'intention de publier ça rapidement sur HAL et être hébergé sur freedesktop.org. Ça se présente sous la forme d'un greffon au démon hald, qui est exécuté sur chaque scanner branché et reconnu. Il détermine le nom de scanner SANE, observe les capteurs et publie un signal au besoin. Il implémente l'interface org.freedesktop.Hal.Device.Scanner qui permet simplement à l'interface de prendre possession du scanner pour l'utiliser. C'est assez pénible de se dire qu'il faut dupliquer le code de gestion des évènements si on veut en tirer partie dans l'interface elle-même.
<br />
<br />
<b>Reconnaissance optique de caractères</b>
<br />
<br />
GNOME n'a rien pour la ROC. J'ai timidement lancé le projet <a href="http://live.gnome.org/LibAccroc">libaccroc</a> dont le but est de produire une API GObject simpliste qui permet de faire abstraction du moteur de ROC (OCRopus, tesseract, gocr, ocrad, claraocr, hocr, etc.) et de choisir globalement le moteur de son choix. GNOME Scan proposera une sous-classe depuis la chaîne de traitement intégrant directement la ROC. Il y a du boulot également au niveau de l'intégration d'<a href="http://unpaper.berlios.de">unpaper</a> ou de <a href="http://cimg.sourceforge.net/greycstoration/">greycstoration</a> qui permettent d'apprêter une image pour la ROC.
<br />
<br />
Une fois ce travail effectué, on pourra revenir à la charge sur AbiScan et avoir un truc stable et fonctionnel. On peut même se permettre de parler d'une fonctionnalité ultime. OpenOffice.org-gnome pourra en tirer parti également.
<br />
<br />
<b>KDE</b>
<br />
<br />
Kooka a longtemps été une très bonne alternative à XSane pour KDE, il a notamment été "<i>bibliothèquisé</i>" pour tenter de répondre au besoin des autres applications (DigiKam). KDE 4 propose libkscan qui reprend le concept de Kooka. À la différence de GNOME Scan, l'API de libkscan est très très simpliste. Un widget KScanDialog avec deux signaux "scan-terminé" et "roc-terminée" et deux appels de fonction pour récupérer l'image dans un tableau d'octets ou le texte reconnu. Je suis un peu déçu car KDE semble absent dans les discussions en amont pour SANE et HAL. Vos retours sont les bienvenus (captures d'écrans, commentaires, liens, etc.). J'espère qu'avec HAL-scanner, la collaboration fera jour.
<br />
<br />
<b>Interface</b>
<br />
<br />
J'ai à cœur de faire de GNOME Scan l'interface la plus optimisée, pour la numérisation la plus efficace et la plus accessible. Je tiens par exemple à permettre de se passer de l'aperçu avant et après numérisation, notamment en ce qui concerne les ROC. L'utilisateur doit pouvoir se contenter de sélectionner format de papier, orientation, résolution, couleur et peut-être rotation ainsi que les options de sortie (nom de fichier, de calque, d'album photo, etc.) et lancer directement la numérisation. Pas besoin d'assistant à 12 étapes. La numérisation de masse doit être extrêmement rapide : Appuyer sur Entrée déclenche la numérisation suivante. Il faut également pouvoir revenir en arrière aisément pour changer juste une option et continuer (ex: numériser d'abord les photos paysage puis les photos portrait, sans relancer toute la machinerie).
<br />
<br />
Il y a beaucoup de boulot à ce niveau, et les retours, rêves, idées concrètes, patchs sont les bienvenus.
<br />
<br />
<b>API</b>
<br />
<br />
Il faut également que la numérisation soit très accessible pour le développeur. Cela passe d'abord par une API flexible et simple. Écrire des greffons pour différentes applications aide à concevoir quelques choses d'efficace. L'optimisation de l'API (éviter d'exposer trop de fonctions qui amèneraient le développeur à la confusion), la documentation, le développement de passerelles, l'écriture de tutoriels sont impératifs pour la démocratisation de la numérisation dans GNOME.
<br />
<br />
Techniquement, GNOME Scan doit tirer toujours plus parti de GEGL, notamment de la nouvelle API d'opération qui permettra une gestion bien meilleure de la chaîne de traitement (multi processus, progression continue de bout en bout, etc.)
<br />
<br />
<b>Contribuer</b>
<br />
<br />
Depuis 2 ans, je travaille quasiment seul sur ce projet. Les traducteurs aident, Ross Burton m'a envoyé quelques patches et il est désormais contributeur de GNOME Scan. Philip Sadleder et quelques autres utilisateurs des premières heures m'ont bien aidé à corriger des anomalies ou retrouver de la motivation. Vincent Untz m'a toujours volontiers distribué des coups de fouets pour relancer le projet. Mais j'ai toujours cette crainte de concevoir un projet finalement clos, réduit à ma propre vision de la numérisation.
<br />
<br />
Aussi, n'hésitez pas à contribuer en envoyant vos idées sur le bugzilla. Telle fonctionnalité, tel comportement, tel traitement d'image, telle option, etc. Que chacun donne son avis, ça me permettra d'avoir une vision globale et d'offrir une solution vraiment adaptée à l'utilisateur.
<br />
<br />
<b>Remerciements</b>
<br />
<br />
Je tiens à remercier tout ceux qui m'ont apporté leur soutien, tout spécialement sur ce site, mais également sur Jabber, IRC, le bugzilla, par courriel ; en envoyant des idées, des rapports de bogue, parfois maladroits mais ô combien utiles et encourageants.
<br />
<br />
La route est encore longue, mais la voie est libre !</div><div><a href="https://linuxfr.org/news/gnome-scan-06-vulgariser-la-numerisation.epub">Télécharger ce contenu au format EPUB</a></div> <p>
<strong>Commentaires :</strong>
<a href="//linuxfr.org/nodes/22935/comments.atom">voir le flux Atom</a>
<a href="https://linuxfr.org/news/gnome-scan-06-vulgariser-la-numerisation#comments">ouvrir dans le navigateur</a>
</p>
https://linuxfr.org/nodes/22935/comments.atomtag:linuxfr.org,2005:Post/227922007-08-09T08:51:23+02:002007-08-09T08:51:23+02:00Conversion PDF vers Textebonjour<br />
<br />
existe t il des logiciels qui font la conversion PDF vers Texte ?<br />
Et qui seraient autre chose que les outils adobe pour éditer des docuements pdf ?<br />
<br />
Merci pr l'info<br />
a+<div><a href="https://linuxfr.org/forums/general-cherche-logiciel/posts/conversion-pdf-vers-texte.epub">Télécharger ce contenu au format EPUB</a></div> <p>
<strong>Commentaires :</strong>
<a href="//linuxfr.org/nodes/77434/comments.atom">voir le flux Atom</a>
<a href="https://linuxfr.org/forums/general-cherche-logiciel/posts/conversion-pdf-vers-texte#comments">ouvrir dans le navigateur</a>
</p>
FueLhttps://linuxfr.org/nodes/77434/comments.atomtag:linuxfr.org,2005:News/225322007-05-25T11:13:48+02:002007-05-25T11:13:48+02:00État des lieux de la reconnaissance de caractères libre (OCR)<div>Un contributeur bénévole à Mandriva, Austin Acton, a pris le temps de tester toutes les solutions libres d'<a href="http://fr.wikipedia.org/wiki/Reconnaissance_optique_de_caract%C3%A8res">OCR</a> (ou ROC pour Reconnaissance Optique de Caractères) disponibles, dans un article en anglais.
<br />
<br />
Pour les francophones, en voici une synthèse, l'article étant plus complet (avec à la clé, graphiques de comparaison et copies d'écran de chaque produit testé).
<br />
<br />
Les tests ont porté sur la phrase "<i>The quick brown Métis jumped over the fluffy Finance Manager</i>" permettant de tester quelques pièges classiques pour la reconnaissance, ainsi que les accents, le tout décliné :
<br />
<ul><li>en différentes polices, de différentes tailles
<br />
</li><li>avec des scans en noir et blanc ainsi que nuances de gris
<br />
</li><li>le tout à différentes résolutions (ce qui entre en ligne de compte plus qu'on ne pourrait le croire)</li></ul> </div><ul><li>lien nᵒ 1 : <a title="http://groundstate.ca/ocr" hreflang="en" href="https://linuxfr.org/redirect/52198">Analyse par Austin Aucton</a></li><li>lien nᵒ 2 : <a title="http://code.google.com/p/ocropus/" hreflang="en" href="https://linuxfr.org/redirect/52199">Ocropus</a></li><li>lien nᵒ 3 : <a title="http://jocr.sourceforge.net/" hreflang="en" href="https://linuxfr.org/redirect/52200">GOCR</a></li></ul><div>GOCR est le seul logiciel à reconnaître les caractères accentués, mais n'obtient que 94% de réussite dans la phrase de test. Il est la seule option actuellement pour un texte en français ; la bonne nouvelle, c'est qu'il est disponible dans toutes les distributions.
<br />
<br />
Clara OCR et OCRE lui ont semblé encore inutilisables.
<br />
<br />
OCRAD obtient 97%, mais semble incapable de reconnaître les accents.
<br />
<br />
Tesseract (logiciel <a href="/2006/10/07/21437.html">libéré par HP en 2006</a>) obtient 99%, en n'ayant échoué que sur les accents.
<br />
<br />
Ocropus utilise Tesseract et obtient le même résultat. Ses <a href="/2007/05/18/22513.html">fonctionnalités à venir</a> et le support de Google font qu'il est le plus prometteur.
<br />
<br />
"Pour le fun", il a aussi essayé la version de démonstration d'un OCR commercial pour Linux : Aspire OCR. Il obtient 91% .</div><div><a href="https://linuxfr.org/news/etat-des-lieux-de-la-reconnaissance-de-caracteres-libre-ocr.epub">Télécharger ce contenu au format EPUB</a></div> <p>
<strong>Commentaires :</strong>
<a href="//linuxfr.org/nodes/21838/comments.atom">voir le flux Atom</a>
<a href="https://linuxfr.org/news/etat-des-lieux-de-la-reconnaissance-de-caracteres-libre-ocr#comments">ouvrir dans le navigateur</a>
</p>
José JORGEhttps://linuxfr.org/nodes/21838/comments.atomtag:linuxfr.org,2005:News/225132007-05-18T08:00:00+02:002007-05-18T08:00:00+02:00Reconnaissance optique de caractères avec OCRopus<div>Voilà un projet qu'il est nécessaire de mettre en lumière. OCRopus est un système d'analyse de document comprenant analyse de mise-en-page modulaire, reconnaissance optique de caractères modulaire tout cela en tenant compte de la langue.
<br />
<br />
OCRopus est né de deux projets de recherche : un lecteur d'écriture manuelle à haute performance développé dans le milieu des années 90 et utilisé par le US Census bureau et un projet d'analyse de mise-en-page de document à haute performance (évidemment) du team <a href="http://www.iupr.org/">IUPR</a> (<b>I</b>mage <b>U</b>nderstanding and <b>P</b>attern <b>R</b>ecognition). Le projet a été lancé le 11 avril 2007 et est sponsorisé par Google. Il est mené par le professeur Thomas Breuel du centre de recherche allemand sur l'intelligence artificielle accompagné par des post-doctorants et des thésards.
<br />
<br />
Actuellement, le projet se base uniquement sur le moteur <a href="http://sourceforge.net/projects/tesseract-ocr">tesseract</a> mais la conception modulaire du projet ouvre les portes à d'autres moteurs de reconnaissance optique de caractères tel <a href="http://code.google.com/p/hocr-tools">hOCR</a>.
<br />
<br />
Le projet compte sur les contributions de la communauté du logiciel libre pour implémenter le support de nouvelles langues, pour créer une application Gnome, intégrer la reconnaissance dans l'infrastructure de recherche du bureau Gnome, développer des outils divers et créer de nouveaux moteurs, etc.</div><ul><li>lien nᵒ 1 : <a title="http://www.ocropus.org/" hreflang="en" href="https://linuxfr.org/redirect/52130">OCRopus</a></li><li>lien nᵒ 2 : <a title="http://lwn.net/Articles/229955/" hreflang="en" href="https://linuxfr.org/redirect/52131">L'annonce</a></li><li>lien nᵒ 3 : <a title="http://lwn.net/Articles/230004/" hreflang="en" href="https://linuxfr.org/redirect/52132">Article de présentation sur LWN</a></li><li>lien nᵒ 4 : <a title="http://code.google.com/p/ocropus/wiki/FrequentlyAskedQuestions" hreflang="en" href="https://linuxfr.org/redirect/52133">FAQ</a></li></ul><div>Actuellement, les plateformes linux x86 et X86_64 sont ciblées, bien que le but soit à terme de tourner n'importe où. On notera les limitations dues à tesseract qui mélange allègrement les différentes normes C (C89, C99, ANSI C) et C++, sans se soucier de la portabilité. Le code de OCRopus est actuellement principalement du C++ avec du python tandis que système de compilation est jam. Les yeux se tournent vers lua comme langage de scriptage interne de choix.
<br />
<br />
Actuellement, un aperçu technologique est fourni sous licence Apache/MIT et le <a href="http://code.google.com/p/ocropus/source">code source de OCRopus est disponible</a>. Cette version préliminaire inclue Tesseract pour la <a href="http://fr.wikipedia.org/wiki/Reconnaissance_optique_de_caract%C3%A8res">ROC</a>, RAST pour l'analyse de mise-en-page un outil de modélisation de langage basé sur aspell ainsi que des outils de tests. Le format de sortie serait du HTML avec des informations spécifique à l'OCR embarqué dans le HTML.
<br />
<br />
La première version alpha devrait débarquer durant le 3ème trimestre 2007. Cette version devrait inclure la distinction entre les images et le texte ; une modélisation du langage basé sur <a href="http://www.openfst.org/">OpenFST</a> ; le support de hOCR ; le détramage et autres pré-traitement de l'image. La première bêta suivra au premier trimestre 2008 avant la finale au troisième trimestre 2008.
<br />
<br />
À l'horizon post 1.0, se profile l'apprentissage à la volée, une interface web service, la reconnaissance depuis le format PDF, appareil photo ou écran , et d'autre avancées plus techniques.
<br />
<br />
Le projet se veut utile et fait donc un appel pour le support d'autres langues ; l'empaquetage pour Ubuntu, Debian, Fedora et d'autres plateformes ; des interfaces graphiques pour Gnome, Windows, Macintosh ; l'intégration dans les moteurs de recherche Beagle, Spotlight, Google Desktop Search …
<br />
<br />
Une fois de plus, Google promeut en acte le logiciel libre. Alors que l'OCR est un domaine où le libre a un très grand retard, la libération de tesseract et l'initiation de ce projet ouvre de réelles perspectives. De plus, les propriétés du logiciels libres s'appliquent afin de doper le développement : réutilisation de projet existant (tesseract, hocr, RAST, OpenFST, …), appel à contributions, mutualisation du développement, …
<br />
<br />
Gageons que la reconnaissance optique de caractères et son intégration dans les systèmes pourrait devenir un domaine où le libre réussirait à construire une avance sur le logiciel propriétaire, comme il en a dans bien d'autres domaines (sécurité, portabilité, système de paquets, thémabilité, live-cd…).</div><div><a href="https://linuxfr.org/news/reconnaissance-optique-de-caracteres-avec-ocropus.epub">Télécharger ce contenu au format EPUB</a></div> <p>
<strong>Commentaires :</strong>
<a href="//linuxfr.org/nodes/21819/comments.atom">voir le flux Atom</a>
<a href="https://linuxfr.org/news/reconnaissance-optique-de-caracteres-avec-ocropus#comments">ouvrir dans le navigateur</a>
</p>
https://linuxfr.org/nodes/21819/comments.atom