... présents sur une étagère à partir d'une simple photos

Posté par martoni (site web personnel, Mastodon) le 26 octobre 2023 à 13:30. Licence CC By‑SA.

Étiquettes :

6

26

oct.

2023

Salut,

Quand on commence à avoir beaucoup de livres/BD/DVD/… sur des étagères il devient galère de les ranger et surtout de savoir si on a une œuvre et où elle se trouve.

Pour simplifier et automatiser cette gestion des œuvres physiques je voulais prendre en photos chaque étagère et faire/utiliser un logiciel de reconnaissance de caractère pour lire les titre sur les tranches.

Pensez vous que ça soit faisable/facile et est-ce que ça existe déjà ?

Typiquement, est-ce que c'est (…)

Forum général.cherche-logiciel Reconnaissance optique

Posté par abgech le 01 juillet 2021 à 17:30. Licence CC By‑SA.

Étiquettes :

1

juil.

2021

Bonjour,

Mon problème :

J'ai un mode d'emploi d'un appareil en italien (langue que je ne connais pas) et impossible de m'en procurer en français ou en anglais.

Alors j'ai eu l'idée de numériser le mode d'emploi, d'en faire une reconnaissance optique et de soumettre le résultat à un traducteur automatique, même si le résultat est approximatif, je pourrais me débrouiller.

Ce qui me manque, c'est le logiciel OCR sous Linux, libre bien entendu. C'est un domaine que je ne (…)

Journal Scanner et OCR sans passer par le cloud

Posté par ploum (site web personnel, Mastodon) le 02 mars 2021 à 11:42. Licence CC By‑SA.

Étiquettes :

8

2

mar.

2021

Salut Nal,

Je vais avoir besoin de régulièrement scanner des documents pour les transformer en texte sur un ordi Linux.

Je suis donc à la recherche d’une solution qui me permette de facilement scanner et faire de l’OCR. J’aimerais que le résultat soit transmis sous forme de texte brut.

Cependant, je me rends compte que beaucoup de solutions utilisent le cloud or cette solution doit pouvoir fonctionner avec une connexion Internet très intermittente. Par contre, la création d’un réseau local (…)

Paperwork 1.0

Posté par Jérôme Flesch (site web personnel) le 09 novembre 2016 à 15:30. Édité par Davy Defaud, Nils Ratusznik, ZeroHeure et palm123. Modéré par Ontologia. Licence CC By‑SA.

Étiquettes :

88

9

nov.

2016

Paperwork est un programme de gestion de documents papiers (et PDF) conçu par un flemmard pour les flemmards. Il s’agit d’une interface graphique conçue avec une idée en tête : « scan & forget » (« numériser et puis voilà fini »). Lire, trier et indexer les papiers est un travail de machine, pas d’humain.

Journal Reconnaissance d'écriture à main levée

Posté par bubar🦥 le 15 octobre 2016 à 09:13. Licence CC By‑SA.

Étiquettes :

34

15

oct.

2016

Bonjour Nal,

Quelques mots pour signaler que PhatWare, société éditrice de logiciels de reconnaissance d'écriture à main levée, et de prises de notes, vient de libérer le moteur de son logiciel phare « WritePad ». Logiciel permettant d'écrire à main levée sur une surface tactile, ou bien avec un stylet, et qui assure une reconnaissance de caractères afin de transposer l'écriture à main levée en texte.

« WritePad Handwriting Recognition Engine » est désormais disponible, sous licence GPLv3, pour GNU/Linux, Android (…)

GNU/Linux a son OCR de qualité

Posté par Texou (site web personnel) le 12 juillet 2016 à 11:16. Édité par Benoît Sibaud, claudex et Nils Ratusznik. Modéré par ZeroHeure. Licence CC By‑SA.

Étiquettes :

10

12

juil.

2016

Un des grands reproches faits aux systèmes GNU/Linux par les utilisateurs déficients visuels était l'absence d'un logiciel de reconnaissance optique de caractères (OCR). Après avoir simplifié l'accès à GNU/Linux et avant d'y avoir implémenté des synthèses vocales de haut niveau, la société Hypra a résolu la question de l'OCR. En partenariat avec l'entreprise Abbyy, elle propose désormais un outil pour reconnaître les documents images issus du Web ou les documents numérisés et afficher leur contenu dans LibreOffice plutôt que dans un visionneur d'images.

L'outil est fourni sous forme d'un binaire. Puis chacun peut le lancer en ligne de commande. Pour ceux qui ont MATE et qui veulent du très simple, Hypra fournit un paquet Debian, installable sur tous systèmes. Il ajoute l'entrée au menu contextuel de caja, le gestionnaire de fichiers. Hypra fournit aussi, avec le paquet, la ligne à ajouter à ses raccourcis pour lancer le scanner par simple raccourci clavier (fonctionne sur tous les bureaux). Ce dispositif installé en fait la suite OCR la plus simple du monde PC puisqu'un raccourci ou une commande du menu contextuel suffit à lancer le scanner, la reconnaissance et l'affichage dans LibreOffice. Avec stockage des images.

Enfin, précisons que l'outil est bien sûr disponible dans le Système à Accès Universel.

Et le prix? Il est vendu 150€. Légèrement moins cher que Nuance OmniPage ou Abbyy FineReader (tous deux propriétaires) sous Windows dans leur version complète, il est la seule offre illimitée, sur GNU/Linux, à ce prix. Jusqu'ici Abbyy proposait simplement une version en ligne de commandes limitée à 12000 pages par an. La version illimitée coûtait 3000 €. C'est donc un bon début insufflé par cette entreprise sociale et solidaire, qui contribue à rendre le monde du libre accessible à tous en retirant les barrières à l'entrée.

NdM.: il est ici question d'une couche d'interface libre pour ajouter la gestion d'un moteur OCR propriétaire à ocrizer. Il existe par ailleurs d'autres moteurs libres d'OCR, plus ou moins avancés et/ou maintenus.

$ dpkg --info ocrizer-finereader_0.1.4-8_all.deb
(...)
 Section: contrib/graphics
(...)
 Description: Finereader engine support for ocrizer
  This package installs the glue between the abby proprietary command line tool
  and ocrizer, and makes finereader an available engine.

Forum Linux.général Solution libre pour PDF "cherchable" (OCR) ?

Posté par Space_e_man (site web personnel) le 18 novembre 2014 à 16:59. Licence CC By‑SA.

Étiquettes :

2

18

nov.

2014

Bonjour,

Je cherche à savoir s'il est raisonnable d'espérer pouvoir compter sur une solution à base de logiciel libre pour ajouter automatiquement (traitement par lot) un calque textuel (via OCR) dans un PDF.

En gros, c'est une option que propose certains multifonction, nommé Searchable PDF. Cette option à un coût et ici, nous pension l'avoir négociée dans l'offre mais ce n'est pas le cas. Le prestataire demande un supplément, etc.

Lorsque nous scannons, un fichier PDF est placé dans un (…)

Journal Comment récupérer les sous-titres d'un enregistrement de la TNT: mini-tuto

Posté par mac_is_mac (site web personnel) le 12 avril 2014 à 11:16. Licence CC By‑SA.

Étiquettes :

17

12

avr.

2014

Bonjour,

Un petit journal pour vous expliquer comment récupérer les sous-titres DVB des chaînes télé françaises et les convertir sous forme d'un fichier texte srt. J'ai pas mal galéré, donc je me suis dit qu'un petit tuto pourrait être utile.

Pré-requis:

je suppose que vous avez un fichier .ts contenant la video et les sous-titres. Normalement, vlc ou totem sont capables d'afficher ces sous-titres.
Si vous découpez un fichier, attention au découpage, certains logiciels perdent la piste de sous-titres au (…)

Journal [pub] MALODOS 1.3

Posté par david guez (site web personnel) le 19 juin 2012 à 13:01. Licence CC By‑SA.

Étiquettes :

25

19

juin

2012

Nombreux sont ceux qui, je le sait, attendaient fébrilement l'arrivée prochaine de la version 1.3 de MALODOS. qu'il soient satisfait, c'est enfin arrivé. Pour les autres, sachez que vous attendiez tout aussi fébrilement cette annonce, mais n'en n'aviez pas conscience, c'est tout.

Tout ça pour dire que j'annonce ici fièrement l'arrivée d'une nouvelle mouture de mon logiciel de gestion de document personnel, le mal nommé (mais je m'en fous) MALODOS.
Les plus attentifs d'entre vous se souviendront avec émotion des (…)

Journal [PUB] Sortie de MALODOS 1.0

Posté par david guez (site web personnel) le 07 avril 2011 à 18:28. Licence CC By‑SA.

Étiquettes :

10

7

avr.

2011

Bonjour a tous,
Comme je l'avais déjà signalé dans un ancien journal, je développe en ce moment un logiciel de GED(http://fr.wikipedia.org/wiki/Gestion_%C3%A9lectronique_des_documents) (Gestion Électronique de Document).
Après quelques itérations le logiciel me semble à présent mûr pour une utilisation réelle. Le code source, sous licence GNU GPL 3 est disponible ici ainsi qu'une ébauche de documentation ici

Je commence à présent à l'utiliser de et je n'ai pas encore trouvé de gros bugs (quelques détails quand même) (…)

GNU ddrescue 1.14 et GNU Ocrad 0.21

Posté par Denis Dordoigne le 14 janvier 2011 à 15:06. Modéré par baud123.

Étiquettes :

26

14

jan.

2011

GNU ddrescue est un logiciel permettant de copier le contenu d'un fichier ou d'un disque vers une autre destination, tout en essayant au passage de résoudre les problèmes d'intégrité de données lorsqu'il rencontre des erreurs de lecture. Il permet notamment d'essayer de récupérer des données d'un disque dur défaillant ou d'un CD-ROM abîmé. La version 1.14 est sortie ce 12 janvier, apportant notamment les améliorations suivantes sous forme d'options :

-R, --reverse qui inverse le sens de la copie ;
-E, --max-error-rate qui arrête ddrescue lorsque la taille des erreurs augmente trop rapidement.

GNU Ocrad est un projet plus jeune, du même auteur que ddrescue, de logiciel et de bibliothèque de reconnaissance optique de caractères basé sur une méthode particulière d'extraction. Il a pour objectif de permettre de récupérer du texte dans toutes les langues connues en UTF-8 depuis une image, tout en sachant repérer les blocs et colonnes typiques des textes imprimés. La version 0.21 est sortie ce 11 janvier, améliorant sensiblement la qualité et la documentation de l'outil.

Journal Scanners sous Linux : coma dépassé ?

Posté par gerard delafond le 26 avril 2009 à 17:22.

Étiquettes :

17

26

avr.

2009

J'ai eu l'occasion d'étudier un peu l'état des scanners ces derniers temps.

Le projet SANE = dernière mise à jour : février 2008. Il n'y a donc plus d'améliorations à faire ?

Le projet scanbuttond (gestion des boutons du scanner) = en léthargie depuis 2007. Mon vieux scanner basé sur Avision, qui devrait fonctionner avec, n'est pas reconnu par ce démon.

L'intégration correcte de Tesseract (OCR à peu près utilisable) dans les distributions : à faire.

J'ai vu ici même (…)

Forum général.général Tests sur tesseract (OCR Open Source

Posté par Robert VISEUR (site web personnel) le 18 juillet 2008 à 02:18.

Étiquettes :

0

18

juil.

2008

Bonsoir,

Souhaitant évaluer l'existant en matière d'OCR Open Source, j'ai procédé au test de tesseract via pytesser.

Résultat ici: http://www.robertviseur.be/news-20080717.php

Pas vraiment concluant, en fait. Il faut vraiment des grosses lettres bien espacées pour avoir une reconnaissance correcte...

Bref, je voudrais avoir votre avis sur ce test: est-ce que la technologie n'est vraiment pas au point, est-ce que je m'y prends mal, est-ce que tesseract est bien pour d'autres usages, etc?

Merci pour votre feedback!

GNOME Scan 0.6 : vulgariser la numérisation

Posté par Anonyme le 11 mars 2008 à 11:00. Modéré par Florent Zara.

Étiquettes :

0

11

mar.

2008

Alors que GNOME print et maintenant GtkPrint offrent une solution efficace pour l'impression, simple tant pour le développeur que pour l'utilisateur, GNOME manque toujours cruellement d'une solution de numérisation en phase avec ses impératifs d'ergonomie, de simplicité, d'accessibilité et de modularité. Gnome Scan ambitionne de combler ce besoin et je vous propose d'en savoir (beaucoup) plus en lisant la suite de cet article.

Forum général.cherche-logiciel Conversion PDF vers Texte

Posté par Anonyme le 09 août 2007 à 08:51.

Étiquettes :

0

9

août

2007

bonjour

existe t il des logiciels qui font la conversion PDF vers Texte ?
Et qui seraient autre chose que les outils adobe pour éditer des docuements pdf ?

Merci pr l'info
a+

Tous les contenus étiquetés avec « reconnaissance_caractères »

Pré-requis: