Journal Paperwork : Besoin de testeurs

28
5
mai
2013
Ce journal a été promu en dépêche : Paperwork : besoin de testeurs.

Paperwork est un outil pour faciliter la gestion de la paperasse de tout les jours.

Il a été conçu pour les flemmards désorganisés comme moi, dans une optique de "scan&forget" : vous devriez pouvoir juste scanner un document, l'enterrer dans une pile de papiers quelconque, et quand même le retrouver le jour où vous en avez besoin. Après tout, trier est un travail de machine.

À chaque scan, Paperwork se charge de passer un coup d'OCR sur le document (...)

Journal Paperless...

Posté par . Licence CC by-sa
13
19
avr.
2013

Cher journal,

Plusieurs semaines de congés arrivant, j'aimerai entamer mon projet de numérisation de toute ma paperasse administrative qui me prend une place folle et d'envoyer tous ces bits indigestes vers mon NAS.
Pour la partie numérisation, j'avais pensé au DoxieGo qui me parait pas mal et surtout ne prend pas une place folle.
Mes interrogation viennent de la partie GED, j'avais pensé monter un Alfresco sur une VM mais j'ai peur que cela soit un peu "overkill", qu'en penses-tu ?

Journal [pub] MALODOS 1.3

25
19
juin
2012

Nombreux sont ceux qui, je le sait, attendaient fébrilement l'arrivée prochaine de la version 1.3 de MALODOS. qu'il soient satisfait, c'est enfin arrivé. Pour les autres, sachez que vous attendiez tout aussi fébrilement cette annonce, mais n'en n'aviez pas conscience, c'est tout.

Tout ça pour dire que j'annonce ici fièrement l'arrivée d'une nouvelle mouture de mon logiciel de gestion de document personnel, le mal nommé (mais je m'en fous) MALODOS.
Les plus attentifs d'entre vous se souviendront avec émotion des (...)

Journal Gérer sa paperasse quand on est une feignas^W^W un programmeur

Posté par (page perso) . Licence CC by-sa
59
1
avr.
2012

Tout le monde a déjà eut affaire à une administration, et tout le monde sait qu'ils n'hésitent pas à demander des documents vieux de plus de 3 mois. Sauf que, quand on a une aptitude innée à la désorganisation comme moi, retrouver ces documents peut vite prendre du temps. Je pourrais simplement ranger mes papiers, mais je suis un programmeur, donc il faut que je complique pour simplifier.

L'idée que j'ai eut alors fût de scanner mes documents et de (...)

Journal Médoc, un dépôt de documents fait maison

34
18
déc.
2011

C'est en farfouillant pour la énième fois dans une pile de papelards que je me suis dit qu'il y en avait assez d'avaler de la poussière en rêvant de Ctrl-F, et qu'il était temps d'enfin faire quelque chose d'utile avec mes compétences de pisseur de code.

Ce qui a débuté comme quelques scripts mis bout à bout est aujourd'hui une solution intégrée de numérisation, à travers un client lourd, et de classement et de consultation, à partir d'un client Web. (...)

Forum Linux.général Scanner mes cours: quels logiciels? scanner, OCR, gestion...

Posté par (page perso) .
2
4
mai
2011

Salut à tous,

Mes cours prennent énormément de place dans mon placard, et j'aimerais les numériser pour de bon.

Je suis donc à la recherche de ce genre de choses:

  • un logiciel qui permette de scanner à la suite, sans avoir à réaliser tout le processus d'enregistrement de l'image qui vient d'être scannée (on fera ça plus tard...)
  • un éventuel logiciel d'OCR, pour les polycopiés: si il est possible de sortir un PDF avec texte sélectionnable, c'est le bonheur
  • un (...)

Journal [PUB] Sortie de MALODOS 1.0

10
7
avr.
2011

Bonjour a tous,
Comme je l'avais déjà signalé dans un ancien journal, je développe en ce moment un logiciel de GED(http://fr.wikipedia.org/wiki/Gestion_%C3%A9lectronique_des_documents) (Gestion Électronique de Document).
Après quelques itérations le logiciel me semble à présent mûr pour une utilisation réelle. Le code source, sous licence GNU GPL 3 est disponible ici ainsi qu'une ébauche de documentation ici

Je commence à présent à l'utiliser de et je n'ai pas encore trouvé de gros bugs (quelques détails quand même) (...)

GNU GNU ddrescue 1.14 et GNU Ocrad 0.21

Posté par . Modéré par baud123.
26
14
jan.
2011
GNU
GNU ddrescue est un logiciel permettant de copier le contenu d'un fichier ou d'un disque vers une autre destination, tout en essayant au passage de résoudre les problèmes d'intégrité de données lorsqu'il rencontre des erreurs de lecture. Il permet notamment d'essayer de récupérer des données d'un disque dur défaillant ou d'un CD-ROM abîmé. La version 1.14 est sortie ce 12 janvier, apportant notamment les améliorations suivantes sous forme d'options :
  • -R, --reverse qui inverse le sens de la copie ;
  • -E, --max-error-rate qui arrête ddrescue lorsque la taille des erreurs augmente trop rapidement.


GNU Ocrad est un projet plus jeune, du même auteur que ddrescue, de logiciel et de bibliothèque de reconnaissance optique de caractères basé sur une méthode particulière d'extraction. Il a pour objectif de permettre de récupérer du texte dans toutes les langues connues en UTF-8 depuis une image, tout en sachant repérer les blocs et colonnes typiques des textes imprimés. La version 0.21 est sortie ce 11 janvier, améliorant sensiblement la qualité et la documentation de l'outil.

Journal Scanners sous Linux : coma dépassé ?

Posté par .
17
26
avr.
2009
J'ai eu l'occasion d'étudier un peu l'état des scanners ces derniers temps.

Le projet SANE = dernière mise à jour : février 2008. Il n'y a donc plus d'améliorations à faire ?

Le projet scanbuttond (gestion des boutons du scanner) = en léthargie depuis 2007. Mon vieux scanner basé sur Avision, qui devrait fonctionner avec, n'est pas reconnu par ce démon.

L'intégration correcte de Tesseract (OCR à peu près utilisable) dans les distributions : à faire.

J'ai vu ici même (...)

Forum général.général Tests sur tesseract (OCR Open Source

Posté par (page perso) .
0
18
juil.
2008
Bonsoir,

Souhaitant évaluer l'existant en matière d'OCR Open Source, j'ai procédé au test de tesseract via pytesser.

Résultat ici: http://www.robertviseur.be/news-20080717.php

Pas vraiment concluant, en fait. Il faut vraiment des grosses lettres bien espacées pour avoir une reconnaissance correcte...

Bref, je voudrais avoir votre avis sur ce test: est-ce que la technologie n'est vraiment pas au point, est-ce que je m'y prends mal, est-ce que tesseract est bien pour d'autres usages, etc?

Merci pour votre feedback!

Gnome GNOME Scan 0.6 : vulgariser la numérisation

Posté par (page perso) . Modéré par Florent Zara.
0
11
mar.
2008
Gnome
Alors que GNOME print et maintenant GtkPrint offrent une solution efficace pour l'impression, simple tant pour le développeur que pour l'utilisateur, GNOME manque toujours cruellement d'une solution de numérisation en phase avec ses impératifs d'ergonomie, de simplicité, d'accessibilité et de modularité. Gnome Scan ambitionne de combler ce besoin et je vous propose d'en savoir (beaucoup) plus en lisant la suite de cet article.

Journal OCRopus 0.1 : première version !

Posté par (page perso) .
0
23
oct.
2007
Salutations,

OCRopus vient de sortir sa première version ! La première bêta est prévue pour fin du premier trimestre 2008. D'ici il devrait y avoir quelques version alpha intermédiaire.

OCRopus est un logiciel de reconnaissance de document gérant à la fois le texte, les images et les mise-en-page. OCRopus est à {ocrad,gocr,claraoc,hocr,tesseract,…} ce que le HTML est au TXT. D'ailleurs, OCRopus fournit le résultat en hOCR : du HTML avec des informations spécifiques à la mise-en-page.

Cette première version apporte (...)

Journal Aperçu d'AbiScan

Posté par (page perso) .
0
6
août
2007
Salutations,

Malgré le manque de motivation, Gnome Scan poursuit son petit bonhomme de chemin (mais que veut dire cette expression?). J'ai implémenté AbiScan, un greffon pour AbiWord alliant Gnome Scan et OCRopus pour intégrer la ROC dans Abiword.

J'ai fait une petite vidéo du résultat : http://bersace03.free.fr/pub/Video/Gnome%20Scan/AbiScan+OCRo(...)

C'est super instable, super incomplet, super brouillion, mais l'idée est là. Si vous voulez tester plus avant, j'ai expliqué comment tester tout ça sur le blog de Gnome Scan (en anglais :/) : (...)

Journal Gnome Scan 0.5.1 : « Le jeu en valait la chandelle »

Posté par (page perso) .
0
12
juin
2007
Salut à tous,

Après plusieurs mois de conception et de développement, et sur les conseil de mon parrain Vincent Untz, je produit la version 0.5.1 de Gnome Scan. Gnome Scan se conçoit résolument comme un toolkit de conception d'interface et de fonctionalité de numérisation dans les applications, bien loin du concept traditionnel du "centre de numérisation" qui tente tant bien que mal de s'intégrer au reste.

Cette version est une réécriture complète, d'où le nom de code « Le jeu (...)