Paperwork 1.1

Posté par (page perso) . Édité par Davy Defaud, ZeroHeure, Nils Ratusznik et palm123. Modéré par Xavier Claude. Licence CC by-sa
67
1
fév.
2017
Bureautique

Paperwork est un programme de gestion de documents personnels (papiers et PDF) conçu par un flemmard pour les flemmards. Il s’agit d’une interface graphique conçue avec une idée en tête : « scan & forget » (« numériser et puis voilà fini »). Lire, trier et indexer les papiers est un travail de machine, pas d’humain.

Cette nouvelle version inclut principalement des optimisations et quelques corrections de bogues. Une version pour Windows est également disponible. Plus de détails se trouvent en seconde partie.

Paperwork 1.0

87
9
nov.
2016
Bureautique

Paperwork est un programme de gestion de documents papiers (et PDF) conçu par un flemmard pour les flemmards. Il s’agit d’une interface graphique conçue avec une idée en tête : « scan & forget » (« numériser et puis voilà fini »). Lire, trier et indexer les papiers est un travail de machine, pas d’humain.

Journal Reconnaissance d'écriture à main levée

34
15
oct.
2016

Bonjour Nal,

Quelques mots pour signaler que PhatWare, société éditrice de logiciels de reconnaissance d'écriture à main levée, et de prises de notes, vient de libérer le moteur de son logiciel phare « WritePad ». Logiciel permettant d'écrire à main levée sur une surface tactile, ou bien avec un stylet, et qui assure une reconnaissance de caractères afin de transposer l'écriture à main levée en texte.

« WritePad Handwriting Recognition Engine » est désormais disponible, sous licence GPLv3, pour GNU/Linux, Android (...)

Financement participatif de HandyDV Linux et sa machine à lire

33
23
août
2016
Communauté

NdM. : contenu réécrit suite à une purge de compte, sur demande de la personne détentrice

Le projet HandyDVLinux (renommé depuis AccessDVLinux) vise à fournir une distribution GNU-Linux permettant de transformer un ordinosaure et un scanner en machine à lire. Un financement participatif a été lancé sur Ulule, pour avancer sur ce domaine de la mal-voyance.

L'idée est de permettre, par une combinaison de touches et en étant guidé par les messages audio de l'ordinateur, de déclencher une numérisation avec reconnaissance de caractères, d'ouvrir le document avec le bon logiciel et de le faire lire automatiquement. Plusieurs voix seraient disponibles, ainsi que la possibilité de relire au besoin, d'épeler, d'enregistrer, etc.

GNU/Linux a son OCR de qualité

10
12
juil.
2016
Bureautique

Un des grands reproches faits aux systèmes GNU/Linux par les utilisateurs déficients visuels était l'absence d'un logiciel de reconnaissance optique de caractères (OCR). Après avoir simplifié l'accès à GNU/Linux et avant d'y avoir implémenté des synthèses vocales de haut niveau, la société Hypra a résolu la question de l'OCR. En partenariat avec l'entreprise Abbyy, elle propose désormais un outil pour reconnaître les documents images issus du Web ou les documents numérisés et afficher leur contenu dans LibreOffice plutôt que dans un visionneur d'images.

L'outil est fourni sous forme d'un binaire. Puis chacun peut le lancer en ligne de commande. Pour ceux qui ont MATE et qui veulent du très simple, Hypra fournit un paquet Debian, installable sur tous systèmes. Il ajoute l'entrée au menu contextuel de caja, le gestionnaire de fichiers. Hypra fournit aussi, avec le paquet, la ligne à ajouter à ses raccourcis pour lancer le scanner par simple raccourci clavier (fonctionne sur tous les bureaux). Ce dispositif installé en fait la suite OCR la plus simple du monde PC puisqu'un raccourci ou une commande du menu contextuel suffit à lancer le scanner, la reconnaissance et l'affichage dans LibreOffice. Avec stockage des images.

Enfin, précisons que l'outil est bien sûr disponible dans le Système à Accès Universel.

Et le prix? Il est vendu 150€. Légèrement moins cher que Nuance OmniPage ou Abbyy FineReader (tous deux propriétaires) sous Windows dans leur version complète, il est la seule offre illimitée, sur GNU/Linux, à ce prix. Jusqu'ici Abbyy proposait simplement une version en ligne de commandes limitée à 12000 pages par an. La version illimitée coûtait 3000 €. C'est donc un bon début insufflé par cette entreprise sociale et solidaire, qui contribue à rendre le monde du libre accessible à tous en retirant les barrières à l'entrée.

NdM.: il est ici question d'une couche d'interface libre pour ajouter la gestion d'un moteur OCR propriétaire à ocrizer. Il existe par ailleurs d'autres moteurs libres d'OCR, plus ou moins avancés et/ou maintenus.

$ dpkg --info ocrizer-finereader_0.1.4-8_all.deb
(...)
 Section: contrib/graphics
(...)
 Description: Finereader engine support for ocrizer
  This package installs the glue between the abby proprietary command line tool
  and ocrizer, and makes finereader an available engine.

Paperwork 0.3

Posté par (page perso) . Édité par Nÿco, Nils Ratusznik et Benoît Sibaud. Modéré par Benoît Sibaud. Licence CC by-sa
81
16
fév.
2016
Bureautique

Paperwork est l'outil idéal pour les flemmards qui veulent numériser tous leurs documents papiers. Il s'agit d'une interface graphique conçue avec une idée en tête : "scan&forget" (« numériser et puis voilà fini »). Lire, trier et indexer les papiers est un travail de machine, pas d'humain. Paperwork est diffusé sous licence GPLv3 ou plus.

Les principaux changements sont :

  • une interface graphique revue et corrigée, un grand merci à Mathieu Jourdan pour ses propositions et ses contributions ;
  • moins de dépendances (pour faciliter l'empaquetage dans les distributions) ;
  • et comme toujours, plein de nouveaux bugs, toujours plus originaux les uns que les autres… :-)

Le nom de code de cette version est Ohh shiny !

En gros, vous pouvez toujours gérer votre paperasse comme un flemmard, mais avec une application qui a une meilleure tête.

Forum Linux.général Solution libre pour PDF "cherchable" (OCR) ?

2
18
nov.
2014

Bonjour,

Je cherche à savoir s'il est raisonnable d'espérer pouvoir compter sur une solution à base de logiciel libre pour ajouter automatiquement (traitement par lot) un calque textuel (via OCR) dans un PDF.

En gros, c'est une option que propose certains multifonction, nommé Searchable PDF. Cette option à un coût et ici, nous pension l'avoir négociée dans l'offre mais ce n'est pas le cas. Le prestataire demande un supplément, etc.

Lorsque nous scannons, un fichier PDF est placé dans un (...)

Forum Programmation.java Numérisation et analyse de formulaires papier

Posté par . Licence CC by-sa
3
27
oct.
2014

Bonjour,

J'ai déjà du remplir des formulaires n'utilisant (presque) que des cases à cocher et l'on m'avait donné pour consigne de bien noircir les cases pour faciliter le travail de la machine.

Je cherche donc une librairie Java qui permettrait d'analyser un scan d'un formulaire et de renvoyer l'état (coché ou non) des checkbox.

Avez-vous déjà utilisé un outil de ce type?
Sinon, par où dois-je commencer à chercher?

Sortie de Paperwork 0.2

Posté par (page perso) . Édité par Benoît Sibaud, NeoX, ZeroHeure et Nÿco. Modéré par Pierre Jarillon. Licence CC by-sa
71
22
sept.
2014
Bureautique

Paperwork est l'outil idéal pour les flemmards qui veulent numériser tous leurs documents papiers. Il s'agit d'une interface graphique conçue avec une idée en tête : "scan&forget" (« numériser et puis voilà fini »). Lire, trier et indexer les papiers est un travail de machine, pas d'humain.

Un peu plus d'un an après Paperwork 0.1, voici Paperwork 0.2. Cette nouvelle version apporte essentiellement des améliorations de l'interface graphique, ainsi que de l'ajout d'une fonctionnalité appelée "prédiction des labels" (histoire de pouvoir être encore plus flemmard lorsqu'on numérise ses documents).

Journal Rebelote : Paperwork : cherche mainteneur Debian

17
4
août
2014

Bonjour cher 'Nal,

Vandegrift Ross s'était proposé pour packager et maintenir des paquets Debian pour Paperwork et quelques-unes de ses dépendances. Il n'a malheureusement plus le temps. Rodier André s'était proposé pour le remplacer. Mais il n'a finalement plus le temps non plus.

Ça m'embête, parce-que les paquets Debian, c'est un des points clés de mon plan de conquête du Monde. Du coup, il y a, à nouveau, un poste d'assistant de super-vilain qui s'est libéré. Avis (...)

Journal Paperwork : cherche mainteneur Debian

32
8
juil.
2014

Bonjour cher 'Nal,

Ross Vandegrift s'était proposé pour packager et maintenir des paquets Debian pour Paperwork et quelques-unes de ses dépendances. Il n'a malheureusement plus le temps. Ça m'embête, parce-que les paquets Debian, c'est un des points clés de mon plan de conquête du Monde.

Du coup, un poste d'assistant de super-vilain s'est libéré. Avis aux gens qui ont du temps à tuer (à défaut d'espions). C'est l'occasion de participer à un projet de logiciel libre et de (...)

Journal Comment récupérer les sous-titres d'un enregistrement de la TNT: mini-tuto

17
12
avr.
2014

Bonjour,

Un petit journal pour vous expliquer comment récupérer les sous-titres DVB des chaînes télé françaises et les convertir sous forme d'un fichier texte srt. J'ai pas mal galéré, donc je me suis dit qu'un petit tuto pourrait être utile.

Pré-requis:

je suppose que vous avez un fichier .ts contenant la video et les sous-titres. Normalement, vlc ou totem sont capables d'afficher ces sous-titres.
Si vous découpez un fichier, attention au découpage, certains logiciels perdent la piste de sous-titres au (...)

Sortie de Paperwork 0.1

Posté par (page perso) . Édité par Xavier Teyssier et Benoît Sibaud. Modéré par patrick_g. Licence CC by-sa
58
13
août
2013
Bureautique

Après des années de R&D acharnée, trois arrêts cardiaques suite à des abus de caféine, et deux divorces, elle est finalement arrivée : la solution du parfait flemmard pour organiser ses documents papiers (ou pas) sous GNU/Linux. Paperwork est une interface graphique conçue avec une idée en tête : "scan&forget" (« numériser et puis voilà fini »). Lire, trier et indexer les papiers est un travail de machine, pas d'humain.

La version 0.1 a (enfin) été publiée.

Paperwork : besoin de testeurs

Posté par (page perso) . Édité par Nÿco, Florent Zara et Christophe Guilloux. Modéré par Christophe Guilloux. Licence CC by-sa
36
6
mai
2013
Communauté

Paperwork est un outil pour faciliter la gestion de la paperasse de tous les jours. Il a été conçu pour les flemmards désorganisés comme moi, dans une optique de « scan & forget » : vous devriez pouvoir juste scanner un document, l'enterrer dans une pile de papiers quelconque, et quand même le retrouver le jour où vous en avez besoin. Après tout, trier est un travail de machine.

À chaque scan, Paperwork se charge de passer un coup d'OCR sur le document et de l'indexer. Comme l'OCR est imparfaite, il est aussi possible de mettre des labels sur le document. Aujourd'hui, la dernière fonctionnalité voulue pour Paperwork 0.1 a été implémentée. Maintenant, avant de faire une première release, il reste à tester tout ça. C'est là que votre aide sera précieuse : il faut des testeurs.

NdM : merci à Jérôme Flesch pour son journal.

Journal Paperwork : Besoin de testeurs

28
5
mai
2013
Ce journal a été promu en dépêche : Paperwork : besoin de testeurs.

Paperwork est un outil pour faciliter la gestion de la paperasse de tout les jours.

Il a été conçu pour les flemmards désorganisés comme moi, dans une optique de "scan&forget" : vous devriez pouvoir juste scanner un document, l'enterrer dans une pile de papiers quelconque, et quand même le retrouver le jour où vous en avez besoin. Après tout, trier est un travail de machine.

À chaque scan, Paperwork se charge de passer un coup d'OCR sur le document (...)