Faire un don ! | | style | statistiques | contactez-nous | plan | lettre d'information

Journal : Numérisation des documents administratifs avec métadonnées

Posté par Nelis (page perso, ) le 07 avril 2008
Salut,

Etant donné que je suis un bordélique irrécupérable mais que j'aimerais quand même ne pas perdre certains documents importants (fiches de salaires, contrats, factures, ...), je suis en train de réfléchir de la meilleure manière de numériser tout ça.

Au boulot, on a une imprimante/photocopieuse qui peut scanner des documents directement en PDF, c'est déjà un bon début.

Maintenant je me pose plusieurs questions :

- Les PDFs générés sont dans une vieille version du format, ne vaut-il pas mieux numériser en TIFF et convertir en PDF après (Y'a-t-il des logiciels libres de préférence qui peuvent faire ça ?)
- Le scanner ne fait pas d'OCR, ça serait pourtant pas mal de pouvoir faire des recherches dans les PDF, connaissez-vous un moyen d'appliquer un OCR sur un PDF existant ?
- Au niveau de la résolution, je le fais en 300DPI greyscale, je pense que c'est suffisant.
- J'aimerais embarquer des métadonnées dans le PDF (organisme source du document, type de document, date du document, ...), quel est le meilleur moyen de faire ça sans que les métadonnées ne se perdent dès que le document est déplacé ? J'ai entendu parler de XMP mais je ne sais pas si c'est fait pour ça.
- Pour le stockage de ces infos : disque local avec backup ? Remote FS style Amazon S3 ?

Bref, est-ce que l'un de vous a déjà tenté l'expérience, et si oui, peut-il indiquer quelle solution il a retenu, quels sont les pièges, ...

Je ne pense pas être le seul à rechercher ce type de solution donc toute info est la bienvenue :-)

> Lire le journal (20 commentaires, moyenne: 2,5).  

Vous avez demandé le commentaire #920552.

[+] Question sur la langue française

Posté par Zenitram (page perso, ) le 07/04/2008 à 17:20. (lien). Évalué à -10.

Dites, j'ai un problème de français.
Dans le français que j'ai appris, on m'a dit que :
- Un journal, dans son esprit, c'est celui qui écrit qui fourni l'information
- Un forum, dans son esprit, celui qui écrit a un besoin, et les autres répondent.

Je suis certain d'avoir cliqué sur "Journal", et je trouve un truc sans information, mais où quelqu'un demande, du coup j'ai un problème : j'aimerai savoir où est mon erreur dans mon français.

  • [^]Re: Question sur la langue française

    Posté par Nelis (page perso, ) le 07/04/2008 à 17:30. (lien). Évalué à 10.

    - Ce journal fait plus que poser une question technique mais demande des retours sur expérience sur un sujet qui à mon avis intéresse pas mal de monde.
    - A ce que je sache, rien n'interdit dans la politique éditoriale de linuxfr de poser des questions dans les journaux.
    - Si ça te plait pas tu lis pas.
    - Y'en a marre des branleurs qui râle dès qu'un journal ne correspond pas exactement à l'idée qu'ils se font d'un journal.
    - Si t'as que ça à foutre que d'aller lire des journaux qui ne t'intéressent pas pour râler, ta vie doit être passionnante.

    --
    Vache qui rit, à moitié dans son lit
    • [^]Re: Question sur la langue française

      Posté par Snarky (Jabber id, page perso, ) le 07/04/2008 à 17:32. (lien). Évalué à 3.

      En même temps, il faut bien le lire pour savoir qu'il ne nous interesse pas... non ?

      --
      Milite pour un about:black sur les navigateurs ! (Sauvons la planète)
      • [^]Re: Question sur la langue française

        Posté par Nelis (page perso, ) le 07/04/2008 à 17:35. (lien). Évalué à 5.

        Pas faux ;-)

        Mais souvent, rien qu'avec le titre ou au bout de deux lignes, on se rend compte si ça nous intéresse ou pas.

        Ouvrir le journal, tout lire, et laisser un commentaire pour râler sur un truc qui ne nous intéresse pas, il faut être motivé !

        --
        Vache qui rit, à moitié dans son lit