Salut à tous,
Mes cours prennent énormément de place dans mon placard, et j'aimerais les numériser pour de bon.
Je suis donc à la recherche de ce genre de choses:
- un logiciel qui permette de scanner à la suite, sans avoir à réaliser tout le processus d'enregistrement de l'image qui vient d'être scannée (on fera ça plus tard...)
- un éventuel logiciel d'OCR, pour les polycopiés: si il est possible de sortir un PDF avec texte sélectionnable, c'est le bonheur
- un logiciel qui me permette ensuite d'accéder à tout ça
Est-ce que vous avez une expérience là dedans?
Un favori dans vos liens de gens qui relatent la chose?
Des logiciels à me pointer?
Je suis sous Ubuntu Natty, 64 bits, si ça peut servir.
D'autre part, il faudra que je stocke tout ça quelque part, si vous avez des idées sur le comment (sauvegarde, support physique à long terme, etc...)
Merci d'avance!
# Le vénérable vétérant xsane
Posté par lolop (site web personnel) . Évalué à 3.
Si ton scanner supporte une alimentation automatique ne documents, xsane permet de faire des batch de scans, et sauf erreur tu peux ensuite générer un PDF à partir des images. Par contre, pas d'OCR à ma connaissance.
Votez les 30 juin et 7 juillet, en connaissance de cause. http://www.pointal.net/VotesDeputesRN
[^] # Re: Le vénérable vétérant xsane
Posté par dave . Évalué à 1.
Il y a un module d'ocr intégré. gocr peut faire le travail via des pipes.
Systemd, the bright side of linux, toward a better user experience and on the road to massive adoption of linux for the desktop.
# Photocopieur
Posté par Sytoka Modon (site web personnel) . Évalué à 5.
Normalement, n'importe quel photocopieur sais faire cela de nos jours (scan). Cela sera plus rapide que d'utiliser un scanner sous linux via xsane ou équivalent.
Parfois, il faut savoir utiliser les outils qui vont bien pour les grosses quantités ;-)
[^] # Re: Photocopieur
Posté par lolop (site web personnel) . Évalué à 2.
Si c'est chez lui, il n'a peut-être pas un photocopieur sous la main...
Ceci dit, toutafé. Je suis en train de scanner mes vieux GNU/Linux Magazine pour dépiler et faire de la place... ben même avec un 4 en 1 avec un système de passage automatique des documents... c'est long. Ca serait sûrement nettement plus rapide avec les gros photocopieurs/scanner/imprimante au boulot... mais j'y ai d'autres occupations moins personnelles.
Note: faire des tests avant de commencer entre la résolution et le taux de compression des images, de façon à avoir des documents lisibles, mais qui ne prennent pas trop de place. Pour mes revues je suis arrivé à 200dpi et compression jpeg à 40.
Votez les 30 juin et 7 juillet, en connaissance de cause. http://www.pointal.net/VotesDeputesRN
[^] # Re: Photocopieur
Posté par Michaël (site web personnel) . Évalué à 2.
Ma préférence personnelle va à des scans de haute résolution (300dpi ou 600dpi) que je transforme ensuite en DjVU. C'est à ce moment que je fais des tests pour savoir quelle réduction de qualité me donne les meilleures tailles.
[^] # Re: Photocopieur
Posté par Sytoka Modon (site web personnel) . Évalué à 2.
C'est ce que je fais chez moi avec xsane. Je scanne en mode trait à 600 dpi au format png. C'est le réglage que j'ai trouvé le mieux pour le moment.
[^] # Re: Photocopieur
Posté par El Titi . Évalué à 2.
Ne perds pas ton temps:
http://chl.be/glmf/
[^] # Re: Photocopieur
Posté par Sytoka Modon (site web personnel) . Évalué à 2.
D'ailleurs, ce serait bien que glmf libère ses articles au bout d'un certain temps, comme lwn. En effet, j'aimerais bien savoir qu'elle est la valeur financière pour les éditions Diamonds des anciens numéros ?
Comme c'est une édition papier et non électronique, la libération au bout d'un an serait à mon sens un compromis intéressant. Peut être deux ans pour Misc qui n'est que tous les deux mois et dont les articles sont moins périssables.
Étant abonné aux deux depuis quelques années, je suis près à payer un peu plus pour assurer cette libération comme je le fait pour LWN.
[^] # Re: Photocopieur
Posté par BAud (site web personnel) . Évalué à 2.
Tu n'avais pas acheté le n° 100 ? cf. http://www.gnulinuxmag.com/download/cp/CP_LM100.pdf
On en avait parlé sur http://linuxfr.org/users/nojhan/journaux/linux-magazine-n-100
[^] # Re: Photocopieur
Posté par Sytoka Modon (site web personnel) . Évalué à 2.
J'ai le numéro 100 mais les avoir en ligne est autre chose et accessible à TOUT le monde.
Ensuite, le numéro 100 commence à dater...
[^] # Re: Photocopieur
Posté par Michaël (site web personnel) . Évalué à 3.
Exactement, c'est aussi ce que je fais. Le seul problème à résoudre est d'accéder à une telle machine, ce qui peut impliquer un peu de recherche dans ses contacts ou d'aller chez un reprographe.
[^] # Re: Photocopieur
Posté par Sytoka Modon (site web personnel) . Évalué à 2.
Etant dans un laboratoire de recherche publique, j'avoue que j'en ai plusieurs à disposition ;-)
Pour la question boulot/perso, il suffit d'arriver en avance ou de partir en retard un jour. Dans les laboratoires, les horaires sont souvent assez souples...
# Solution alternative au scanner
Posté par teddyredm3cl . Évalué à 2.
Sur un forum de paléoinformatique le problème de la numérisation massive de documentation s'était posé. Un membre avait trouvé une solution astucieuse : utiliser un appareil photo avec un pied photo. En mettant les livres sur un support à plat et en dessous de l'appareil, il arrivait à un rythme d'acquisition impressionnant et la qualité de l'appareil permettait de lire le texte confortablement.
Si tu as déjà un appareil ça vaut le coup d'essayer pour voir si la qualité te convient. Bonne chance pour le reste de tes essais, si tu trouve une solution propre pour ton besoin, n'hésite pas à faire un retour ici :-)
# DocBucket
Posté par Benoît Laurent (site web personnel) . Évalué à 2.
L'auteur de ce programme l'a développé pour scanner ses papiers, la chaîne de scan - OCR - indexation peu être utilisé pour n'importe quoi.
Le lien : I, NaPs — DocBucket, version 0.1
# Malodos ?
Posté par palm123 (site web personnel) . Évalué à 2.
Si tu veux scanner chez toi
http://linuxfr.org/users/davguez/journaux/pub-sortie-de-malodos-10
http://sites.google.com/site/malodospage/home
ウィズコロナ
# simple scan
Posté par B16F4RV4RD1N . Évalué à 3.
un photocopieur peut être plus pratique, mais sinon le "simple scan" de gnome (fourni dans linux mint, mais je ne connais pas le nom de la commande exacte), permet de scanner à la file, et d'exporter un fichier unique en pdf à la fin. Très pratique.
Pas d'idée pour le OCR par contre.
Only wimps use tape backup: real men just upload their important stuff on megaupload, and let the rest of the world ~~mirror~~ link to it
# Tesseract
Posté par dinzen . Évalué à 3.
Je te conseille tesseract comme OCR pour l'avoir utilisé à profit sur du texte espagnol.
Disponible sur les dépôts debian, ne pas oublier d'installer tesseract caractères français (sinon defaut=english sans accents).
Format image : tif
option -l pour la locale
syntaxe :
$ tesseract image.tif prefixe-texte -l fr
[^] # Re: Tesseract
Posté par B16F4RV4RD1N . Évalué à 2.
Je viens de voir qu'il existait gscan2pdf.
C'est la misère au niveau des dépendances, en perl (une quinzaine + les dépendances des dépendances), mais ça semble pas mal :
http://doc.ubuntu-fr.org/gscan2pdf
Je n'ai pas encore trouvé comment faire, mais il semble possible d'intégrer à un pdf du texte OCRisé
Only wimps use tape backup: real men just upload their important stuff on megaupload, and let the rest of the world ~~mirror~~ link to it
Suivre le flux des commentaires
Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.