Forum général.cherche-logiciel Indexeur de PDF

Posté par (page perso) . Licence CC by-sa
2
11
nov.
2013

Chers tous,

je suis à la recherche d'une façon d'avoir online un formulaire pour chercher dans une collection de PDF (les archives du linux journal :) eux-même online également (en interne). Je voudrais au moins trouver un soft qui index les PDF; je peux coder la recherche moi-même s'il le faut. L'idée, pour les curieux, est de permettre à tous mes collègues et à moi-même d'accéder à ces archives et de pouvoir y trouver facilement et rapidement ce qu'on y cherchera. Idéalement, un clic sur un résultat ouvre le PDF à la bonne page :)

Une idée, une piste, une direction?

  • # DocMGR

    Posté par (page perso) . Évalué à 1.

    Perso j'utilise ça http://www.docmgr.org/, et c'est plutôt pas mal

    Is it a Bird? Is it a Plane?? No, it's Super Poil !!!

    • [^] # Re: DocMGR

      Posté par (page perso) . Évalué à 1.

      Ça a l'air pas mal, mais installer PostgreSQL juste pour ça, glups.

      La gelée de coings est une chose à ne pas avaler de travers.

  • # plusieurs etapes

    Posté par . Évalué à 3.

    1°) s'assurer que les PDF sont des PDF/a ou PDF/txt donc contenant la version texte du PDF
    il y a eu des scripts presentés ici pour convertir un PDF image en PDF texte

    2°) passer un indexeur sur ces fichiers

    3°) coder un moteur de recherche pour parser la base de données et trouver le(s) fichier(s) correspondant(s) à la recherche.

    evidemment il y a des solutions qui existent sur le net,
    generalement on parle de GED pour Gestion Electronique de Documents

  • # OwnCloud

    Posté par . Évalué à 1.

    C'est peut-être un peu overkill mais OwnCloud ferait la job.

Suivre le flux des commentaires

Note : les commentaires appartiennent à ceux qui les ont postés. Nous n'en sommes pas responsables.