Forum général.cherche-logiciel logiciel d'indexation de documents dans une DB Mysql

Posté par (page perso) .
Tags : aucun
3
25
oct.
2009
Bonjour.

Je suis a la recherche d'un logiciel ou une libraire C/C++ permettant l'indexation de documents (.odt, .doc, .xls, .ppt, .pdf, ...). L'index ainsi construit devrait etre stocké dans une base de donnée Mysql.

L'idée étant de créer en interne un système de GED qui permettrait a nos utilisateurs de ne rien avoir a changer dans leurs habitudes cad : foutre leurs documents un peu ou ils veulent n'importe comment. Et nous derrière repasserions avec une appli existante a nous qui en fonction du titre du document et de son emplacement nous permettrait de rajouter des "tag" associé a ce document dans une DB Mysql.
Cette DB nous permettrait de faire des recherches de documents type : "facture nom_client date_facture" et nous sortirions les documents correspondant a cette recherche.
Ceci fonctionne déjà a peu prés mais ce n'est pas satisfaisant car par moment les utilisateurs mette en titre du document un nom n'ayant rien a voir en le mette dans un dossier type : "vrac".
Or pour cela un outil permettant d'indexer le contenu du document résoudrait le problème.

Donc je suis a la recherche de ce type de programme/librairie (les formats cité plus haut sont tous obligatoire les autres seraient du bonus).
Pourriez me dire si cela existe ?
Merci d'avance.
  • # OpenOffice + Index Fulltext

    Posté par (page perso) . Évalué à 3.

    Je ne sais pas si ca répond à ton besoin mais ce que nous faisons pour indexer des documents est la chose suivante :
    - Conversion de tous les docs en texte brut grâce à OpenOffice en mode "headless" et PyOD Converter
    - Insertion du texte dans une colonne TEXT avec un index FULLTEXT sur MySQL
    - Recherches !

    C'est pas tout à fait trivial à mettre en place, il faut prendre en compte le fait que OpenOffice tend parfois à se mettre à exploser mais une fois ces soucis gérés ca marche très bien.
  • # Commentaire supprimé

    Posté par . Évalué à 3.

    Ce commentaire a été supprimé par l'équipe de modération.

  • # Mnogosearch

    Posté par . Évalué à -2.

    Indexe les pages web et les documents locaux, dans une base de données Mysql, entre autres. Je m'en sers et cela marche bien , contrairement à Htdig ou Namazu.
    http://www.mnogosearch.org/
    http://www.mnogosearch.org/doc33/

    "L'art est fait pour troubler. La science rassure" (Braque)

Suivre le flux des commentaires

Note : les commentaires appartiennent à ceux qui les ont postés. Nous n'en sommes pas responsables.