Bonjour.
Je suis a la recherche d'un logiciel ou une libraire C/C++ permettant l'indexation de documents (.odt, .doc, .xls, .ppt, .pdf, ...). L'index ainsi construit devrait etre stocké dans une base de donnée Mysql.
L'idée étant de créer en interne un système de GED qui permettrait a nos utilisateurs de ne rien avoir a changer dans leurs habitudes cad : foutre leurs documents un peu ou ils veulent n'importe comment. Et nous derrière repasserions avec une appli existante a nous qui en fonction du titre du document et de son emplacement nous permettrait de rajouter des "tag" associé a ce document dans une DB Mysql.
Cette DB nous permettrait de faire des recherches de documents type : "facture nom_client date_facture" et nous sortirions les documents correspondant a cette recherche.
Ceci fonctionne déjà a peu prés mais ce n'est pas satisfaisant car par moment les utilisateurs mette en titre du document un nom n'ayant rien a voir en le mette dans un dossier type : "vrac".
Or pour cela un outil permettant d'indexer le contenu du document résoudrait le problème.
Donc je suis a la recherche de ce type de programme/librairie (les formats cité plus haut sont tous obligatoire les autres seraient du bonus).
Pourriez me dire si cela existe ?
Merci d'avance.
# OpenOffice + Index Fulltext
Posté par David FRANCOIS (site web personnel) . Évalué à 3.
- Conversion de tous les docs en texte brut grâce à OpenOffice en mode "headless" et PyOD Converter
- Insertion du texte dans une colonne TEXT avec un index FULLTEXT sur MySQL
- Recherches !
C'est pas tout à fait trivial à mettre en place, il faut prendre en compte le fait que OpenOffice tend parfois à se mettre à exploser mais une fois ces soucis gérés ca marche très bien.
# Commentaire supprimé
Posté par Anonyme . Évalué à 3.
Ce commentaire a été supprimé par l’équipe de modération.
# Mnogosearch
Posté par maderios . Évalué à -2.
http://www.mnogosearch.org/
http://www.mnogosearch.org/doc33/
"L'art est fait pour troubler. La science rassure" (Braque)
Suivre le flux des commentaires
Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.