Bonjour à tous.
Je me rappelle avoir lu dans un Linux Magazine de 2011 ou 2010 un article décrivant une procédure complète visant à se servir de SQLite pour créer un moteur de recherche plein texte sur des documents texte du système de fichiers. Je n'arrive ni à mettre la main sur ce magazine ni à trouver des exemples parlants sur Internet. Quelqu'un peut-il me mettre sur la voie, S.V.P.?
Un tout grand merci d'avance,
V.
EDIT: Merci pour vos commentaires et vos lumières. Il s'agissait bien du numéro 116 de mai 2009 de GNU/Linux magazine.
Pour info, vu l'importance du projet, je suis passé à PostgreSQL pour la recherche plein texte et l'indexation du contenu de fichiers PDF. J'ai voulu le système comme ça même si je n'ai pas (trop) pris la peine de vérifier s'il existait des systèmes tout faits. Lucene ne me tentait par contre pas du tout. la solution que j'ai trouvée est d'extraire le texte des fichiers PDF avec pdf2text et de l'envoyer dans la base de données avec une tâche cron. L'accès au moteur de recherche se fait par interface web.
# Google m'a envoyé ici
Posté par Mali (site web personnel) . Évalué à 1.
Apparemment c'était en 2009,
http://blog.bjornoya.be/lab_stacks/2009/07/sqlite-et-la-recherche-en-texte-integral.html
[^] # Re: Google m'a envoyé ici
Posté par FantastIX . Évalué à 2.
Merci Mali.
Par contre j'ai du mal à comprendre la mise à jour de l'article:
Que veut-il dire par là? Le simple fait d'insérer le nom du fichier texte dans la table suffit à SQLite d'indexer le contenu de ce même fichier? Je sais que c'est ce que je cherchais mais je ne me rappelle plus que c'était aussi simple.
[^] # Re: Google m'a envoyé ici
Posté par FantastIX . Évalué à 3.
C'est bien le numéro 116! Je vais m'empresser de retrouver ce numéro dans mes cartons :D . Encore merci, ton aide m'a été précieuse.
# doc officielle
Posté par steph1978 . Évalué à 2.
très bien foutue:
http://www.sqlite.org/fts3.html
Suivre le flux des commentaires
Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.