DocFetcher, pour rechercher des mots clés dans les fichiers

Posté par  . Édité par Nÿco, Benoît Sibaud, Benoît, Maxime et Nils Ratusznik. Modéré par Benoît Sibaud. Licence CC By‑SA.
Étiquettes :
15
31
déc.
2013
Communauté

Comment trouver une recette de cuisine à partir des ingrédients ? Ou un document parmi des milliers lorsque l'on ne connait que quelques mots inclus dans celui-ci ?

Ce logiciel, DocFetcher fonctionne avec Java et donc sous Linux, Mac et Windows. Il est publié sous Eclipse Public License. Il est traduit en français, russe, portugais, allemand et chinois (simplifié).

Il prend en charge les documents aux formats :

  • Microsoft Office (doc, xls, ppt) ;
  • Microsoft Office 2007 and newer (docx, xlsx, pptx, docm, xlsm, pptm) ;
  • Microsoft Outlook (pst) ;
  • Open Document (odt, ods, odg, odp, ott, ots, otg, otp) ;
  • Portable Document Format (pdf) ;
  • HTML (html, xhtml, …) ;
  • TXT et autres formats textes (personnalisable) ;
  • Rich Text Format (rtf) ;
  • AbiWord (abw, abw.gz, zabw) ;
  • Microsoft Compiled HTML Help (chm) ;
  • MP3 Metadata (mp3) ;
  • FLAC Metadata (flac) ;
  • JPEG Exif Metadata (jpg, jpeg) ;
  • Microsoft Visio (vsd) ;
  • Scalable Vector Graphics (svg).

Aller plus loin

  • # recoll

    Posté par  . Évalué à 5. Dernière modification le 31 décembre 2013 à 18:41.

    Salut, merci pour la dépêche. Moi j'utilise recoll. Docfetcher a l'air très complet et bien adapté pour le source code. À vue comme ça, les différences qui me viennent :

    • recoll a une interface Qt4, intégrée avec les autres applications Qt ou un bureau KDE.
    • recoll a un aspect plus proche d'un moteur de recherche du net (titre et extraits du fichier avec surlignage des occurrences) alors que DocFetcher avec sa présentation sous forme de liste avec case à cocher parait permettre une recherche plus approfondie mais moins naturelle (pour moi).
    • DocFetcher a l'air plus facile à limiter à des répertoires particuliers (dans recoll il faut créer des index séparés et les ouvrir, c'est un peu chiant, alors que DocFetcher a des cases à cocher pour les répertoires).
  • # Indexation de contenus sous Linux (et autres)

    Posté par  . Évalué à 2.

    DocFetcher et Recoll ont l'air intéressants pour l'indexation de fichiers. J'aime bien la possibilité de choisir les répertoires à indexer (utile pour ma collection d'articles), ne pas avoir de démon (alléluia) et de fonctionner sous d'autres OS (on ne sait jamais).

    Ça me rappelle qu'il y a quelques années (avant que Mac OS le fasse :), j'utilisais Beagle qui indexait les fichiers, les courriels, etc. Ça marchait bien. Puis ça a commencé à indexer en permanence et Beagle a disparu… Il y a eu Nepomuk (ou Strigi) qui indexaient tout mais ramait grave et Nepomuk a disparu de mon ordinateur (apparemment les dernières versions ont fait de gros efforts de performances).

    Du coup je me demandais quel est l'état des solutions d'indexation sous Linux…

    Notons que si "toutéfichié", alors il suffirait d'indexer des fichiers…

    • [^] # Re: Indexation de contenus sous Linux (et autres)

      Posté par  . Évalué à 4.

      Je réutilise Nepomuk depuis KDE 4.10 et c'est utilisable, depuis 4.11, il ne s'est plus emballé pour prendre un cœur à 100% (par contre, akonadi, c'est autre chose).

      « Rappelez-vous toujours que si la Gestapo avait les moyens de vous faire parler, les politiciens ont, eux, les moyens de vous faire taire. » Coluche

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.