Swish-e dispose nativement d'une interface Perl (SWISH::API) et propose (en CVS pour le moment) des interfaces Active X et PHP (il fonctionne aussi sous Windows).
Contrairement à d'autres outils, il ne sait pas indexer directement des bases de données mais rien n'empêche d'indexer des fichiers HTML produits par une base de données.
Les options d'indexation de meta tag sont infinies et il est possible ensuite de les prendre en compte lors de la recherche, ce qui est un atout pour l'indexation de bases de données.
Bien sûr, Swish-e sait aussi indexer des sites Web, suivre les liens, et peut même grâce à quelques scripts, indexer les fichier PDF ou RTF.
Aller plus loin
- Swish-e (19 clics)
- Liste des changements (6 clics)
- Téléchargement (9 clics)
- Documentation (version 2.2) (27 clics)
# Re: Sortie de Swish-e 2.4
Posté par Roger Rabbit . Évalué à 1.
Je n'ai donc pas pu jeter un coup d'oeil plus approfondi
à la 2.4.
J'avais taté d'une ancienne version de swish, et ce
n'était pas vraimment super.
Pour reparler de la news, le coté d'utiliser html
comme abstraction de document c'est assez drole :)
L'indexation de milliers de documents rapidement avec
une recherche facile aussi :)
Bon j'attends que le site soit up pour en remettre
une couche :)
# Re: Sortie de Swish-e 2.4
Posté par Benoît Sibaud (site web personnel) . Évalué à 3.
[^] # Re: Sortie de Swish-e 2.4
Posté par free2.org . Évalué à 4.
http://search.mnogo.ru/(...)
[^] # Re: Sortie de Swish-e 2.4
Posté par Yves Agostini (site web personnel) . Évalué à 3.
http://www.univ-metz.fr/comp/search.html(...)
avec swish-e
J'ai pas utilisé htdig depuis longtemps, mais pour moi les avantages étaient le perl et l'utilisation de bases d'indexation distinctes. Je crois que htdig ne manipule pas facilement plusieurs bases d'indexation. Je trouvais htdig un peu trop usine à gaz.
Pour moi le collecteur en perl est facile à adapater, par exemple pour ajouter les résumés, indexer du pdf ou du word, retirer des expressions ....
Ca marche bien ...
# Re: Sortie de Swish-e 2.4
Posté par crusher . Évalué à 3.
Permet d'indexer tout type de fichier ou des choses qui n'en sont pas (ex.: infos de bases de données) car c'est à vous de fournir le code d'extraction alias Document Converter.
[^] # Re: Sortie de Swish-e 2.4
Posté par Nicolas Tisserand . Évalué à 2.
C'est un moteur d'indexation en Php/MySql sous GPL. Il indexe un site en http à partir de sa racine et suit les liens jusqu'à un niveau de profondeur défini par l'utilisateur. Il est également capable d'indexer des fichiers txt, pdf et doc.
Les résultats sont affichés par ordre décroissant de poids (pertinence) avec pagination et gestion de template pour coller à la charte graphique du site qui l'embarque.
[^] # Re: Sortie de Swish-e 2.4
Posté par Toto47 . Évalué à 1.
Oui, c'est génial PHPdig.
Suivre le flux des commentaires
Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.