Sortie de Swish-e 2.4

Posté par Olivier Meunier le 28 octobre 2003 à 09:13. Modéré par Fabien Penso.

Étiquettes :

oct.

2003

Le moteur d'indexation et de recherche Swish-e vient de sortir en version 2.4, avec en prime une interface native pour PHP. Swish-e est un moteur de recherche et d'indexation de fichiers HTML très performant, capable d'indexer très rapidement plusieurs milliers de documents HTML et d'y chercher ensuite très facilement.

Swish-e dispose nativement d'une interface Perl (SWISH::API) et propose (en CVS pour le moment) des interfaces Active X et PHP (il fonctionne aussi sous Windows).

Contrairement à d'autres outils, il ne sait pas indexer directement des bases de données mais rien n'empêche d'indexer des fichiers HTML produits par une base de données.

Les options d'indexation de meta tag sont infinies et il est possible ensuite de les prendre en compte lors de la recherche, ce qui est un atout pour l'indexation de bases de données.

Bien sûr, Swish-e sait aussi indexer des sites Web, suivre les liens, et peut même grâce à quelques scripts, indexer les fichier PDF ou RTF.

Aller plus loin

Swish-e (30 clics)
Liste des changements (20 clics)
Téléchargement (21 clics)
Documentation (version 2.2) (37 clics)

# Re: Sortie de Swish-e 2.4

Posté par Roger Rabbit le 28 octobre 2003 à 11:27. Évalué à 1.

Le site est dans les choux :/

Je n'ai donc pas pu jeter un coup d'oeil plus approfondi
à la 2.4.

J'avais taté d'une ancienne version de swish, et ce
n'était pas vraimment super.

Pour reparler de la news, le coté d'utiliser html
comme abstraction de document c'est assez drole :)

L'indexation de milliers de documents rapidement avec
une recherche facile aussi :)

Bon j'attends que le site soit up pour en remettre
une couche :)
# Re: Sortie de Swish-e 2.4

Posté par Benoît Sibaud (site web personnel) le 28 octobre 2003 à 12:26. Évalué à 3.

Quelqu'un connaît les avantages/inconvénients de Swish-e par rapport à ht://dig ( http://www.htdig.org/(...) (bon déjà la licence de htdig (GPL) est claire au moins)) ?
- [^] # Re: Sortie de Swish-e 2.4
  
  Posté par free2.org le 28 octobre 2003 à 12:35. Évalué à 4.
  
  deja mnogosearch est libre et plus complet que htdig
  http://search.mnogo.ru/(...)
- [^] # Re: Sortie de Swish-e 2.4
  
  Posté par Yves Agostini le 28 octobre 2003 à 15:44. Évalué à 3.
  
  Oui GPL
  
  http://www.univ-metz.fr/comp/search.html(...)
  avec swish-e
  
  J'ai pas utilisé htdig depuis longtemps, mais pour moi les avantages étaient le perl et l'utilisation de bases d'indexation distinctes. Je crois que htdig ne manipule pas facilement plusieurs bases d'indexation. Je trouvais htdig un peu trop usine à gaz.
  
  Pour moi le collecteur en perl est facile à adapater, par exemple pour ajouter les résumés, indexer du pdf ou du word, retirer des expressions ....
  
  Ca marche bien ...
# Re: Sortie de Swish-e 2.4

Posté par crusher le 28 octobre 2003 à 13:46. Évalué à 3.

Dans le même genre mais en java : Lucene (http://jakarta.apache.org/lucene/docs/index.html(...)).

Permet d'indexer tout type de fichier ou des choses qui n'en sont pas (ex.: infos de bases de données) car c'est à vous de fournir le code d'extraction alias Document Converter.
- [^] # Re: Sortie de Swish-e 2.4
  
  Posté par Nicolas Tisserand le 28 octobre 2003 à 16:16. Évalué à 2.
  
  Puisqu'il a l'air d'être de bon ton de parler d'autres moteur, je vais mentionner phpDig ( http://www.phpdig.net(...) )
  
  C'est un moteur d'indexation en Php/MySql sous GPL. Il indexe un site en http à partir de sa racine et suit les liens jusqu'à un niveau de profondeur défini par l'utilisateur. Il est également capable d'indexer des fichiers txt, pdf et doc.
  
  Les résultats sont affichés par ordre décroissant de poids (pertinence) avec pagination et gestion de template pour coller à la charte graphique du site qui l'embarque.
  - [^] # Re: Sortie de Swish-e 2.4
    
    Posté par Toto47 le 10 mars 2004 à 15:57. Évalué à 1.
    
    Merci pour le tuyau.
    Oui, c'est génial PHPdig.

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.