Sortie de Swish-e 2.4

Posté par  (site Web personnel) . Modéré par Fabien Penso.
Étiquettes :
0
28
oct.
2003
Internet
Le moteur d'indexation et de recherche Swish-e vient de sortir en version 2.4, avec en prime une interface native pour PHP. Swish-e est un moteur de recherche et d'indexation de fichiers HTML très performant, capable d'indexer très rapidement plusieurs milliers de documents HTML et d'y chercher ensuite très facilement.

Swish-e dispose nativement d'une interface Perl (SWISH::API) et propose (en CVS pour le moment) des interfaces Active X et PHP (il fonctionne aussi sous Windows).

Contrairement à d'autres outils, il ne sait pas indexer directement des bases de données mais rien n'empêche d'indexer des fichiers HTML produits par une base de données.

Les options d'indexation de meta tag sont infinies et il est possible ensuite de les prendre en compte lors de la recherche, ce qui est un atout pour l'indexation de bases de données.

Bien sûr, Swish-e sait aussi indexer des sites Web, suivre les liens, et peut même grâce à quelques scripts, indexer les fichier PDF ou RTF.

Aller plus loin

  • # Re: Sortie de Swish-e 2.4

    Posté par  . Évalué à 1.

    Le site est dans les choux :/

    Je n'ai donc pas pu jeter un coup d'oeil plus approfondi
    à la 2.4.

    J'avais taté d'une ancienne version de swish, et ce
    n'était pas vraimment super.

    Pour reparler de la news, le coté d'utiliser html
    comme abstraction de document c'est assez drole :)

    L'indexation de milliers de documents rapidement avec
    une recherche facile aussi :)

    Bon j'attends que le site soit up pour en remettre
    une couche :)
  • # Re: Sortie de Swish-e 2.4

    Posté par  (site Web personnel) . Évalué à 3.

    Quelqu'un connaît les avantages/inconvénients de Swish-e par rapport à ht://dig ( http://www.htdig.org/(...) (bon déjà la licence de htdig (GPL) est claire au moins)) ?
  • # Re: Sortie de Swish-e 2.4

    Posté par  . Évalué à 3.

    Dans le même genre mais en java : Lucene (http://jakarta.apache.org/lucene/docs/index.html(...)).

    Permet d'indexer tout type de fichier ou des choses qui n'en sont pas (ex.: infos de bases de données) car c'est à vous de fournir le code d'extraction alias Document Converter.
    • [^] # Re: Sortie de Swish-e 2.4

      Posté par  . Évalué à 2.

      Puisqu'il a l'air d'être de bon ton de parler d'autres moteur, je vais mentionner phpDig ( http://www.phpdig.net(...) )

      C'est un moteur d'indexation en Php/MySql sous GPL. Il indexe un site en http à partir de sa racine et suit les liens jusqu'à un niveau de profondeur défini par l'utilisateur. Il est également capable d'indexer des fichiers txt, pdf et doc.

      Les résultats sont affichés par ordre décroissant de poids (pertinence) avec pagination et gestion de template pour coller à la charte graphique du site qui l'embarque.

Suivre le flux des commentaires

Note : les commentaires appartiennent à ceux qui les ont postés. Nous n’en sommes pas responsables.