La Banquise : moteur de recherche libre sur le libre

Posté par  . Modéré par rootix.
Étiquettes : aucune
0
29
sept.
2004
Internet
"La Banquise" est un moteur de recherche sur le libre. Dans sa première version, seuls les sites francophones sont indexés dans la base de données. Il y a environ 130 sites référencés et plus de 150 000 pages indexées. L'objectif, avant de passer à une version multi-lingue, est d'avoir une base d'environ 500 sites francophones et plus de 500 000 pages indexées.

"La Banquise" utilise Aspseek, un moteur de recherche sous licence GPL. Il peut indexer plusieurs millions d'URLs, et permet de faire des recherches par mots, phrases utilisant des motifs ou encore des expressions booléennes.

"La Banquise" fait un appel aux dons, afin de pouvoir acheter un premier serveur. Une association va être créée afin d'avoir une structure pour la gestion des dons.

Vous êtes bien sur invités à participer à l'enrichissement de la base des sites de la banquise en soumettant les sites que nous pourrions avoir oubliés. De plus, un Wiki a été mis en place afin de discuter du développement de l'association, du moteur de recherche, etc.

À bientôt sur la banquise....

Aller plus loin

  • # Problème dans un lien

    Posté par  . Évalué à 6.

    Aïe, il y'a un espace de trop dans le lien "Proposer un site francophone du libre".

    Sinon, bravo pour l'initiative.
  • # pobleme encoding

    Posté par  . Évalué à 5.

    chercher inkscape-->

    La deuxieme entrée de la réponse n°3
    contient des caracteres UTF-8 affichés dans un encoding iso-8859-1 (la page est reconnue dans cet encoding par mozilla).
    très variés
    au lieu de
    très variés

    Un petit coup de libiconv et un encoding utf-8 en standard resoudrait le probleme, surtout si le site doit passer en international par la suite.
    Peut etre s'agit-il d'un bug de aspseek (ou un probleme de configuration?).
  • # La Banquise : Bien, mais...

    Posté par  (site web personnel) . Évalué à 7.

    J'aime beaucoup le concept. J'espère qu'il va rapidement se développer.

    Par contre j'ai deux (petites) remarques :

    • Quand on recherche un site (lea dlfp etc.), le premier lien est rarement la page d'accueil. C'est domage à mon sens.

    • On a la possibilité d'uiliser les expressions régulières. C'est une très bonne chose, je sens que ça va me plaire. Par contre un lien vers une faq ou un tuto sera le bien venu sur le site même (je n'ai pas encore cherché sur le site d'aspseek) à coté des liens apropos, contributions...

  • # Feature

    Posté par  . Évalué à 4.

    Tres bonne idée que ce moteur de recherche du libre, un truc sympa à implemanter est l'ajout d'une fonction javascript qui donne le focus dans le champ recherche : on arrive sur la page, on tape directement la requete sans avoir à positionner la souris le champs texte 'q'.

    <!--
    function focus(){document.q.focus();}
    // -->


    dans la balise body : onLoad=focus()

    (vu sur l'index de Google)

    Bon courage.
    • [^] # Re: Feature

      Posté par  . Évalué à 5.

      mmh... manque qqch

      Chez Google c'est
      <!--
      function sf(){document.f.q.focus();}
      // -->

      <body (...) onLoad=sf()>
      (d'ailleurs manque pleins de " c'est pas conforme, bon)

      Il faut toujours mettre :
      document . nom_du_formulaire . id_du_champ_texte . bla_bla_bla()

      On est pas sous IE où l'on peut se permettre de faire :
      document . id_d_un_élément_html

      c'est non conforme, et ça ne fonctionne pas sous la plateforme Gecko.
      • [^] # Re: Feature

        Posté par  . Évalué à 3.

        Rooh !
        En fait j'ai enleve le f.q parce que justement le form sur banquise n'a pas de nom, je ne savais pas que c'etait obligatoire, merci pour l'info.
    • [^] # Re: Feature

      Posté par  . Évalué à 3.

      Merci, pour l'idee, elle est en ligne ;)

      A+
      Jean
  • # cool j'adore le principe !

    Posté par  (site web personnel) . Évalué à 1.

    extra comme idée !

    sinon au passage en faisant une recherche avec "doom 3" et il m'a trouvé que 3 sites, ensuite en recherchant "doom" il me trouve plein de site avec le premier dans le titre "Doom 3 dispo" c assez étrange non ?
  • # url du robot

    Posté par  (site web personnel) . Évalué à 2.

    pourriez vous mettre une url dans la chaîne d'identification du robot pour qu'on puisse faire des remarques ?

    Par exemple j'ai été obligé de null router votre version alpha car elle me suçait les oggs et pendant que je jouais à quake.


    facultes-4-82-229-134-33.fbx.proxad.net - - [23/Sep/2004:04:26:17 +0200] "GET /doc/conf/lsm2003/ogg/Mako_discussion.ogg HTTP/1.0" 200 1079296 "-" "ASPseek/1.2.10" In:0 Out:0:0pct.
    (x12 autres )

    Entre nous, à quoi sert il de ramener les oggs pour l'indexation, à moins que vous ayez développé un logiciel pour comprenant l'audio et le transformant en texte ? Si vous aviez mis une URL j'aurais pu vous le dire ;)


    Pour mémoire libroscope est dans mon salon, branché sur une DSL 512/128
  • # C++

    Posté par  . Évalué à 2.

    Ça serait bien qu'on puisse chercher C++ dans le moteur de recherche, quand même (et de même pour d'autres trucs terminant en ++). Là il nous gratifie d'un message à propos de caractères spéciaux en fin de chaîne. Pas très pratique.

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.