Sortie de Seeks stable 0.2

Posté par  (site web personnel) . Modéré par Pascal Terjan.
Étiquettes :
17
9
mar.
2010
Internet
Seeks est un méta moteur de recherche libre (AGPL), sous forme de serveur mandataire (proxy) HTTP. Il est déployable aussi bien en tant que moteur public que sur machine personnelle.

La version 0.2 est la première véritable version livrée de Seeks. Elle comprend plusieurs nouveaux outils pour la recherche en ligne, comme l'analyse de similarité des résultats, le regroupement automatique des résultats, et par type.

Seeks repose sur une architecture ouverte dont le but est de permettre la reprise en main par les utilisateurs de la recherche sur le Web. Aujourd'hui il est possible à chacun de monter son propre nœud ou d'utiliser des nœuds publics pour l'anonymat de ses requêtes.

Les versions à venir mettront en place un réseau pair-à-pair permettant l'interconnexion des nœuds Seeks. Cette interconnexion permettra de regrouper en temps réel entre eux les utilisateurs effectuant des requêtes similaires.

Sur cette base Seeks permettra l'émergence d'un véritable moteur décentralisé, avec un contrôle continu et collaboratif des utilisateurs sur les résultats et leurs données. Au final, Seeks cherche à promouvoir la transparence des algorithmes et l'égalité des contenus sur le Web dans leur traitement par les moteurs de recherche.

Aller plus loin

  • # Meta moteur ?

    Posté par  . Évalué à 5.

    Apparemment ce meta moteur utilise les résultats de Google, Bing, Cuil, Yahoo et Exalead (http://www.seeks-project.info/wiki/index.php/Seeks_Features)(...)

    L'idée est pas mauvaise, je dirais même que c'est quelque chose qu'il manque, un moteur totalement libre.
    Mais là j'ai l'impression qu'on gagne pas grand chose puisqu'au finale ce sont toujours Google et Cie qui détiennent l'information.

    A quand un vrai moteur décentralisé avec ses propre base de données ?
    Après en ce qui concerne la faisabilité du truc (et surtout du temps de réponse), ça risque d'être compliqué.

    Ou alors utiliser quelques serveurs centraux qui ne gèrent que les réponses et laisser faire l'indexation par la communauté.

    Yacy semble préférer cette approche:
    http://yacy.net/

    Mais jusque là ça risque pas d'inquiéter Google, programmé en JAVA (chacun est libre d'en penser ce qu'il veut), il leur manque surtout l'infrastructure.
    A ce niveau là la communauté fera jamais le poids.
    • [^] # Re: Meta moteur ?

      Posté par  (site web personnel) . Évalué à 5.

      Le manifeste de Seeks, indique que celui-ci ambitionne de devenir indépendant des autres moteurs de recherches, en trois temps:
      * l'étape actuelle consiste à proposer un méta-moteur décentralisé avec quelques fonctionnalités pouvant attirer l'utilisateur.
      * Ensuite, il sera possible de référencer son site auprès de Seek en associant des mots clefs à son URL. À toute requête contenant ces mots clefs, Seek pourra répondre en partie sans les autres moteurs de recherche.
      * Enfin, « we propose to implement small software extensions to common web servers», ils proposent donc de développer de petites extensions logicielles pour les seveurs web les plus courants, leur permettant d'indexer eux-mêmes leurs pages, et de partager ces index avec les autres serveurs et les utilisateurs du réseau Seek.

      Ils n'ambitionnent donc pas de créer un moteur de recherche décentralisé, mais un indexateur décentralisé...
      Tant mieux si ça marche, mais c'est peu dire que le troisième temps devrait avoir du mal à s'imposer...
    • [^] # Re: Meta moteur ?

      Posté par  . Évalué à 6.

      Ce sont toujours les mêmes qui détiennent les informations, mais ils ne peuvent plus identifier les internautes.

      Envoyé depuis mon lapin.

      • [^] # Re: Meta moteur ?

        Posté par  (site web personnel) . Évalué à 2.

        Mais on s'en fout qu'ils ne puissent plus nous identifier. Si on est toujours dépendant d'eux, ça m'apporte pas grand chose.

        Ce genre d'initiative, c'est très bien, s'ils pourront au final utiliser une base de données indépendantes. (sur le modèle de yacy)
        • [^] # Re: Meta moteur ?

          Posté par  (site web personnel) . Évalué à 2.

          Les moteurs basés sur le modèle crawler/indexer font un bon boulot. La dépendance importe peu si :
          i/ on est anonyme.
          ii/ on peut manipuler les résultats.

          La philosophie de Seeks est de prendre ce qui est bon, et d'y ajouter à terme ce que les moteurs centralisés à but lucratif ne font pas (et ne peuvent pas faire sans briser leur modèle économique), à savoir le partage des requêtes.
    • [^] # Re: Meta moteur ?

      Posté par  . Évalué à 3.


      Ou alors utiliser quelques serveurs centraux qui ne gèrent que les réponses et laisser faire l'indexation par la communauté.


      Tu en es certain ?
      Il me semblait que le crawling, l'indexation et la recheche était décentralisées.
      Si tu installes un noeud tu peux effectuer tes recherches avec ton serveur local et on s'appuie sur un index distribué.
      http://en.wikipedia.org/wiki/Distributed_Hash_Table
      L'avantage de cette solution complétement décentralisée est le support de la montée en charge ainsi que les couts d'infrastructure faibles. Il n'est plus nécessaire de disposer de clusters de machines. Ceci se prète donc bien à une approche communautaire pour des questions de financement . Chacun met à disposition ses maigres ressources.
      L'inconvénient semble être la latence. Une même requête sera forcément plus longue à satisfaire.

      Ceci s'oppose à feu WikiaSearch http://en.wikipedia.org/wiki/Wikia_Search qui s'appuyait sur un crawler distribué (grub) mais qui utilisait un index et un frontend de recherche en mode cluster me semble-t'il.
    • [^] # Re: Meta moteur ?

      Posté par  . Évalué à 2.

      C'était pas aussi le cas de MozDex?
      http://www.mozdex.com/
      http://en.wikipedia.org/wiki/MozDex

      MozDex s'appuie sur des technos libres telles Nutch/Lucene pour construire le moteur de recherche et exposait comment le ranking d'un lien avait été réalisé avec la pondération, etc.

      Pas de bol, ils sont en train de mettre à jour leurs serveurs au moment où j'écris ces lignes.
  • # .

    Posté par  (site web personnel) . Évalué à 6.

    Ça n'a pas grand chose à voir, mais je m'aperçois que « look seek », en verlan ça donne « kiss cool » ... un beau slogan non ? :)

    Adhérer à l'April, ça vous tente ?

    • [^] # Re: .

      Posté par  (site web personnel) . Évalué à 5.

      En verlan ça donnerait plutôt kelou kes. Il faut respecter la langue un peu !
      • [^] # Re: .

        Posté par  . Évalué à 3.

        Iuo, nonis c'tse etsuj ed al Eugnalroz.

        (nodrap)
        • [^] # Re: .

          Posté par  . Évalué à 3.

          EugnalGroz, nu uep d'noitnetta, nonis no dnerpmoc neir !

          Eviv Bulgroz !
          • [^] # Re: .

            Posté par  . Évalué à 3.

            Hou le coup de vieux :-)
            C'est là qu'on voit que nous ne sommes pas tous des ados comme sur certains sites d'informatique.
          • [^] # Re: .

            Posté par  . Évalué à 3.

            Iuo nodrap, j'ia ue nu uep ed lam. C'tse euq c'tse élliuor ettec eriaffa-àl.
  • # Stable ?

    Posté par  . Évalué à 1.

  • # Du métamoteur et du parallèle avec les licences...

    Posté par  . Évalué à 5.

    Comment vit Google?

    Il fournit un service, et se rémunère en information.
    Vous lui demandez un service, qu'il effectue, et on s'accorde à dire qu'il le fait bien.
    En échange, il collecte des données sur ce que vous cherchez (et donc vous-mêmes).
    C'est un modèle assumé, Google ne se cache pas: ils vivent de ça! En utilisant Google, vous acceptez qu'ils enregistrent des informations concernant vos activités sur internet.

    Maintenant, que font les métamoteurs:
    - Investissement financier et humains très faible devant un monstre tel Google.
    - Captage d'utilisateurs en disant "nous on est vraiment gratuit! pas de collecte d'information!"
    - Utilisation massive du service fourni par Google... mais sans rien en échange!

    Avoir un index libre et un moteur de recherche libre, c'est magnifique. Utiliser de façon ouvertement et volontairement abusive les services proposés par une autre entreprise sous prétexte qu'on aime pas sa façon de se rémunérer, c'est selon moi, à la limite de la violation de licence. En tout cas le parallèle me paraît très pertinent.

    C'est vrai qu'ils n'interdisent rien, mais c'est comme le reste: faut-il vraiment avoir des régulations sur tout, ou peut-on espérer un minimum de sens civique de la part des utilisateurs?
    • [^] # Re: Du métamoteur et du parallèle avec les licences...

      Posté par  (site web personnel) . Évalué à 1.

      C est un peu plus complique que cela.

      Google bloque l innovation en interdisant la manipulation des resultats de son moteur (a l inverse de yahoo, sous certaines conditions).

      L innovation est aussi bloquee car le modele de financement de Google et les autres reposent sur le stockage des requetes afin de les utiliser pour apposer de la publicite. Du coup, toute recherche collaborative, reposant sur le partage des requetes ne sera jamais propose. Pourquoi ? Parce que si les requetes etaient rendues publiques, n importe qui pourrait faire de la pub pour ce qu il veut.

      Or c est exactement ce que Seeks veut faire. Sauf qu en lieu et place de la pub, il s agit de proposer des contenu issus du web, et de les noter pour en controller les rangs dans les resultats.

      Le sens civique c est peut etre d abord l activation de l innovation, son ouverture permanente, et son acces pour tous, developpeurs, entrepreneurs, utilisateurs.

      Enfin, concernant la violation de licence, elle est probable sur les noeuds publics, improbable avec une utilisation personnelle du proxy Seeks car les modifications ne sont pas repartagees.
    • [^] # Re: Du métamoteur et du parallèle avec les licences...

      Posté par  . Évalué à 2.

      Oui mais son sevrice est ouvert à tout le monde.
      C'est marrant parce que ton discours est exactement le même que celui des founisseurs de contenus avec Google Actu mais bizarrement là, ca choque personne.
      • [^] # Re: Du métamoteur et du parallèle avec les licences...

        Posté par  (site web personnel) . Évalué à 2.

        Non, le discours sur l'innovation n'a rien en commun avec celui des fournisseurs de contenus.

        De plus le but fondamental de Seeks est justement de permettre aux contenus d'être indexés par leurs créateurs et non plus grapillés à tout bout de champs sans même demander leur accord, ou le leur dire.

        Ca n'empêchera pas que l'indexation soit automatisé, mais Seeks cherche à inverser la direction dans laquelle cette indexation s'effectue. Du créateur au moteur et non plus l'inverse.

        Le méta-moteur est là pour permettre l'établissement d'une communauté, celle de nouveaux usages par l'installation de noeuds personnels, celle de l'utilisation d'outils techniques démocratisés (comme le clustering), et pour montrer que oui il y a des choses à faire et faisables, pleins.
  • # Merci...

    Posté par  (site web personnel) . Évalué à 2.

    Merci pour ce super journal, et pour me faire découvrir un nouveau moteur de recherche p2p, bravo aux développeurs !

    Par curiosité, le client est écrit en quel langage ? Java comme Yacy et Majestic12 ?

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.