Sortie de Seeks en version stable 0.2.4

Posté par (page perso) . Modéré par Nÿco.
16
19
août
2010
Internet
Le Projet Seeks développe une architecture et une application libres pour la recherche collaborative sur le Web.

La première étape logicielle du projet est un méta moteur de recherche libre (AGPL), sous forme de serveur mandataire (proxy) ou de serveur HTTP. Seeks est déployable aussi bien en tant que moteur public que sur machine personnelle.

La version 0.2.4 est la seconde importante version livrée de Seeks. Elle comprend plusieurs nouveaux outils pour la recherche en ligne, comme la recherche d'images et l'analyse de similarité des résultats, y compris des images. Aujourd'hui il est possible à chacun de monter son propre nœud ou d'utiliser des nœuds publics.

La prochaine étape sera la livraison pour cet automne/hiver du module pair à pair pour le regroupement automatique des utilisateurs sur la base de la similarité de leurs requêtes. Cela permettra l'inter-connexion des noeuds existants et la collaboration entre utilisateurs à partir des résultats fournis par le méta-moteur. Sur cette base Seeks permettra l'émergence d'un véritable moteur décentralisé, avec un contrôle continu et collaboratif des utilisateurs sur les résultats et leurs données.

Comme le projet grandit, votre aide devient cruciale. Une aide indirecte mais simple aujourd'hui consiste à s'inscrire et voter pour nous sur la plate-forme Drumbeat de Mozilla. Toute participation est un plus, Seeks cherchant à redonner le contrôle aux utilisateurs sur leurs données de recherche et sur les algorithmes des moteurs existants.
  • # Toute petite correction grammaticale

    Posté par . Évalué à 2.

    sur leur données de recherche

    leurs données
  • # Comment aider ?

    Posté par (page perso) . Évalué à 1.

    Il est dit dans la dépêche que l'aide de chacun est cruciale pour le projet. Comment peut on aider le projet ?
    Je fais déjà tourner un nœud public, y a t'il d'autres moyens de filer un coup de main à ce projet prometteur ?
    • [^] # Re: Comment aider ?

      Posté par (page perso) . Évalué à 5.

      A vue de nez, je pense qu'il y a :

      Faire un paquet pour divers distribution, pour faciliter la mise en place des noeuds.

      Faire un article dans linuxmag, pour expliquer les soucis, les avantages, le fonctionnement.

      Faire un article pour ars technica, ou lwn, pour sortir du monde francophone.

      Traduire la page wikipedia en anglais pourrait aussi aider.

      Faire des présentations pour son lug, ça mange pas de pain.

      Traduire la documentation sur le wiki en francais


      C'est rapidement ce qui me vient à l'esprit, en regardant le projet.
  • # Cool, pas de Java !

    Posté par (page perso) . Évalué à 6.

    Il existe d'autres projets du genre. Problème : ils sont en Java, donc pour les installer, il faut dégainer toute la machinerie Java. Ouf, celui-ci est [un truc qui se compile en code natif], et n'a pas l'air de dépendre de quarante-deux douzaines de bibliothèques.
  • # Question

    Posté par (page perso) . Évalué à 2.

    Seek est un très beau projet: Au stade actuel, je le trouve bien plus performant que les autres agrégateurs de moteurs de recherches que j'ai pu essayer. J'utilise Seek depuis quelques semaines, et je n'ai jamais ressenti le besoin d'aller chercher ailleurs.

    J'ai une question concernant l'avenir. J'ai du mal à comprendre ce qu'est ce « module pair à pair pour le regroupement automatique des utilisateurs sur la base de la similarité de leurs requêtes » :
    – Est-ce la possibilité de clavarder en direct avec un quidam qui cherche la même chose que moi au même moment?
    – Est-ce la possibilité de discuter de façon indirecte de l'indexation des résultats, à l'image d'une discussion dans wikipedia sur la pertinence de telle ou telle phrase?
    – Est-ce le fait d'indexer les résultats en fonction de ce qu'ont choisi d'autres utilisateurs lors de requettes similaires?
    – Ou autre chose?

    Je n'ai rien trouvé de très explicite sur le site à ce sujet, mais peut-être ai-je mal cherché.
    • [^] # Re: Question

      Posté par . Évalué à 5.

      Bonjour Sygne,

      Petite précision, il s'agit bien de Seeks, avec un s au bout.

      Pour répondre à ta question, ce «regroupement automatique des utilisateurs» est en fait le cœur de Seeks: On tape une requête, et on se retrouve groupé (de manière logique) avec les utilisateurs qui ont fait une recherche similaire.
      Si tu n'as pas trouvé de description explicite, c'est que les possibilités sont multiples et qu'il reste une bonne marge de manœuvre pour décider comment ça sera exploité.

      Ce qui est à priori sur, c'est (chronologiquement):

      - la collaboration des utilisateurs sur les résultats (réorganisation)
      et plus tard
      - l'ajout direct dans le moteur d'un résultat, associé à sa requête


      PS: La page que tu cherchais était sans doute http://seeks-project.info/wiki/index.php/Roadmap
      • [^] # Re: Question

        Posté par (page perso) . Évalué à 2.

        Le lien répond en partie à ma question. Je l'avais déjà lu, il est plus précis que je ne m'en souvenais, mais reste un peu flou pour moi.

        Concernant « Hippy », dont la livraison est prévue en automne (n'est-ce pas?), en fonction de quoi les résultats de recherche seront-ils réorganisés? Est-ce en fonction des statistiques de liens cliqués par les utilisateurs? Y aura-t-il un système de vote des bons liens? Est-ce par discussion collaborative?

        Peut-être que tout cela est justement en discussion chez les développeurs de Seeks, mais comme l'automne arrive bientôt, je me dis qu'il doit y avoir plusieurs choses d'ores et déjà décidées.
        • [^] # Re: Question

          Posté par . Évalué à 2.

          Le document qui décrit le mieux les moyens d'action envisagés auprès des « searchgroups » est sans doute la page about[1] du site du projet.

          Il y a aussi un pdf[2] qui lui décrit plutôt le cadre théorique qui permet d'exploiter ces actions et d'en faire profiter les futures recherches.

          [1] http://www.seeks-project.info/site/?page_id=2
          [2] http://www.seeks-project.info/seeks/doc/seeks_toward.pdf
          • [^] # Re: Question

            Posté par (page perso) . Évalué à 1.

            Je connais tous ces liens. Je n'ai fait que survoler le dernier pdf, trop technique pour moi.

            En fait j'ai l'impression que mes questions ne peuvent trouver de réponse actuellement, puisque je voudrais connaître l'implémentation des techniques et des objectifs décrites sur le site.

            Tant que cette implémentation n'est pas faite, il est normal qu'on ne puisse pas la décrire.
            J'attendrai donc patiemment que la prochaine version sorte pour l'essayer, et pour me faire une idée par moi-même.

            Merci pour tout!
            • [^] # Re: Question

              Posté par (page perso) . Évalué à 1.

              > Je connais tous ces liens. Je n'ai fait que survoler le dernier pdf, trop technique pour moi.

              > En fait j'ai l'impression que mes questions ne peuvent trouver de réponse actuellement, puisque je voudrais connaître l'implémentation des techniques et des objectifs décrites sur le site.

              > Tant que cette implémentation n'est pas faite, il est normal qu'on ne puisse pas la décrire.

              L'implémentation repose sur des spécifications rendues publiques depuis un long moment :
              http://www.seeks-project.info/seeks/doc/seeks_archi_socwebs_(...)

              La section 'Collaborative Filtering' (p. 29) répondra à la plupart de tes questions, en des termes plus appliqués que le document théorique.
    • [^] # Re: Question

      Posté par (page perso) . Évalué à 2.

      > – Est-ce la possibilité de clavarder en direct avec un quidam qui cherche la même chose que moi au même moment?

      Oui, ce sera un plugin.

      > – Est-ce la possibilité de discuter de façon indirecte de l'indexation des résultats, à l'image d'une discussion dans wikipedia sur la pertinence de telle ou telle phrase?

      Oui, ce sera un autre plugin. On pense à l'historique des notations actives (à opposer aux notations passives, par exemple les clics), et à une page discussion par résultat de recherche / URL.

      >– Est-ce le fait d'indexer les résultats en fonction de ce qu'ont choisi d'autres utilisateurs lors de requettes similaires?

      Oui, c'est la base, le filtrage collaboratif, ce sera le premier plugin à sortir, et automne/hiver avec la première version P2P.
  • # Beau projet mais dommage...

    Posté par . Évalué à 0.

    ... dommage si ça reste un meta moteur, puisqu'un meta moteur dépend des moteurs de recherches.

    Et le jour où ces moteurs de recherches décident de bloquer les meta moteurs, bah...

    Ceci dit, Seeks faire partie de ma to do list des soft à installer pour tests.

    :)
    • [^] # Re: Beau projet mais dommage...

      Posté par (page perso) . Évalué à 4.

      Justement, il a pour objectif de ne pas rester un méta-moteur. Mieux, il a pour projet de substituer un mode de recherche décentralisé au mode actuel qui est centralisé.

      À mon avis (avis qui ne repose sur rien de rationnel), si le protocole de pair à pair est bien pensé, cela est promis à un bel avenir. Je ne suis même pas certain que la masse critique pour que ça fonctionne soit réellement importante: une petite communauté d'utilisateurs aux goûts divers doit rapidement débroussailler un champ du web susceptible de répondre aux requêtes les plus fréquentes.

      Quant à la possibilité que les moteurs de recherchent bloquent les méta-moteur, cela n'affecte pas Seek, puisque, justement, il est décentralisé: comment le méta-moteur peut-il savoir que la requête vient de seek et pas de firefox?

      Après, il est certain que si personne ne l'utilise, il ne fonctionnera jamais...
    • [^] # Re: Beau projet mais dommage...

      Posté par . Évalué à 4.

      Seeks n'est pas qu'un méta moteur, la dépêche semble claire sur ce point, le coté méta est juste un point de départ.

      Seeks s'appuie sur d'autres moteurs, car, comme il ne fait pas de travail d'indexation, il faut bien proposer du contenu aux utilisateurs.

      Le projet est libre est peux s'installer sur n'importe quelle machine (GNU/Linux, *BSD), il sera ainsi complexe aux moteurs de bloquer l'accès à des instances qui peuvent provenir de n'importe où.
      • [^] # Re: Beau projet mais dommage...

        Posté par (page perso) . Évalué à 1.

        On en avait déjà parlé aux RMLL, je commence à l'utiliser.

        "Le projet est libre est peux s'installer sur n'importe quelle machine (GNU/Linux, *BSD), il sera ainsi complexe aux moteurs de bloquer l'accès à des instances qui peuvent provenir de n'importe où. "

        ça a l'air génial... Je me suis inscrit sur

        www.drumbeat.org/project/seeks-project-decentralized-collaborative-web-search

        pour un minimum de soutien.
        • [^] # Re: Beau projet mais dommage...

          Posté par . Évalué à 2.

          je bifurque, je découvre par le même coup drumbeat, mais ça sert à quoi ?
          j'ai vu qu'ils hébergent des projets en rapport avec le web, mais en pratique, c'est juste une forge ? un moyen de faire de la pub ? est ce que mozo finance certains projets ?
  • # Déception

    Posté par (page perso) . Évalué à 3.

    J'avais déjà testé Seeks il y a quelques temps à travers un moteur public, et je profite donc de la dépêche pour l'installer. Je découvre donc l'installation et les rouages de Seeks, et là, déception !

    J'utilisais déjà Privoxy pour filtrer le web sur mes PCs, avec une petite configuration au poil et tout, et je découvre que Seeks utilise aussi le moteur de Privoxy, mais sans possibilité d'utiliser une configuration existante ! En gros, ( sauf à se lancer dans des proxys en chaîne ), soit on utilise Privoxy, soit on utilise Seeks, mais pas les deux !

    Je comprend l'intérêt d'avoir un mode stand-alone, mais je ne comprend pas que ce soit le seul disponible. Est-ce que cela serait très compliqué à découpler ( en plus je pense que cela devrait faciliter l'intégration dans les distributions… ) ?
    • [^] # Re: Déception

      Posté par . Évalué à 3.

      Bonjour chimrod,

      Seeks est en effet une réécriture de privoxy en c++.
      Il y a pour l'instant un plugin blocker, qui peut servir à filtrer la publicité.
      Le projet est par ailleurs à la recherche d'un développeur pour porter le filtrage possible par privoxy sur seeks.

      Mais il y a une autre option: Seeks propose un plugin http, qui permet de s'adresser à celui-ci via http:
      il faut lancer le configure avec --enable-httpserv-plugin, libevent étant en dépendance
      il est permet de conserver privoxy à coté.

      Un ajout du moteur aux moteurs par défaut du navigateur (via une description opensearch) est alors très simple ( comme expliqué sur http://forum.ubuntu-fr.org/viewtopic.php?pid=3673068#p367306(...) )
      • [^] # Re: Déception

        Posté par (page perso) . Évalué à 2.

        Je trouve ça dommage, ça me donne l'impression de réécrire ce qui existe déjà… Je pensais plus à quelquechose à comme Tor, qui à besoin d'un proxy pour fonctionner mais qui ne l'implémente pas lui même.

        En fait, j'ai l'impression de voir le schéma suivant :

        On part de Privoxy ( qui propose des options de filtrage )
        On lui retire ces options
        On cherche ensuite à les réécrire ( et en cherchant des développeurs pour ça… )

        Je pense que vous avez vos raisons pour ça, mais sur ce coup elles m'échappent ( de plus on sort du statut de moteur de recherche là… )

        Ça ne serait pas possible que seeks écoute sur une entrée Socks ( pour rester dans l'exemple de Tor ), et laisser de côté la manière dont on s'y connecte ?
        • [^] # Re: Déception

          Posté par (page perso) . Évalué à 3.

          > En fait, j'ai l'impression de voir le schéma suivant :
          > On part de Privoxy ( qui propose des options de filtrage )
          > On lui retire ces options
          > On cherche ensuite à les réécrire ( et en cherchant des développeurs pour ça… )
          > Je pense que vous avez vos raisons pour ça, mais sur ce coup elles m'échappent

          Le module de blocage de publicité de Privoxy est bien moins avancé que celui de AdBlockPlus. Un peu sur le plan de la génération des règles, beaucoup en ce qui concerne les performances (rapidité notamment). Les optios retirées l'ont bien été en connaissance de cause et après exposition de nos buts sur la 'mailing list' Privoxy.

          L'écriture d'un plugin dans Seeks pour remplacer le système de Privoxy est donc à l'ordre du jour, en C++ et sur une base plus efficace que celle de Privoxy.

          En attendant le plugin 'blocker' remplit une partie de ce travail, je l'utilise depuis un an sans problème avec ma propre liste de regexps.

          > ( de plus on sort du statut de moteur de recherche là… )

          Pas du tout. Qui dit moteur collaboratif dit information en partie éditée par les utilisateurs, donc spam, résultats indésirables, vandalisés ou d'ordre publicitaire. Le filtrage de ces éléments fonctionne de la même façon que celui des publicités sur le Web aujourd'hui.

Suivre le flux des commentaires

Note : les commentaires appartiennent à ceux qui les ont postés. Nous n'en sommes pas responsables.