La première étape logicielle du projet est un méta moteur de recherche libre (AGPL), sous forme de serveur mandataire (proxy) ou de serveur HTTP. Seeks est déployable aussi bien en tant que moteur public que sur machine personnelle.
La version 0.2.4 est la seconde importante version livrée de Seeks. Elle comprend plusieurs nouveaux outils pour la recherche en ligne, comme la recherche d'images et l'analyse de similarité des résultats, y compris des images. Aujourd'hui il est possible à chacun de monter son propre nœud ou d'utiliser des nœuds publics.
La prochaine étape sera la livraison pour cet automne/hiver du module pair à pair pour le regroupement automatique des utilisateurs sur la base de la similarité de leurs requêtes. Cela permettra l'inter-connexion des noeuds existants et la collaboration entre utilisateurs à partir des résultats fournis par le méta-moteur. Sur cette base Seeks permettra l'émergence d'un véritable moteur décentralisé, avec un contrôle continu et collaboratif des utilisateurs sur les résultats et leurs données.
Comme le projet grandit, votre aide devient cruciale. Une aide indirecte mais simple aujourd'hui consiste à s'inscrire et voter pour nous sur la plate-forme Drumbeat de Mozilla. Toute participation est un plus, Seeks cherchant à redonner le contrôle aux utilisateurs sur leurs données de recherche et sur les algorithmes des moteurs existants.
Aller plus loin
- Page du projet (5 clics)
- Liste des noeuds publics (3 clics)
- Voter sur Drumbeat (1 clic)
- Captures d'écran (2 clics)
- Monter son propre nœud (4 clics)
# Toute petite correction grammaticale
Posté par Davy Defaud . Évalué à 2.
leurs données
[^] # Re: Toute petite correction grammaticale
Posté par Xavier Teyssier (site web personnel) . Évalué à 1.
# Comment aider ?
Posté par taziden (site web personnel) . Évalué à 1.
Je fais déjà tourner un nœud public, y a t'il d'autres moyens de filer un coup de main à ce projet prometteur ?
[^] # Re: Comment aider ?
Posté par Misc (site web personnel) . Évalué à 5.
Faire un paquet pour divers distribution, pour faciliter la mise en place des noeuds.
Faire un article dans linuxmag, pour expliquer les soucis, les avantages, le fonctionnement.
Faire un article pour ars technica, ou lwn, pour sortir du monde francophone.
Traduire la page wikipedia en anglais pourrait aussi aider.
Faire des présentations pour son lug, ça mange pas de pain.
Traduire la documentation sur le wiki en francais
C'est rapidement ce qui me vient à l'esprit, en regardant le projet.
# Cool, pas de Java !
Posté par 🚲 Tanguy Ortolo (site web personnel) . Évalué à 6.
[^] # Re: Cool, pas de Java !
Posté par C. OB (site web personnel) . Évalué à 3.
# Question
Posté par Sygne (site web personnel) . Évalué à 2.
J'ai une question concernant l'avenir. J'ai du mal à comprendre ce qu'est ce « module pair à pair pour le regroupement automatique des utilisateurs sur la base de la similarité de leurs requêtes » :
– Est-ce la possibilité de clavarder en direct avec un quidam qui cherche la même chose que moi au même moment?
– Est-ce la possibilité de discuter de façon indirecte de l'indexation des résultats, à l'image d'une discussion dans wikipedia sur la pertinence de telle ou telle phrase?
– Est-ce le fait d'indexer les résultats en fonction de ce qu'ont choisi d'autres utilisateurs lors de requettes similaires?
– Ou autre chose?
Je n'ai rien trouvé de très explicite sur le site à ce sujet, mais peut-être ai-je mal cherché.
[^] # Re: Question
Posté par piti . Évalué à 5.
Petite précision, il s'agit bien de Seeks, avec un s au bout.
Pour répondre à ta question, ce «regroupement automatique des utilisateurs» est en fait le cœur de Seeks: On tape une requête, et on se retrouve groupé (de manière logique) avec les utilisateurs qui ont fait une recherche similaire.
Si tu n'as pas trouvé de description explicite, c'est que les possibilités sont multiples et qu'il reste une bonne marge de manœuvre pour décider comment ça sera exploité.
Ce qui est à priori sur, c'est (chronologiquement):
- la collaboration des utilisateurs sur les résultats (réorganisation)
et plus tard
- l'ajout direct dans le moteur d'un résultat, associé à sa requête
PS: La page que tu cherchais était sans doute http://seeks-project.info/wiki/index.php/Roadmap
[^] # Re: Question
Posté par Sygne (site web personnel) . Évalué à 2.
Concernant « Hippy », dont la livraison est prévue en automne (n'est-ce pas?), en fonction de quoi les résultats de recherche seront-ils réorganisés? Est-ce en fonction des statistiques de liens cliqués par les utilisateurs? Y aura-t-il un système de vote des bons liens? Est-ce par discussion collaborative?
Peut-être que tout cela est justement en discussion chez les développeurs de Seeks, mais comme l'automne arrive bientôt, je me dis qu'il doit y avoir plusieurs choses d'ores et déjà décidées.
[^] # Re: Question
Posté par piti . Évalué à 2.
Il y a aussi un pdf[2] qui lui décrit plutôt le cadre théorique qui permet d'exploiter ces actions et d'en faire profiter les futures recherches.
[1] http://www.seeks-project.info/site/?page_id=2
[2] http://www.seeks-project.info/seeks/doc/seeks_toward.pdf
[^] # Re: Question
Posté par Sygne (site web personnel) . Évalué à 1.
En fait j'ai l'impression que mes questions ne peuvent trouver de réponse actuellement, puisque je voudrais connaître l'implémentation des techniques et des objectifs décrites sur le site.
Tant que cette implémentation n'est pas faite, il est normal qu'on ne puisse pas la décrire.
J'attendrai donc patiemment que la prochaine version sorte pour l'essayer, et pour me faire une idée par moi-même.
Merci pour tout!
[^] # Re: Question
Posté par pilouche (site web personnel) . Évalué à 1.
> En fait j'ai l'impression que mes questions ne peuvent trouver de réponse actuellement, puisque je voudrais connaître l'implémentation des techniques et des objectifs décrites sur le site.
> Tant que cette implémentation n'est pas faite, il est normal qu'on ne puisse pas la décrire.
L'implémentation repose sur des spécifications rendues publiques depuis un long moment :
http://www.seeks-project.info/seeks/doc/seeks_archi_socwebs_(...)
La section 'Collaborative Filtering' (p. 29) répondra à la plupart de tes questions, en des termes plus appliqués que le document théorique.
[^] # Re: Question
Posté par pilouche (site web personnel) . Évalué à 2.
Oui, ce sera un plugin.
> – Est-ce la possibilité de discuter de façon indirecte de l'indexation des résultats, à l'image d'une discussion dans wikipedia sur la pertinence de telle ou telle phrase?
Oui, ce sera un autre plugin. On pense à l'historique des notations actives (à opposer aux notations passives, par exemple les clics), et à une page discussion par résultat de recherche / URL.
>– Est-ce le fait d'indexer les résultats en fonction de ce qu'ont choisi d'autres utilisateurs lors de requettes similaires?
Oui, c'est la base, le filtrage collaboratif, ce sera le premier plugin à sortir, et automne/hiver avec la première version P2P.
# Beau projet mais dommage...
Posté par lirfil . Évalué à 0.
Et le jour où ces moteurs de recherches décident de bloquer les meta moteurs, bah...
Ceci dit, Seeks faire partie de ma to do list des soft à installer pour tests.
:)
[^] # Re: Beau projet mais dommage...
Posté par Sygne (site web personnel) . Évalué à 4.
À mon avis (avis qui ne repose sur rien de rationnel), si le protocole de pair à pair est bien pensé, cela est promis à un bel avenir. Je ne suis même pas certain que la masse critique pour que ça fonctionne soit réellement importante: une petite communauté d'utilisateurs aux goûts divers doit rapidement débroussailler un champ du web susceptible de répondre aux requêtes les plus fréquentes.
Quant à la possibilité que les moteurs de recherchent bloquent les méta-moteur, cela n'affecte pas Seek, puisque, justement, il est décentralisé: comment le méta-moteur peut-il savoir que la requête vient de seek et pas de firefox?
Après, il est certain que si personne ne l'utilise, il ne fonctionnera jamais...
[^] # Re: Beau projet mais dommage...
Posté par piti . Évalué à 4.
Seeks s'appuie sur d'autres moteurs, car, comme il ne fait pas de travail d'indexation, il faut bien proposer du contenu aux utilisateurs.
Le projet est libre est peux s'installer sur n'importe quelle machine (GNU/Linux, *BSD), il sera ainsi complexe aux moteurs de bloquer l'accès à des instances qui peuvent provenir de n'importe où.
[^] # Re: Beau projet mais dommage...
Posté par El_DreamMachine (site web personnel) . Évalué à 1.
"Le projet est libre est peux s'installer sur n'importe quelle machine (GNU/Linux, *BSD), il sera ainsi complexe aux moteurs de bloquer l'accès à des instances qui peuvent provenir de n'importe où. "
ça a l'air génial... Je me suis inscrit sur
www.drumbeat.org/project/seeks-project-decentralized-collaborative-web-search
pour un minimum de soutien.
[^] # Re: Beau projet mais dommage...
Posté par Alex . Évalué à 2.
j'ai vu qu'ils hébergent des projets en rapport avec le web, mais en pratique, c'est juste une forge ? un moyen de faire de la pub ? est ce que mozo finance certains projets ?
[^] # Re: Beau projet mais dommage...
Posté par El_DreamMachine (site web personnel) . Évalué à 1.
# Déception
Posté par chimrod (site web personnel) . Évalué à 3.
J'utilisais déjà Privoxy pour filtrer le web sur mes PCs, avec une petite configuration au poil et tout, et je découvre que Seeks utilise aussi le moteur de Privoxy, mais sans possibilité d'utiliser une configuration existante ! En gros, ( sauf à se lancer dans des proxys en chaîne ), soit on utilise Privoxy, soit on utilise Seeks, mais pas les deux !
Je comprend l'intérêt d'avoir un mode stand-alone, mais je ne comprend pas que ce soit le seul disponible. Est-ce que cela serait très compliqué à découpler ( en plus je pense que cela devrait faciliter l'intégration dans les distributions… ) ?
[^] # Re: Déception
Posté par piti . Évalué à 3.
Seeks est en effet une réécriture de privoxy en c++.
Il y a pour l'instant un plugin blocker, qui peut servir à filtrer la publicité.
Le projet est par ailleurs à la recherche d'un développeur pour porter le filtrage possible par privoxy sur seeks.
Mais il y a une autre option: Seeks propose un plugin http, qui permet de s'adresser à celui-ci via http:
il faut lancer le configure avec --enable-httpserv-plugin, libevent étant en dépendance
il est permet de conserver privoxy à coté.
Un ajout du moteur aux moteurs par défaut du navigateur (via une description opensearch) est alors très simple ( comme expliqué sur http://forum.ubuntu-fr.org/viewtopic.php?pid=3673068#p367306(...) )
[^] # Re: Déception
Posté par chimrod (site web personnel) . Évalué à 2.
En fait, j'ai l'impression de voir le schéma suivant :
On part de Privoxy ( qui propose des options de filtrage )
On lui retire ces options
On cherche ensuite à les réécrire ( et en cherchant des développeurs pour ça… )
Je pense que vous avez vos raisons pour ça, mais sur ce coup elles m'échappent ( de plus on sort du statut de moteur de recherche là… )
Ça ne serait pas possible que seeks écoute sur une entrée Socks ( pour rester dans l'exemple de Tor ), et laisser de côté la manière dont on s'y connecte ?
[^] # Re: Déception
Posté par pilouche (site web personnel) . Évalué à 3.
> On part de Privoxy ( qui propose des options de filtrage )
> On lui retire ces options
> On cherche ensuite à les réécrire ( et en cherchant des développeurs pour ça… )
> Je pense que vous avez vos raisons pour ça, mais sur ce coup elles m'échappent
Le module de blocage de publicité de Privoxy est bien moins avancé que celui de AdBlockPlus. Un peu sur le plan de la génération des règles, beaucoup en ce qui concerne les performances (rapidité notamment). Les optios retirées l'ont bien été en connaissance de cause et après exposition de nos buts sur la 'mailing list' Privoxy.
L'écriture d'un plugin dans Seeks pour remplacer le système de Privoxy est donc à l'ordre du jour, en C++ et sur une base plus efficace que celle de Privoxy.
En attendant le plugin 'blocker' remplit une partie de ce travail, je l'utilise depuis un an sans problème avec ma propre liste de regexps.
> ( de plus on sort du statut de moteur de recherche là… )
Pas du tout. Qui dit moteur collaboratif dit information en partie éditée par les utilisateurs, donc spam, résultats indésirables, vandalisés ou d'ordre publicitaire. Le filtrage de ces éléments fonctionne de la même façon que celui des publicités sur le Web aujourd'hui.
Suivre le flux des commentaires
Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.