Se passer de Google, Facebook et autres big brothers 2.0 #1 — Les moteurs de recherche

62
3
juin
2014
Internet

Merci aux participants de cette dépêche collective, c.-à-d. ack, Adrien Dorsaz, alendroi, Anthony Jaguenaud, BAud, baud123, Bruce Le Nain, deor, etbim, fabienwang, Florent Zara, frayd, gUI, HLFH, j, jcr83, jeberger, Jiehong, Laurent Pointecouteau, lenod, M5oul, Mildred, Nicolive, nullard3d, Nÿco, olivierweb, palm123, SidStyler, SKy, tetraf, Thom, titiii, tux-tn, ver2terre, Viish, Vincent Gay, vlamy, Xinfe et Yves Bourguignon

Aujourd'hui, le net est occupé en grande partie par les services de grosses entreprises privées. Ceci pose de nombreux problèmes : logiciels privateurs, centralisation des données, pistage permanent, censure, exploration de données, dépendance à des tiers, etc.

Cette série décrit (et critique) des alternatives soit utilisables en auto-hébergement, soit via des services basés sur des logiciels libres. Dans cette première dépêche, nous allons nous intéresser aux moteurs de recherche. Les commentaires sont là pour préciser des oublis ou corriger les éventuelles erreurs.

watching

Yacy 1.0

Posté par  . Édité par Nÿco, tuiu pol et Nils Ratusznik. Modéré par Florent Zara. Licence CC By‑SA.
Étiquettes :
30
7
déc.
2011
Internet

YaCy (« ya see », « tu vois ») est un indexeur et moteur de recherche distribué en pair à pair (P2P, peer to peer). Développé en Java, il est disponible sous licence GPL, sur les plateformes GNU/Linux, Mac OS X et l'autre. Ce projet est soutenu par la Free Software Foundation Europe (FSFE).

Dans ce réseau, chaque nœud est égal aux autres, il n'y a donc pas de nœud « maître » ou « plus fort » (super-nœuds) qui pourrait censurer ou modifier la recherche, ou bien fortement l'influencer. Chaque nœud est soit indexeur (« crawler ») pour aller chercher les pages, les analyser et indexer, soit proxy pour servir les requêtes de recherche.

La base de données de l'index est une table de hashage distribuée (distributed hash table, DHT), donc des fragments d'index sont échangés. YaCy utilise OpenSearch basé sur du XML et RSS. YaCy offre une interface d'administration très complète, ainsi qu'une interface de recherche à facettes. La recherche s'effectue à la fois sur le nœud local, mais aussi sur des pairs. Il peut fonctionner tout seul pour indexer un intranet par exemple, mais il peut être associé à d'autres moteurs dans un réseau pair-à-pair pour améliorer ses recherches.

Comparé à Seeks, YaCy est un moteur de recherche pur, alors que Seeks utilise des moteurs de recherche existant, comme Google ou Bing, pour renvoyer des résultats, l'indexation n'ayant été ajoutée que récemment. Dans la liste d'avantages, on peut dire que YaCy peut indexer Tor, I2P et Freenet entre autres, et bien évidemment YaCy n'a pas de publicité. Dans la liste des inconvénients, malheureusement, YaCy n'est pas immune aux pairs malicieux, et la pertinence et le ranking ne sont pas au niveau des moteurs privateurs.

Merci à Nÿco et Nils Ratusznik pour leur aide lors de la rédaction de cet article.

Journal je découvre yacy, moteur de recherche p2p

Posté par  . Licence CC By‑SA.
31
2
mar.
2011

Journal,

J'ai un problème : google est très gentil, mais ça m'embête fortement qu'un seul acteur contrôle autant la recherche sur internet. Je suis parano : que faire si mon pays demande à google de censurer les résultats ou s'il modifie sciemment certains résultats ? Dans ma quête de liberté, je suis tombé sur le moteur de recherche yacy.

L'idée est séduisante : un moteur de recherche décentralisé, résistant à la censure et qui ne stocke pas les données des (…)