Après quelques mois d'absence, la banquise est de retour pour notre plus grand plaisir ...
La Banquise [1] est un projet de moteur de recherche (francophone pour l'instant) sur le libre.
Modération : Nous avons actuellement 116 sites validés en base, et 277 à valider (issus notamment de l'annuaire de Lea [2]), aussi un petit coup de main serait le bienvenu. Si vous n'avez ne serait-ce qu'une heure ou deux pour nous aider, ce sera avec plaisir, cela va vite ...
But du projet : Le but serait de reprendre aspseek [3], le moteur libre servant de base à max et sa banquise pour tout d'abord documenter ce moteur de recherche, puis l'améliorer afin qu'il corresponde mieux à nos besoins pour l'indexation complète du libre (pas seulement francophone) ...
Infrastructure : Pour l'instant je met gracieusement à disposition l'infrastructure matérielle nécessaire à l'hébergement d'un tel projet, mais une réflexion sur l'indépendance du projet est bien évidemment en cours.
Développements : Parallèlement à l'étude et aux éventuels développement pour aspseek, il me parait bon de proposer rapidement à des projets comme dlfp, léa ou framasoft[4], voire tout site du libre de disposer d'un moteur de recherche puissant et indépendant de google :) xml/rpc, soap & co seront nos amis dans ce contexte pour proposer ce service de recherche interne ...
Pour contacter max et sa banquise : benjamin arobase labanquise.org. Vous êtes bien sur invités à nous aider sur ce projet (modération, développement sous cvs php/C++)
[1] http://www.labanquise.org/(...)
[2] http://www.lea-linux.org/(...)
[3] http://www.aspseek.org/(...)
[4] http://www.framasoft.net/(...)
ps: avis aux modérateurs : si vous voulez en faire une dépêche, merci de ne pas le faire : je préfère attendre que le projet se stabilise vu qu'il était arrêté depuis octobre, genre un bon trimestre ... Merci
La Banquise [1] est un projet de moteur de recherche (francophone pour l'instant) sur le libre.
Modération : Nous avons actuellement 116 sites validés en base, et 277 à valider (issus notamment de l'annuaire de Lea [2]), aussi un petit coup de main serait le bienvenu. Si vous n'avez ne serait-ce qu'une heure ou deux pour nous aider, ce sera avec plaisir, cela va vite ...
But du projet : Le but serait de reprendre aspseek [3], le moteur libre servant de base à max et sa banquise pour tout d'abord documenter ce moteur de recherche, puis l'améliorer afin qu'il corresponde mieux à nos besoins pour l'indexation complète du libre (pas seulement francophone) ...
Infrastructure : Pour l'instant je met gracieusement à disposition l'infrastructure matérielle nécessaire à l'hébergement d'un tel projet, mais une réflexion sur l'indépendance du projet est bien évidemment en cours.
Développements : Parallèlement à l'étude et aux éventuels développement pour aspseek, il me parait bon de proposer rapidement à des projets comme dlfp, léa ou framasoft[4], voire tout site du libre de disposer d'un moteur de recherche puissant et indépendant de google :) xml/rpc, soap & co seront nos amis dans ce contexte pour proposer ce service de recherche interne ...
Pour contacter max et sa banquise : benjamin arobase labanquise.org. Vous êtes bien sur invités à nous aider sur ce projet (modération, développement sous cvs php/C++)
[1] http://www.labanquise.org/(...)
[2] http://www.lea-linux.org/(...)
[3] http://www.aspseek.org/(...)
[4] http://www.framasoft.net/(...)
ps: avis aux modérateurs : si vous voulez en faire une dépêche, merci de ne pas le faire : je préfère attendre que le projet se stabilise vu qu'il était arrêté depuis octobre, genre un bon trimestre ... Merci
> Lire le journal (25 commentaires, moyenne: 3,3).
Vous avez demandé le commentaire #571286.



A la place d'un serveur dédié
Pourquoi pas un ensemble de serveurs personnels?
Comme je t'avais proposé en privé y a je sais plus combien de temps
Pourquoi ne pas avoir un serveur maitre et disons une dizaine de serveurs (ahum) esclaves
qui copient la base SQL et le moteur
et différents entrée en round robin sur le dns? (une solution à la geoip me conviendrait aussi bien mais je sais pas comment on implémante ca :)
Bon sinon je veux bien aider pour modérer les sites mais je vois pas de lien sur la page d'accueil
[^]Re: A la place d'un serveur dédié
Un petit mail et je t'envoie un compte de login/pass pour modération.
[^]Re: A la place d'un serveur dédié
C'est vrai que surtout au niveau des "dances", le fait de répartir la charge peut être intéressant, en effet, selon le rapport débit/temps de calcul 2 cas se présentent :
-> soit le temps de calcul est supérieur au débit donc c'est intéressant de distribuer le calcul
-> soit le débit est supérieur au temps de calcul et si les résultats lié à une page sont inférieurs à la taille des pages traités, il est aussi intéressant de distribuer le calcul.
De plus, une petite question : pourquoi le choix du C++, peut-être qu'un langage de plus haut niveau (perl,python) augmenterait la quantité de contribution ?
[^]Re: A la place d'un serveur dédié
- pour l'histoire de la recherche distribuée, je suis tombé sur ce document de l'apache foundation qui a confirmé ce que j'avais déterminé depuis bien longtemps par l'expérience : http://incubator.apache.org/nutch/faq.html(...)
Will Nutch be a distributed, P2P-based search engine?
We don't think it is presently possible to build a peer-to-peer search engine that is competitive with existing search engines. It would just be too slow. Returning results in less than a second is important: it lets people rapidly reformulate their queries so that they can more often find what they're looking for. In short, a fast search engine is a better search engine. I don't think many people would want to use a search engine that takes ten or more seconds to return results.
That said, if someone wishes to start a sub-project of Nutch exploring distributed searching, we'd love to host it. We don't think these techniques are likely to solve the hard problems Nutch needs to solve, but we'd be happy to be proven wrong.
- Pour le C++, ca n'est pas NOTRE choix mais celui de l'équipe d'Aspseek à l'époque. Ce moteur étant celui qui nous a paru le plus abouti et le plus simple pour la recherche puissante multi-site avec mise à jour, nous l'avons choisi. Le projet est bien évidemment ouvert à toute nouvelle suggestion ;) Par exemple, on utilise déjà un module de php spécial pour ne pas avoir à utiliser le CGI peu modulaire fourni avec Aspseek ...
- Pour les histoires de débit, une liaison asymétrique à 10Mbps / 1Mbps va lui être dédié, je pense que cela suffira pendant un bon temps ... et d'ici là on aura eu le temps de se poser 1000 autres questions ...
[^]Re: A la place d'un serveur dédié
Je pensais pas vraiment faire en P2P
Juste différents serveurs réparti à travers la France
Sinon 10Mbits en upload ou download?
Si c'est le 1Mbit upload alors n'importe quelle connexion Free passe (en adsl 2+ pas trop pourrite)
Si c'est 10Mbit, 1+10 serveurs passeront