Journal De la difficulté de trouver un moteur de recherche pertinent pour un site institutionnel du libre

32
11
jan.
2018

Avant de me lancer dans ce journal, j'ai commencé par effectuer une petite recherche "moteur de recherche" sur linuxfr. Il y a quelques pages de résultats. Je ne les ai pas tous consultés mais dans les premiers beaucoup sont vraiment vieux.

Et je suis même tombé sur cet article de 2012 indiquant que le moteur de recherche du site sera désormais interne et basé sur Elasticsearch, une initiative qui semble avoir fait long feu puisqu'aujourd'hui c'est duckduckgo (...)

Forum général.général Feedsportal, le fantôme des Interwebz

Posté par . Licence CC by-sa.
Tags :
0
19
déc.
2014

Salut les gars,

Je crois que j'ai la berlue.

J'ai dans mon lecteur un flux qui est généré par feedsportal.com qui, si je ne m'abuse, avait été racheté par l'ami gogol il y a de ça pas mal de temps (mais je peux pas être sur, l'histoire semble avoir disparu de la surface du web).

Dans ma recherche générale d'évitement du tracking, j'ai voulu trouver une façon d'éviter feedsportal, qui non content de ramasser des infos lors des updates de (...)

Journal lefrigo pour vos magnets

24
1
août
2012

Salut journal !

Donc chose promise, chose due, voilà donc encore un autre projet que je te présente. Il est encore en version de test, mais déjà bien utilisable (ça veut dire que vous devez être indulgents). Attention… lefrigo débarque !

Il s'agit d'un moteur de recherche de magnets de torrents, utilisant au mieux les technologies permises par notre cher HTML5 (je ne vous dis pas quelle version maintenant qu'il y en a deux, parce que je n'en sais fichtre rien) pour (...)

Nouveau moteur de recherche interne à LinuxFr.org

65
1
fév.
2012
LinuxFr.org

Jusqu'à présent, la recherche de contenus sur LinuxFr.org se faisait avec Google. Ce n'est plus le cas : nous avons maintenant notre propre moteur de recherche \o/. C'est une fonctionnalité qui était très demandée. Pour les utilisateurs pressés de l'utiliser, le champ de recherche est en haut à droite avec la feuille de style par défaut (« Entrer un mot-clé »). Il permet de rechercher sur tous les contenus de LinuxFr.org : dépêches, journaux, forums, sondages, pages de wiki et entrées de suivi.

D'un point de vue technique, ce moteur de recherche utilise Elastic Search et la gem Ruby Tire. Elastic Search est une interface REST (Representational_State_Transfer), sous licence Apache2, construit au dessus de Lucene. Il permet donc de profiter de la puissance des index Lucene, et notamment des facettes, en HTTP et JSON. Tire, de son coté, est une petite bibliothèque Ruby qui simplifie les requêtes d'indexation et de recherche à destination d'Elastic Search. Un autre avantage est qu'il est possible de profiter des opérateurs de recherche avancée de Lucene. Par exemple, "Elastic Search"^3 OR Google permet de faire une recherche sur la chaîne Elastic Search ou sur Google, mais en favorisant Elastic Search. Ce moteur est bien sûr perfectible (N'est pas Google qui veut !). Une première entrée a déjà été ouverte dans le système de suivi de LinuxFr.org. N'hésitez pas à y ajouter vos remarques de manière constructive.

Auparavant, comme mentionné plus haut, le champs de recherche renvoyait vers Google search. Pour la transparence, cela leur permettait de placer de la publicité et pour LinuxFr.org cela générait quelques petits revenus, en décroissance régulière cependant (moins de 100 $ par an désormais). Donc nous perdons une petite source d'argent (l'autre étant les dons ponctuels), mais nous gagnons désormais encore plus en indépendance.

Plus que de l'argent, ce dont LinuxFr.org a vraiment besoin pour vivre, c'est du contenu. Nous avons de sympathiques mécènes pour l'hébergement ou la motivation. Le meilleur moyen de nous aider est donc de contribuer. Merci à tous.