Journal DeuSu, un moteur de recherche libre avec son propre index

Posté par . Licence CC by-sa
16
9
sept.
2016

DeuSu est un moteur de recherche libre, qui utilise son propre index (ce n'est pas un méta-moteur comme searx, qui vient de passer en v0.10), ne stocke pas les adresses IP et n'utilise pas de cookies.

Il clame aussi ne pas mettre de pubs et ne jamais en mettre, mais comme c'est un site géré par une seule personne, et qui cherche à financer son serveur par des dons (300€/mois), on ne peut en être sûr (...)

Forum général.cherche-logiciel Moteur de recherche avec interface web

Posté par . Licence CC by-sa
3
16
avr.
2016

Bonjour,
j'ai un petit blog en local, je note pas mal de choses, et l'idée c'est de pouvoir récupérer et retrouver des anciennes infos/article assez facilement. Je me suis basé sur un blog en mode texte (qui n'utilise aucune base de donnée), et donc met tout nouveau post dans un répertoire, et à chaque fois dans un fichier.

L'idée serait d'avoir un moteur de recherche qui me faciliterait pour retrouver des articles basé sur le full-text (et de continuer avec (...)

Journal Passage à duckduckgo pour mes recherches au lieu de google

Posté par (page perso) . Licence CC by-sa
29
21
oct.
2015

Cher 'Nal,

Je suis passé à https://duckduckgo.com/ récemment, même si je l'utilisais déjà sur LinuxFr.org
google m'imposant d'accepter ses conditions d'utilisation que je n'ai pas encore réussi à lire en entier(*), ce qui fait que je refuse et cela m'empêche d'utiliser leur moteur de recherche que j'appréciais bien avec adblock virant les liens sponsorisés.

Bref ddg c'est pas mal

configuration de Firefox pour désactiver les moteurs de recherche inopportuns

C'est trivial et bien expliqué sur la page idoine de sélection (...)

Journal rv/hervé : recherche d’itinéraire vélo minimisant l'énergie en utilisant les données d'OSM

72
25
oct.
2014

Introduction

Il y a quelques temps, plus d'un an déjà, j'ai écrit un journal ici-même présentant un projet sur lequel je passais une partie de mon temps libre. Les choses ayant légèrement évolué depuis, je récidive. Bien que la lecture du précédent journal soit utile, elle n'est pas obligatoire pour comprendre celui-ci, sauf pour des points de détails, j'y ferai référence en temps voulu.

Étant adepte du vélocipède en tant que moyen de transport, et comme tous les amateurs de (...)

Se passer de Google, Facebook et autres big brothers 2.0 #1 - les moteurs de recherche

62
3
juin
2014
Internet

Merci aux participants de cette dépêche collective, c.-à-d. ack, Adrien Dorsaz, alendroi, Anthony Jaguenaud, BAud, baud123, Bruce Le Nain, deor, etbim, fabienwang, Florent Zara, frayd, gUI, HLFH, j, jcr83, jeberger, Jiehong, Laurent Pointecouteau, lenod, M5oul, Mildred, Nicolive, nullard3d, Nÿco, olivierweb, palm123, SidStyler, SKy, tetraf, Thom, titiii, tux-tn, ver2terre, Viish, Vincent Gay, vlamy, Xinfe et Yves Bourguignon

Aujourd'hui, le net est occupé en grande partie par les services de grosses entreprises privées. Ceci pose de nombreux problèmes : logiciels privateurs, centralisation des données, pistage permanent, censure, exploration de données, dépendance à des tiers, etc.

Cette série décrit (et critique) des alternatives soit utilisables en auto-hébergement, soit via des services basés sur des logiciels libres. Dans cette première dépêche, nous allons nous intéresser aux moteurs de recherche. Les commentaires sont là pour préciser des oublis ou corriger les éventuelles erreurs.

watching

Journal DuckDuckGo change de parure

Posté par (page perso) . Licence CC by-sa
24
6
mai
2014

DuckDuckGo (DDG), qu'une première dépêche nous présentait il y a quelques années, propose une nouvelle interface, mais pas par défaut.

J'avoue n'avoir aucune idée quant à depuis quand elle est accessible.

Vous pouvez maintenant continuer à utiliser l'interface actuelle, tout en essayant la nouvelle.

Pour ma part, je trouve la nouvelle interface bien plus adaptée au navigateurs dits « mobiles ».

Journal Nepomuk est mort, vive baloo

44
25
mar.
2014

Le projet KDE pour la version 4.13 (et donc définitivement pour KDE 5) est en train d'abandonner Nepomuk.

http://community.kde.org/Baloo

Après de nombreuses années à essayer d'optimiser Nepomuk, les devs KDE ont décidé d'abandonner ce dernier en grande partie à cause du format RDF.

D'un point de vu utilisateur, la différence est flagrante, Baloo est rapide et léger. J'ai même activé l'indexation des fichiers tellement je ne vois pas la différence avec et sans (alors qu'avec Nepomuk et je ne parle (...)

Journal Osez votre propre moteur de recherche !

Posté par (page perso) . Licence CC by-sa
35
15
oct.
2013

Comme vous devriez le savoir, Google et bien d’autres sociétés ne tarissent pas de moyens pour collecter sur vous les moindres détails de votre vie. On peut au moins compter :

  • IP
  • liens de redirection avec ID personnalisée (avec Firefox, faites clic droit -> examiner sur un lien de résultat Google pour voir cette merde)
  • cookie de Google.com mais aussi des services qui partagent leur données avec Google.com (Youtube, GooglePlus ,etc..)
  • Flash variable, javascript et autre technique utilisant les fonctionnalités (...)

tl;drLegal, moteur de recherche pour licences Open Source

Posté par (page perso) . Édité par Nÿco, baud123, Benoît Sibaud et Pierre Jarillon. Modéré par patrick_g. Licence CC by-sa
33
23
août
2013
Justice

Rares sont ceux qui lisent les conditions générales d'utilisations des sites et produits qu'ils utilisent, et on peut les comprendre quand certaines études montrent qu'il faudrait y passer des mois de notre vie, sans forcément tout comprendre au vue des termes juridiques employés et tournures de phrases parfois alambiquées. Un site avait d'ailleurs vu le jour : Terms of service : Didn't read pour tenter de donner un aperçu synthétique de ces conditions d'utilisation.

Les licences logicielles, même Libres et/ou Open Source, n'échappent souvent pas à la règle. Quelles sont les implications en tant qu'utilisateur au quotidien de ces licences ? En effet, il faut désormais être juriste pour commencer à comprendre le sens de chaque mot. Cela est pourtant important dans le libre, les licences étant un accord préalable de travail commun sur le code source.

logo

Le site tl;drLegal.com tente tant bien que mal de synthétiser les tenants et aboutissants des principales licences libres et Open Source. Il vous propose trois outils plus ou moins aboutis :

  1. Un moteur de recherche / navigateur de licences
  2. Un comparateur (enfin, c'est son nom)
  3. Un générateur de texte pour utilisation

Journal Mon projet : Feedspot

49
4
août
2013

Bonjour à tous,

Je viens vous parler d'un projet qui est l'aboutissement de plusieurs années de travail, et qui me semble être assez mature pour que je vous le présente.

Feedspot

Ce projet s'appelle Feedspot : il propose un ensemble de services de veille, basés sur l'actualité.
Mon serveur est abonné à des centaines de milliers de flux RSS, et j'ai fabriqué 3 services autour de cette formidable masse de données :

Radar à buzz

Le radar à buzz est (...)

Les journaux LinuxFr.org les mieux notés du mois de mai 2013

7
5
juin
2013
LinuxFr.org

LinuxFr.org propose des dépêches et articles, soumis par tout un chacun, puis revus et corrigés par l'équipe de modération avant publication. C'est la partie la plus visible de LinuxFr.org, ce sont les dépêches qui sont le plus lues et suivies, sur le site, via Atom/RSS, ou bien via partage par messagerie instantanée, par mail, ou encore via médias sociaux.

Ce que l’on sait moins, c’est que LinuxFr.org vous propose également à tous de tenir vos propres articles directement publiables, sans validation a priori des modérateurs. Ceux-ci s'appellent des journaux. Voici un florilège d'un dizaine de ces journaux parmi les mieux notés par les utilisateurs… qui notent. Lumière sur ceux du mois de mai passé.

Journal Seeks est-il mourrant ?

Posté par (page perso) . Licence CC by-sa
26
1
juin
2013

Seeks est un méta-moteur de recherche libre qui tendaient à devenir indépendant et décentralisé, cependant je m'inquiète de plus en plus pour sa santé.

Avertissement : certaines de ces dates et informations sont sorties de ma mémoire, qui n'est pas un modèle de fiabilité.

Le projet Seeks avançait lentement mais sûrement jusqu'à fin 2011, où un ralentissement a commencé à se faire sentir. Le fondateur du projet (Emmanuel Benazera si je ne me trompe pas) a alors décidé de monter (...)

Jeudis du Libre à Mons (Belgique) : Créer un moteur de recherche avec des logiciels libres

Posté par (page perso) . Édité par tuiu pol, Xavier Claude et Nÿco. Modéré par Xavier Claude. Licence CC by-sa
5
7
mai
2012
Communauté

Ce mercredi 16 mai 2012 à 19h se déroulera la neuvième séance montoise des Jeudis du Libre de Belgique.

Attention, du fait du congé légal de l'ascension le jeudi 17 mai, la séance se déroulera la veille !

Le sujet de cette séance : Créer un moteur de recherche avec des logiciels libres
Thématique : Traitement des données
Public : sysadmin, entreprises, étudiants, Analystes-programmeurs

L'animateur conférencier : Robert Viseur est Docteur en Sciences Appliquées, Assistant dans le service d'Économie et de Management de l'Innovation à la Faculté Polytechnique de l'Université de Mons (UMONS) et Ingénieur de recherche Senior au Centre d'Excellence en Technologie de l'Information et de la Communication (CETIC) à Charleroi. Ses domaines d'expertise sont le management de l'Innovation, le logiciel libre et les technologies d'indexation (moteurs de recherche).

Lieu de cette séance : MUNDANEUM, 76 rue de Nimy à 7000 Mons (cf. ce plan sur le site d'Openstreetmap)

La participation sera gratuite et ne nécessitera que votre inscription nominative, de préférence préalable, ou à l'entrée de la séance. Merci d'indiquer votre intention (même incertaine) en vous inscrivant via la page http://jdl-mons-2012-mai.eventbrite.com/

Cette séance sera suivie d'un verre de l'amitié offert par le Mundaneum.

Si vous êtes intéressé(e) par ce cycle mensuel, n’hésitez pas à consulter l'agenda et à vous inscrire sur la liste de diffusion afin de recevoir systématiquement les annonces.

Journal Let's cc, moteur de recherche de contenu sous licence CC

Posté par . Licence CC by-sa
8
20
avr.
2012

Le Graal : http://eng.letscc.net/

Un petit rappel: "Les licences Creative Commons constituent un ensemble de licences régissant les conditions de réutilisation et/ou de distribution d'œuvres (notamment d'œuvres multimédias diffusées sur Internet). Élaborées par Creative Commons, elles ont été publiées le 16 décembre 2002." wikipedia.org

Description:

Let’s CC n'est pas un moteur de recherche au sens traditionnel du terme mais permet plutôt, de se connecter aux services d'organisations externes et de trouver facilement des contenus sous license CC (musiques, textes, images). (...)

Sortie d'Elastic Search en version 0.19

Posté par (page perso) . Édité par baud123 et NeoX. Modéré par Lucas Bonnet. Licence CC by-sa
14
3
mar.
2012
Base de données

Elastic Search est un moteur de recherche full-text, sous licence Apache 2. Plus précisément, c'est une interface Rest (Representational State Transfer) distribuée, utilisant le format JSON, qui permet d'exposer des index Lucene pour construire des moteurs de recherche avec des fonctionnalités avancées comme de la recherche par facette. On peut donc le comparer à Solr, mais avec une approche plus moderne et plus proche du mouvement NoSQL.

Il existe de nombreux clients pour Elastic Search comme la gem Tire dans le monde Ruby ou ElasticSearch.pm pour Perl. Elastic Search est utilisé en production par Mozilla, Stumble Upon , yfrog, Klout, af83, etc.

NdM : LinuxFr.org utilise Elastic Search pour son moteur de recherche interne, dans sa version 0.19 depuis le jour de sa sortie. Merci Lukhas !