Quoi de neuf côté LinuxFr.org

85
4
juin
2015
LinuxFr.org

La dernière dépêche de cette catégorie LinuxFr.org qui ne soit pas une dépêche récurrente type « Les meilleurs journaux du mois » ou « Les prix du mois » ou « Les statistiques de l'année » remonte à mai 2014 pour une mise à jour du serveur. Voici donc, à l'aube de l'été, quelques actualités de type « en coulisses ».

Journal rv/hervé : recherche d’itinéraire vélo minimisant l'énergie en utilisant les données d'OSM

72
25
oct.
2014

Introduction

Il y a quelques temps, plus d'un an déjà, j'ai écrit un journal ici-même présentant un projet sur lequel je passais une partie de mon temps libre. Les choses ayant légèrement évolué depuis, je récidive. Bien que la lecture du précédent journal soit utile, elle n'est pas obligatoire pour comprendre celui-ci, sauf pour des points de détails, j'y ferai référence en temps voulu.

Étant adepte du vélocipède en tant que moyen de transport, et comme tous les amateurs de (…)

Nouveau moteur de recherche interne à LinuxFr.org

Posté par  (site web personnel) . Édité par Florent Zara, Nÿco, tuiu pol, Lucas Bonnet et Benoît Sibaud. Modéré par Lucas Bonnet. Licence CC By‑SA.
65
1
fév.
2012
LinuxFr.org

Jusqu'à présent, la recherche de contenus sur LinuxFr.org se faisait avec Google. Ce n'est plus le cas : nous avons maintenant notre propre moteur de recherche \o/. C'est une fonctionnalité qui était très demandée. Pour les utilisateurs pressés de l'utiliser, le champ de recherche est en haut à droite avec la feuille de style par défaut (« Entrer un mot-clé »). Il permet de rechercher sur tous les contenus de LinuxFr.org : dépêches, journaux, forums, sondages, pages de wiki et entrées de suivi.

D'un point de vue technique, ce moteur de recherche utilise Elastic Search et la gem Ruby Tire. Elastic Search est une interface REST (Representational_State_Transfer), sous licence Apache2, construit au dessus de Lucene. Il permet donc de profiter de la puissance des index Lucene, et notamment des facettes, en HTTP et JSON. Tire, de son coté, est une petite bibliothèque Ruby qui simplifie les requêtes d'indexation et de recherche à destination d'Elastic Search. Un autre avantage est qu'il est possible de profiter des opérateurs de recherche avancée de Lucene. Par exemple, "Elastic Search"^3 OR Google permet de faire une recherche sur la chaîne Elastic Search ou sur Google, mais en favorisant Elastic Search. Ce moteur est bien sûr perfectible (N'est pas Google qui veut !). Une première entrée a déjà été ouverte dans le système de suivi de LinuxFr.org. N'hésitez pas à y ajouter vos remarques de manière constructive.

Auparavant, comme mentionné plus haut, le champs de recherche renvoyait vers Google search. Pour la transparence, cela leur permettait de placer de la publicité et pour LinuxFr.org cela générait quelques petits revenus, en décroissance régulière cependant (moins de 100 $ par an désormais). Donc nous perdons une petite source d'argent (l'autre étant les dons ponctuels), mais nous gagnons désormais encore plus en indépendance.

Plus que de l'argent, ce dont LinuxFr.org a vraiment besoin pour vivre, c'est du contenu. Nous avons de sympathiques mécènes pour l'hébergement ou la motivation. Le meilleur moyen de nous aider est donc de contribuer. Merci à tous.

Se passer de Google, Facebook et autres big brothers 2.0 #1 — Les moteurs de recherche

62
3
juin
2014
Internet

Merci aux participants de cette dépêche collective, c.-à-d. ack, Adrien Dorsaz, alendroi, Anthony Jaguenaud, BAud, baud123, Bruce Le Nain, deor, etbim, fabienwang, Florent Zara, frayd, gUI, HLFH, j, jcr83, jeberger, Jiehong, Laurent Pointecouteau, lenod, M5oul, Mildred, Nicolive, nullard3d, Nÿco, olivierweb, palm123, SidStyler, SKy, tetraf, Thom, titiii, tux-tn, ver2terre, Viish, Vincent Gay, vlamy, Xinfe et Yves Bourguignon

Aujourd'hui, le net est occupé en grande partie par les services de grosses entreprises privées. Ceci pose de nombreux problèmes : logiciels privateurs, centralisation des données, pistage permanent, censure, exploration de données, dépendance à des tiers, etc.

Cette série décrit (et critique) des alternatives soit utilisables en auto-hébergement, soit via des services basés sur des logiciels libres. Dans cette première dépêche, nous allons nous intéresser aux moteurs de recherche. Les commentaires sont là pour préciser des oublis ou corriger les éventuelles erreurs.

watching

Marion Créhange, l’informatique au service des sciences humaines

Posté par  (site web personnel, Mastodon) . Édité par Benoît Sibaud et Naone. Modéré par ted. Licence CC By‑SA.
49
24
avr.
2022
Science

Marion Créhange, née Caen, a « eu la très grande chance […] de vivre la naissance de l’informatique » Elle nous a quitté le 28 mars 2022 à quatre-vingt-quatre ans. Elle était la première personne en France à avoir soutenu une thèse en informatique en 1961. Elle est aussi l’une des toutes premières personnes à avoir enseigné l’informatique d’ailleurs. Elle a effectué toute sa carrière d’enseignante-chercheuse à Nancy. Elle était spécialisée dans les systèmes d’information et pensait que les sciences humaines revêtaient une importance capitale. Cela a marqué toute sa carrière.

Plus qu’une biographie ou une (un peu tardive) nécrologie, cette dépêche est axée sur la place de Marion Créhange dans l’histoire de l’informatique et sur sa vision de cette science qu’elle a contribué à créer et développer.

Journal Mon projet : Feedspot

49
4
août
2013

Bonjour à tous,

Je viens vous parler d'un projet qui est l'aboutissement de plusieurs années de travail, et qui me semble être assez mature pour que je vous le présente.

Feedspot

Ce projet s'appelle Feedspot : il propose un ensemble de services de veille, basés sur l'actualité.
Mon serveur est abonné à des centaines de milliers de flux RSS, et j'ai fabriqué 3 services autour de cette formidable masse de données :

Radar à buzz

Le radar à buzz est (…)

DuckDuckGo

Posté par  . Modéré par Bruno Michel. Licence CC By‑SA.
47
8
avr.
2011
Internet

DuckDuckGo est un moteur de recherche.

Créé par Gabriel Weinberg en février 2008, il utilise les résultats d'autres sites web (Crowdsourcing) comme Wikipedia. Son objectif est de permettre un accès rapide, pertinent et confidentiel à ces données brutes.

DuckDuckGo se différencie d'autres moteurs de recherche par une réelle confidentialité (versions SSL, non-JS, avec un service Tor caché, possibilité de remplacer le stockage des préférences personnelles par des urls personnalisées au lieu de cookies…).

Il vise aussi à donner une expérience de recherche plus rapide. Sur ce point, il permet d'obtenir des "réponses instantanées", c'est-à-dire des informations sans avoir besoin de cliquer sur l'un des résultats d'une recherche (un ou deux exemples). De plus, la syntaxe !bang permet d'effectuer des recherches sur des sites via DuckDuckGo. Ainsi, au lieu de taper "amazon" dans un moteur de recherche puis le titre du livre que vous voulez acheter sur le site d'amazon, vous pouvez taper directement, dans DuckDuckGo, "!a titre" ("!a" indique que "titre" sera cherché directement sur amazon.fr).

Le modèle économique de DuckDuckGo repose sur une publicité minimale et désactivable et sur les ventes effectuées à partir d'une recherche avec DuckDuckGo sur des site comme Amazon ou eBay. Il est possible de sélectionner le français pour la recherche mais pas encore pour l'interface.

Enfin, pour ne rien gâcher, DuckDuckGo consacre une partie de ses revenus à financer des projets libres.

Journal Que penser du navigateur internet Brave ? (Et pourquoi je privilégie Firefox…)

45
29
déc.
2019

Préambule : cet article a été rédigé dans le cadre de notre GULL naissant (lien AdL), et s’adresse à un public nettement moins expert que ne le sont les utilisateurs de LinuxFr. Je le publie ici afin d’obtenir vos retours, précisions, complétions et critiques constructives, et pour que l’on puisse en discuter. Mon idée étant de progresser moi aussi et d’ajuster si nécessaire l’article ou d’y adjoindre une réponse complémentaire.
Il a été publié, dans une version quasi
(…)

Journal Nepomuk est mort, vive baloo

44
25
mar.
2014

Le projet KDE pour la version 4.13 (et donc définitivement pour KDE 5) est en train d'abandonner Nepomuk.

http://community.kde.org/Baloo

Après de nombreuses années à essayer d'optimiser Nepomuk, les devs KDE ont décidé d'abandonner ce dernier en grande partie à cause du format RDF.

D'un point de vu utilisateur, la différence est flagrante, Baloo est rapide et léger. J'ai même activé l'indexation des fichiers tellement je ne vois pas la différence avec et sans (alors qu'avec Nepomuk et je ne parle (…)

Meta‑Press.es : un méta‑moteur de recherche pour la presse dans votre navigateur

38
1
nov.
2019
Mozilla

Mozilla vient de valider l’ajout de l’extension Meta‑Press.es à son catalogue. C’est l’aboutissement de plusieurs années d’efforts et c’est une étape importante pour ce projet de méta‑moteur de recherche, conçu d’abord pour les journalistes et les revues de presse des associations.
logo de Meta‑Press

Meta‑Press.es est techniquement simple, il permet d’interroger suffisamment de journaux pour découvrir plusieurs millions de résultats en quelques secondes, tout en rapatriant les dix derniers de chaque journal dans le navigateur de l’utilisateur.

De là, les résultats peuvent être triés, explorés, filtrés, sélectionnés et exportés. Une sélection de résultats peut être réimportée plus tard dans le navigateur ou bien dans le navigateur d’un autre utilisateur. Elle peut encore servir à alimenter le flux RSS de la revue de presse d’une association.

Journal Osez votre propre moteur de recherche !

Posté par  (site web personnel) . Licence CC By‑SA.
35
15
oct.
2013

Comme vous devriez le savoir, Google et bien d’autres sociétés ne tarissent pas de moyens pour collecter sur vous les moindres détails de votre vie. On peut au moins compter :

  • IP
  • liens de redirection avec ID personnalisée (avec Firefox, faites clic droit -> examiner sur un lien de résultat Google pour voir cette merde)
  • cookie de Google.com mais aussi des services qui partagent leur données avec Google.com (Youtube, GooglePlus ,etc..)
  • Flash variable, javascript et autre technique utilisant les fonctionnalités (…)

tl;drLegal, moteur de recherche pour licences Open Source

Posté par  (site web personnel, Mastodon) . Édité par Nÿco, baud123, Benoît Sibaud et Pierre Jarillon. Modéré par patrick_g. Licence CC By‑SA.
33
23
août
2013
Justice

Rares sont ceux qui lisent les conditions générales d'utilisations des sites et produits qu'ils utilisent, et on peut les comprendre quand certaines études montrent qu'il faudrait y passer des mois de notre vie, sans forcément tout comprendre au vue des termes juridiques employés et tournures de phrases parfois alambiquées. Un site avait d'ailleurs vu le jour : Terms of service : Didn't read pour tenter de donner un aperçu synthétique de ces conditions d'utilisation.

Les licences logicielles, même Libres et/ou Open Source, n'échappent souvent pas à la règle. Quelles sont les implications en tant qu'utilisateur au quotidien de ces licences ? En effet, il faut désormais être juriste pour commencer à comprendre le sens de chaque mot. Cela est pourtant important dans le libre, les licences étant un accord préalable de travail commun sur le code source.

logo

Le site tl;drLegal.com tente tant bien que mal de synthétiser les tenants et aboutissants des principales licences libres et Open Source. Il vous propose trois outils plus ou moins aboutis :

  1. Un moteur de recherche / navigateur de licences
  2. Un comparateur (enfin, c'est son nom)
  3. Un générateur de texte pour utilisation

Journal De la difficulté de trouver un moteur de recherche pertinent pour un site institutionnel du libre

Posté par  . Licence CC By‑SA.
32
11
jan.
2018

Avant de me lancer dans ce journal, j'ai commencé par effectuer une petite recherche "moteur de recherche" sur linuxfr. Il y a quelques pages de résultats. Je ne les ai pas tous consultés mais dans les premiers beaucoup sont vraiment vieux.

Et je suis même tombé sur cet article de 2012 indiquant que le moteur de recherche du site sera désormais interne et basé sur Elasticsearch, une initiative qui semble avoir fait long feu puisqu'aujourd'hui c'est duckduckgo (…)

Journal je découvre yacy, moteur de recherche p2p

Posté par  . Licence CC By‑SA.
31
2
mar.
2011

Journal,

J'ai un problème : google est très gentil, mais ça m'embête fortement qu'un seul acteur contrôle autant la recherche sur internet. Je suis parano : que faire si mon pays demande à google de censurer les résultats ou s'il modifie sciemment certains résultats ? Dans ma quête de liberté, je suis tombé sur le moteur de recherche yacy.

L'idée est séduisante : un moteur de recherche décentralisé, résistant à la censure et qui ne stocke pas les données des (…)

Sortie de Datafari 5.0, moteur de recherche open source pour entreprise

Posté par  . Édité par Nils Ratusznik et Ysabeau 🧶 🧦. Modéré par claudex. Licence CC By‑SA.
30
14
avr.
2021
Base de données

Un peu comme pour la dernière news, nous avons oublié de parler de la version 4.4, mais nous sommes heureux de vous annoncer la mise à disposition de Datafari 5.0

Changement majeur donc, synonyme de mise à jour majeure des composants utilisés.

Pour rappel, Datafari est une solution de recherche pour entreprise. Ça veut dire qu’elle permet aux employés de retrouver les données où qu’elles soient, quelles qu’elles soient. Plus concrètement, il s’agit de récupérer et d’indexer les données et documents depuis de nombreuses sources différentes et plusieurs formats de fichiers, et de permettre de chercher aussi bien l’intérieur des documents que leurs métadonnées. Linuxfr oblige, le focus dans cette dépêche sera sur la version libre (mais on a plein d’autres nouveautés aussi sur la version entreprise propriétaire)

Écran de recherche