tl;drLegal, moteur de recherche pour licences Open Source

Posté par  (site web personnel, Mastodon) . Édité par Nÿco, baud123, Benoît Sibaud et Pierre Jarillon. Modéré par patrick_g. Licence CC By‑SA.
33
23
août
2013
Justice

Rares sont ceux qui lisent les conditions générales d'utilisations des sites et produits qu'ils utilisent, et on peut les comprendre quand certaines études montrent qu'il faudrait y passer des mois de notre vie, sans forcément tout comprendre au vue des termes juridiques employés et tournures de phrases parfois alambiquées. Un site avait d'ailleurs vu le jour : Terms of service : Didn't read pour tenter de donner un aperçu synthétique de ces conditions d'utilisation.

Les licences logicielles, même Libres et/ou Open Source, n'échappent souvent pas à la règle. Quelles sont les implications en tant qu'utilisateur au quotidien de ces licences ? En effet, il faut désormais être juriste pour commencer à comprendre le sens de chaque mot. Cela est pourtant important dans le libre, les licences étant un accord préalable de travail commun sur le code source.

logo

Le site tl;drLegal.com tente tant bien que mal de synthétiser les tenants et aboutissants des principales licences libres et Open Source. Il vous propose trois outils plus ou moins aboutis :

  1. Un moteur de recherche / navigateur de licences
  2. Un comparateur (enfin, c'est son nom)
  3. Un générateur de texte pour utilisation

Journal Mon projet : Feedspot

49
4
août
2013

Bonjour à tous,

Je viens vous parler d'un projet qui est l'aboutissement de plusieurs années de travail, et qui me semble être assez mature pour que je vous le présente.

Feedspot

Ce projet s'appelle Feedspot : il propose un ensemble de services de veille, basés sur l'actualité.
Mon serveur est abonné à des centaines de milliers de flux RSS, et j'ai fabriqué 3 services autour de cette formidable masse de données :

Radar à buzz

Le radar à buzz est (…)

Les journaux LinuxFr.org les mieux notés du mois de mai 2013

7
5
juin
2013
LinuxFr.org

LinuxFr.org propose des dépêches et articles, soumis par tout un chacun, puis revus et corrigés par l'équipe de modération avant publication. C'est la partie la plus visible de LinuxFr.org, ce sont les dépêches qui sont le plus lues et suivies, sur le site, via Atom/RSS, ou bien via partage par messagerie instantanée, par mail, ou encore via médias sociaux.

Ce que l’on sait moins, c’est que LinuxFr.org vous propose également à tous de tenir vos propres articles directement publiables, sans validation a priori des modérateurs. Ceux-ci s'appellent des journaux. Voici un florilège d'un dizaine de ces journaux parmi les mieux notés par les utilisateurs… qui notent. Lumière sur ceux du mois de mai passé.

Journal Seeks est-il mourrant ?

Posté par  (site web personnel, Mastodon) . Licence CC By‑SA.
26
1
juin
2013

Seeks est un méta-moteur de recherche libre qui tendaient à devenir indépendant et décentralisé, cependant je m'inquiète de plus en plus pour sa santé.

Avertissement : certaines de ces dates et informations sont sorties de ma mémoire, qui n'est pas un modèle de fiabilité.

Le projet Seeks avançait lentement mais sûrement jusqu'à fin 2011, où un ralentissement a commencé à se faire sentir. Le fondateur du projet (Emmanuel Benazera si je ne me trompe pas) a alors décidé de monter (…)

Jeudis du Libre à Mons (Belgique) : Créer un moteur de recherche avec des logiciels libres

Posté par  (site web personnel) . Édité par tuiu pol, Nÿco et claudex. Modéré par claudex. Licence CC By‑SA.
5
7
mai
2012
Communauté

Ce mercredi 16 mai 2012 à 19h se déroulera la neuvième séance montoise des Jeudis du Libre de Belgique.

Attention, du fait du congé légal de l'ascension le jeudi 17 mai, la séance se déroulera la veille !

Le sujet de cette séance : Créer un moteur de recherche avec des logiciels libres
Thématique : Traitement des données
Public : sysadmin, entreprises, étudiants, Analystes-programmeurs

L'animateur conférencier : Robert Viseur est Docteur en Sciences Appliquées, Assistant dans le service d'Économie et de Management de l'Innovation à la Faculté Polytechnique de l'Université de Mons (UMONS) et Ingénieur de recherche Senior au Centre d'Excellence en Technologie de l'Information et de la Communication (CETIC) à Charleroi. Ses domaines d'expertise sont le management de l'Innovation, le logiciel libre et les technologies d'indexation (moteurs de recherche).

Lieu de cette séance : MUNDANEUM, 76 rue de Nimy à 7000 Mons (cf. ce plan sur le site d'Openstreetmap)

La participation sera gratuite et ne nécessitera que votre inscription nominative, de préférence préalable, ou à l'entrée de la séance. Merci d'indiquer votre intention (même incertaine) en vous inscrivant via la page http://jdl-mons-2012-mai.eventbrite.com/

Cette séance sera suivie d'un verre de l'amitié offert par le Mundaneum.

Si vous êtes intéressé(e) par ce cycle mensuel, n’hésitez pas à consulter l'agenda et à vous inscrire sur la liste de diffusion afin de recevoir systématiquement les annonces.

Journal Let's cc, moteur de recherche de contenu sous licence CC

Posté par  . Licence CC By‑SA.
8
20
avr.
2012

Le Graal : http://eng.letscc.net/

Un petit rappel: "Les licences Creative Commons constituent un ensemble de licences régissant les conditions de réutilisation et/ou de distribution d'œuvres (notamment d'œuvres multimédias diffusées sur Internet). Élaborées par Creative Commons, elles ont été publiées le 16 décembre 2002." wikipedia.org

Description:

Let’s CC n'est pas un moteur de recherche au sens traditionnel du terme mais permet plutôt, de se connecter aux services d'organisations externes et de trouver facilement des contenus sous license CC (musiques, textes, images). (…)

Sortie d'Elastic Search en version 0.19

Posté par  (site web personnel) . Édité par baud123 et NeoX. Modéré par Lucas Bonnet. Licence CC By‑SA.
14
3
mar.
2012
Base de données

Elastic Search est un moteur de recherche full-text, sous licence Apache 2. Plus précisément, c'est une interface Rest (Representational State Transfer) distribuée, utilisant le format JSON, qui permet d'exposer des index Lucene pour construire des moteurs de recherche avec des fonctionnalités avancées comme de la recherche par facette. On peut donc le comparer à Solr, mais avec une approche plus moderne et plus proche du mouvement NoSQL.

Il existe de nombreux clients pour Elastic Search comme la gem Tire dans le monde Ruby ou ElasticSearch.pm pour Perl. Elastic Search est utilisé en production par Mozilla, Stumble Upon , yfrog, Klout, af83, etc.

NdM : LinuxFr.org utilise Elastic Search pour son moteur de recherche interne, dans sa version 0.19 depuis le jour de sa sortie. Merci Lukhas !

Nouveau moteur de recherche interne à LinuxFr.org

Posté par  (site web personnel) . Édité par Florent Zara, Nÿco, tuiu pol, Lucas Bonnet et Benoît Sibaud. Modéré par Lucas Bonnet. Licence CC By‑SA.
65
1
fév.
2012
LinuxFr.org

Jusqu'à présent, la recherche de contenus sur LinuxFr.org se faisait avec Google. Ce n'est plus le cas : nous avons maintenant notre propre moteur de recherche \o/. C'est une fonctionnalité qui était très demandée. Pour les utilisateurs pressés de l'utiliser, le champ de recherche est en haut à droite avec la feuille de style par défaut (« Entrer un mot-clé »). Il permet de rechercher sur tous les contenus de LinuxFr.org : dépêches, journaux, forums, sondages, pages de wiki et entrées de suivi.

D'un point de vue technique, ce moteur de recherche utilise Elastic Search et la gem Ruby Tire. Elastic Search est une interface REST (Representational_State_Transfer), sous licence Apache2, construit au dessus de Lucene. Il permet donc de profiter de la puissance des index Lucene, et notamment des facettes, en HTTP et JSON. Tire, de son coté, est une petite bibliothèque Ruby qui simplifie les requêtes d'indexation et de recherche à destination d'Elastic Search. Un autre avantage est qu'il est possible de profiter des opérateurs de recherche avancée de Lucene. Par exemple, "Elastic Search"^3 OR Google permet de faire une recherche sur la chaîne Elastic Search ou sur Google, mais en favorisant Elastic Search. Ce moteur est bien sûr perfectible (N'est pas Google qui veut !). Une première entrée a déjà été ouverte dans le système de suivi de LinuxFr.org. N'hésitez pas à y ajouter vos remarques de manière constructive.

Auparavant, comme mentionné plus haut, le champs de recherche renvoyait vers Google search. Pour la transparence, cela leur permettait de placer de la publicité et pour LinuxFr.org cela générait quelques petits revenus, en décroissance régulière cependant (moins de 100 $ par an désormais). Donc nous perdons une petite source d'argent (l'autre étant les dons ponctuels), mais nous gagnons désormais encore plus en indépendance.

Plus que de l'argent, ce dont LinuxFr.org a vraiment besoin pour vivre, c'est du contenu. Nous avons de sympathiques mécènes pour l'hébergement ou la motivation. Le meilleur moyen de nous aider est donc de contribuer. Merci à tous.

Journal Sonka, une librarie pour construire les interfaces graphiques de Seeks

Posté par  (site web personnel) . Licence CC By‑SA.
Étiquettes :
14
4
août
2011

Bonjour à tous, un petit journal pour exposer Sonka, un gros travail de Fab, contributeur du projet Seeks. Pour rappel, Seeks propose un méta-moteur de recherche collaboratif décentralisé.

Sonka est une librairie javascript basée sur JQuery et qui permet de construire des interfaces de recherche au-dessus d'un noeud Seeks en place, même distant. Sonka vient de sortir en version 4.0, http://www.kafe-in.net/index.html%3Fn=Blog.Sonka-400.html

Le nouveau moteur de Sonka est événementiel et modulaire, permettant même à chacun des utilisateurs de définir (…)

Journal Google dé-dé-référence la presse belge francophone

Posté par  .
19
18
juil.
2011

Trois petits jours et puis s'en vont.

Il n'aura pas fallu bien longtemps pour que Copiepresse rentre dans le rang (sans réellement le dire) et demande se réintroduction volontaire dans la matrice.

La baisse de l'audience si précieuse en terme de retombée publicitaire commençait à démanger quelques périodiques.

Selon rlt.be "La Dernière Heure / Les Sports perd 15% de son audience. Sudpresse de son côté, lâche 17% de ses internautes quant au Soir, ils sont 19% à se perdre dans (…)

Journal Google dé-référence la presse belge francophone

Posté par  .
8
16
juil.
2011

Les éditeurs de la presse belge francophone ont gagné leur procès face à Google pour que ce dernier arrête de reprendre les articles de presse et les photos dans Google News.

Google fait alors du zèle et retire toute la presse francophone belge de son moteur de recherche.

Juste de retour de bâton ou abus de position dominante ?

Journal Moteur de recherche orange

Posté par  .
8
4
juil.
2011

Dans un élan de nostalgie, je suis allé faire un tour sur voila.fr

Mon attention s'est portée sur le moteur de recherche. En effet, c'est un moteur de recherche maison, et non pas une interface à grand moteur de recherche, comme le fait par exemple free avec google.

Sur l'assistance, qui liste les moteurs plébiscités par les internautes : http://assistance.orange.fr/les-moteurs-de-recherche-7.php On apprends que le moteur est disponible sur :

Après quelques recherches, il semblerait que ce soit (…)

Journal Google : Panda, nouvel algorithme d’indexation

Posté par  . Licence CC By‑SA.
Étiquettes :
16
22
avr.
2011

Google a mis en place un nouvel algorithme d’indexation des pages web : Panda. Pour l'instant uniquement sur google US et UK.

Il permet d'en finir avec las fermes de contenus qui pollue google.

Panda permettra, quand il sera mis en place en France, de mettre enfin un terme à "comment ça marche", "info du net" ou dix pages de comparateur de prix quand on cherche des informations sur un produit.

http://www.pcinpact.com/actu/news/63227-google-panda-indexation-fermes-penalites-referencement.htm

DuckDuckGo

Posté par  . Modéré par Bruno Michel. Licence CC By‑SA.
47
8
avr.
2011
Internet

DuckDuckGo est un moteur de recherche.

Créé par Gabriel Weinberg en février 2008, il utilise les résultats d'autres sites web (Crowdsourcing) comme Wikipedia. Son objectif est de permettre un accès rapide, pertinent et confidentiel à ces données brutes.

DuckDuckGo se différencie d'autres moteurs de recherche par une réelle confidentialité (versions SSL, non-JS, avec un service Tor caché, possibilité de remplacer le stockage des préférences personnelles par des urls personnalisées au lieu de cookies…).

Il vise aussi à donner une expérience de recherche plus rapide. Sur ce point, il permet d'obtenir des "réponses instantanées", c'est-à-dire des informations sans avoir besoin de cliquer sur l'un des résultats d'une recherche (un ou deux exemples). De plus, la syntaxe !bang permet d'effectuer des recherches sur des sites via DuckDuckGo. Ainsi, au lieu de taper "amazon" dans un moteur de recherche puis le titre du livre que vous voulez acheter sur le site d'amazon, vous pouvez taper directement, dans DuckDuckGo, "!a titre" ("!a" indique que "titre" sera cherché directement sur amazon.fr).

Le modèle économique de DuckDuckGo repose sur une publicité minimale et désactivable et sur les ventes effectuées à partir d'une recherche avec DuckDuckGo sur des site comme Amazon ou eBay. Il est possible de sélectionner le français pour la recherche mais pas encore pour l'interface.

Enfin, pour ne rien gâcher, DuckDuckGo consacre une partie de ses revenus à financer des projets libres.

Journal je découvre yacy, moteur de recherche p2p

Posté par  . Licence CC By‑SA.
31
2
mar.
2011

Journal,

J'ai un problème : google est très gentil, mais ça m'embête fortement qu'un seul acteur contrôle autant la recherche sur internet. Je suis parano : que faire si mon pays demande à google de censurer les résultats ou s'il modifie sciemment certains résultats ? Dans ma quête de liberté, je suis tombé sur le moteur de recherche yacy.

L'idée est séduisante : un moteur de recherche décentralisé, résistant à la censure et qui ne stocke pas les données des (…)