Scrutari, moteur de recherche pour sites gentils

Posté par  . Édité par ZeroHeure, patrick_g et Davy Defaud. Modéré par patrick_g. Licence CC By‑SA.
29
26
jan.
2018
Internet

Scrutari est un moteur de recherche destiné à effectuer des recherches sur un nombre précis de sites (les sites « abonnés »). Sa particularité est de baser sa recherche sur les méta‐données transmises par les sites abonnés et non sur les documents des sites eux‐mêmes (pages HTML, fichier PDF, etc.), contrairement aux moteurs de recherche classiques.
logo Scrutari

Le projet s’est développé d’abord autour de besoins pratiques, initialement autour de la fondation Charles‐Léopold Mayer. En 2008, il a été relancé par la Coredem, dont le but est de rassembler des sites ressource autour des questions de développement, notamment international, qui ont décidé de partager leurs ressources documentaires et d’en faciliter l’accès à partir d’un même espace virtuel et via le moteur de recherche commun Scrutari.

Plus d’informations dans la suite de la dépêche.

Journal Passage à duckduckgo pour mes recherches au lieu de google

Posté par  (site web personnel) . Licence CC By‑SA.
28
21
oct.
2015

Cher 'Nal,

Je suis passé à https://duckduckgo.com/ récemment, même si je l'utilisais déjà sur LinuxFr.org
google m'imposant d'accepter ses conditions d'utilisation que je n'ai pas encore réussi à lire en entier(*), ce qui fait que je refuse et cela m'empêche d'utiliser leur moteur de recherche que j'appréciais bien avec adblock virant les liens sponsorisés.

Bref ddg c'est pas mal

configuration de Firefox pour désactiver les moteurs de recherche inopportuns

C'est trivial et bien expliqué sur la page idoine de sélection (…)

Journal Recherche sur DLFP

28
19
juil.
2018

Salut Nal,

Aujourd'hui, j'ai essayé de faire une recherche à propos d'un article relativement récent sur un outil de capture d'écran (qui permet d'effectuer des modifications de la capture directement) … sans succès.

Et ce n'est pas la première fois ! La recherche sur ce site (avec Duck Duck go) ramène les contenus par rapport à la pertinence des mots clefs quand la plupart du temps (pour ma part, en tout cas), il serait intéressant de trier le contenu trouvé (…)

Journal Seeks est-il mourrant ?

Posté par  (site web personnel, Mastodon) . Licence CC By‑SA.
26
1
juin
2013

Seeks est un méta-moteur de recherche libre qui tendaient à devenir indépendant et décentralisé, cependant je m'inquiète de plus en plus pour sa santé.

Avertissement : certaines de ces dates et informations sont sorties de ma mémoire, qui n'est pas un modèle de fiabilité.

Le projet Seeks avançait lentement mais sûrement jusqu'à fin 2011, où un ralentissement a commencé à se faire sentir. Le fondateur du projet (Emmanuel Benazera si je ne me trompe pas) a alors décidé de monter (…)

Journal DuckDuckGo change de parure

Posté par  (site web personnel) . Licence CC By‑SA.
24
6
mai
2014

DuckDuckGo (DDG), qu'une première dépêche nous présentait il y a quelques années, propose une nouvelle interface, mais pas par défaut.

J'avoue n'avoir aucune idée quant à depuis quand elle est accessible.

Vous pouvez maintenant continuer à utiliser l'interface actuelle, tout en essayant la nouvelle.

Pour ma part, je trouve la nouvelle interface bien plus adaptée au navigateurs dits « mobiles ».

DATAFARI 4.1, moteur de recherche open source pour entreprise

Posté par Cedric ULMER . Édité par ZeroHeure, palm123, Davy Defaud, Ontologia et Pierre Jarillon. Modéré par ZeroHeure. Licence CC By‑SA.
24
14
sept.
2018
Technologie

Datafari est une solution de recherche pour entreprise. Elle permet aux employés de retrouver les données où qu’elles soient, quelles qu’elles soient, en sécurité. Plus concrètement, Datafari récupère et indexe les données et documents depuis de nombreuses sources différentes et plusieurs formats de fichiers, et permet de chercher aussi bien à l’intérieur des documents que dans leurs métadonnées.

Datafari est disponible en version open source, appelée Datafari Community Edition, et en version propriétaire, appelée Datafari Enterprise Edition. Mais comme nous sommes ici sur LinuxFr.org, nous allons nous concentrer sur la version libre ! Celle‐ci est en licence Apache v2 pour limiter les contraintes de réutilisations (même si ça se peut se débattre).

Journal Ras le bol de ces moteurs de merde!

Posté par  . Licence CC By‑SA.
Étiquettes :
23
14
oct.
2020

Formule de politesse: bonjour.

Avertissement: grossièretés et langage ordurier droit devant!

Comme exercice à la con, parce que j'ai le moral dans les chaussettes depuis deux mois et que j'essaie de me le remonter tout seul, je me suis dit que j'allais écrire un interpréteur de fichier vCard 2.1¹ — oui, même s'il en existe tout faits pour moi — en C++ avec la STL, histoire d'améliorer connaissance, pratique et compréhension de cette bibliothèque. Et qui sait, peut-être que je (…)

Journal Kagi: une alternative crédible à Google Search ?

Posté par  . Licence CC By‑SA.
23
10
jan.
2022

Je suis en train de tester Kagi comme alternative à Google (moteur de recherche je précise) et je dois avouer être très agréablement surpris.

C'est un moteur de recherche qui sera payant (10-20$ par mois probablement) et le client sera donc l'utilisateur (même si cela n'exclut pas les dérives potentielles mais ce serait un peu se tirer une balle dans le pied).

Le fonctionnement est très hybride, car il se base entre autres sur les résultats de Google/Bing, son propre (…)

Journal YaCy, David(s) contre Googliath

Posté par  (Mastodon) . Licence CC By‑SA.
20
14
août
2020

Il y a quelque temps, j’ai essayé YaCy. YaCy est un moteur de recherche décentralisé qui peut également servir comme moteur de recherche pour un intranet (et j’imagine qu’il pourrait aussi être utilisé pour un moteur interne à un site internet). Vous pouvez l’utiliser dans un mode P2P, mais vous pouvez l’utiliser en pur solo aussi. Dans ce dernier cas, vous crawler vous-même les vastes étendues de l’internet uniquement pour vous.

Le site officiel se trouve par ici

L’installation

Pour (…)

Sortie de Datafari 5.3, moteur de recherche open source pour entreprise

Posté par  . Édité par Ysabeau 🧶 🧦, Benoît Sibaud et Pierre Jarillon. Modéré par Benoît Sibaud. Licence CC By‑SA.
19
5
oct.
2022
Base de données

Nous sommes heureux de vous annoncer la mise à disposition de Datafari 5.3. Pas mal de changements depuis la version 5.0 sur laquelle nous avions communiqué, on en fait la liste un peu plus bas.

Pour rappel, Datafari est une solution de recherche pour entreprise, sous licence Apache v2. Où que les connaissances se trouvent et sous quelque format que ce soit, elle permet aux employés de retrouver les données utiles. Plus concrètement, il s’agit de récupérer et d’indexer les données et documents depuis de nombreuses sources différentes et plusieurs formats de fichiers, et de permettre de chercher aussi bien l’intérieur des documents que leurs métadonnées. On parle également de fédération des connaissances et des savoirs au sein d’une organisation. Pour cette dépêche, on se concentre sur la version libre et open source (mais il y a aussi d’autres nouveautés sur la version entreprise propriétaire).

Journal Google dé-dé-référence la presse belge francophone

Posté par  .
19
18
juil.
2011

Trois petits jours et puis s'en vont.

Il n'aura pas fallu bien longtemps pour que Copiepresse rentre dans le rang (sans réellement le dire) et demande se réintroduction volontaire dans la matrice.

La baisse de l'audience si précieuse en terme de retombée publicitaire commençait à démanger quelques périodiques.

Selon rlt.be "La Dernière Heure / Les Sports perd 15% de son audience. Sudpresse de son côté, lâche 17% de ses internautes quant au Soir, ils sont 19% à se perdre dans (…)

Journal Défis PeerTube

Posté par  (Mastodon) . Licence CC By‑SA.
18
26
nov.
2020

PeerTube est un projet que j’aime beaucoup. Je suis assez enthousiaste à l’idée de pouvoir nous passer de YouTube même si.

Mais dans la pratique, je dois bien dire que je l’utilise bien peu. En partie à cause de la difficulté de trouver ce que l’on cherche. Sepia Search doit contribuer à résoudre ce problème mais ce soir l’outil me laisse perplexe.

Je recherchais des vidéos de Maxime Lambrecht a.k.a Philoxime, YouTubeur que j’apprécie énormément. J’ai notamment beaucoup aimé (…)

Journal Meta-Press.es v1.7 : recherches programmées et type de sources Agenda

17
11
fév.
2021

Contenu transmis depuis : https://www.meta-press.es/fr/journal/2021/v1.7_scheduled_searches.html

Il aura fallu beaucoup de travail pour ajouter ce simple bouton ⏰ recherche programmée dans l’interface principale. Cela demandait pas mal de travail de conception pour garder les choses simples en apparence, une cargaison de code spécifique aux WebExtensions (différent du code habituel des pages web) et enfin il fallu affronter l’enfer des fuseaux horaire.

Voici un extrait de la documentation (rédigée pour l’occasion) :

Une fois les termes de recherche saisis et la (…)

Meta-Press.es, outil de recherche dans la presse, libre et respectueux de la vie privée

17
5
avr.
2021
Presse

Meta-Press.es, c’est quoi ? C’est un nouveau moteur de recherche, qui vous ouvre les portes de la presse en ligne. Développé depuis 3 ans par Simon Descarpentries (et grâce à un fond européen en 2020), cet outil vous veut du bien. Libre et gratuit, sans publicité, il vise un modèle économique basé sur l’entraide et la contribution (y compris financière) à l’image de l’encyclopédie en ligne Wikipédia.

Concrètement, il s’agit d’une Web Extension à installer dans son navigateur web Firefox. Cette extension ajoute un bouton dans la barre d’icônes et ce bouton permet d’ouvrir un onglet sur le moteur de recherche. Ce dernier ne s’exécute alors que dans votre navigateur et va directement interroger vos sources d’informations sans intermédiaire entre le navigateur et les journaux sélectionnés.

Vos recherches ne passent pas par les serveurs de Meta-Press.es, qui n’enregistrent rien de votre activité. De plus, aucun tracker publicitaire ou de réseau social n’est activé par la récupération des résultats par Meta-Press.es.

Une fois la recherche terminée, vous savez combien de résultats existent et vous avez à disposition les 10 derniers résultats de chaque source, simplement rangés par ordre chronologique.

Avec Meta-Press.es vous avez la possibilité de choisir finement les journaux dans lesquels vous souhaitez chercher : les choisir par langue, pays, thème, critères techniques (HTTPS, temps de réponse…) ; Meta-Press.es vous laisse même piocher à l’unité dans la liste des sources connues ! Liste que les utilisateurs chevronnés peuvent étendre eux-mêmes, pour leur compte ou en reversant leurs contributions dans la liste publique du projet.

Alors, si chercher dans la presse n’était pas votre réflexe jusqu’ici, les développeurs de Meta-Press.es espèrent que cette démarche, efficace et sensée, rentrera davantage dans les habitudes, grâce à un outil rapide, pratique, respectueux de la vie privée et écologique.