Forum général.test Nouveau moteur de recherche Privado.com

Posté par (page perso) . Licence CC by-sa.
0
7
avr.
2020

Bonjour,

j'ai reçu récemment un courriel de promotion pour un nouveau moteur de recherche axé respect de la vie privée (pas de pistage, pas de profilage, de la publicité non ciblée…) :
https://www.privado.com/

Ca a l'air intéressant, l'interface est disponible en français. Mais j'ai trouvé très peu d'informations indépendantes sur ce moteur. Entre autres :
https://telecharger.leparisien.fr/privado-private-search-35718

Et la page du greffon pour Chrome :
https://chrome.google.com/webstore/detail/privado-private-search/afmipnjggiffoofjeinjbaaieaoikipk

Il est basé aux USA, dans l'Etat de Washington entre Seattle et Redmond : https://www.privado.com/about/contact

(...)

Journal Que penser du navigateur internet Brave ? (Et pourquoi je privilégie Firefox…)

45
29
déc.
2019

Préambule : cet article a été rédigé dans le cadre de notre GULL naissant (lien AdL), et s’adresse à un public nettement moins expert que ne le sont les utilisateurs de LinuxFr. Je le publie ici afin d’obtenir vos retours, précisions, complétions et critiques constructives, et pour que l’on puisse en discuter. Mon idée étant de progresser moi aussi et d’ajuster si nécessaire l’article ou d’y adjoindre une réponse complémentaire.
Il a été publié, dans une version quasi
(...)

Meta‑Press.es : un méta‑moteur de recherche pour la presse dans votre navigateur

37
1
nov.
2019
Mozilla

Mozilla vient de valider l’ajout de l’extension Meta‑Press.es à son catalogue. C’est l’aboutissement de plusieurs années d’efforts et c’est une étape importante pour ce projet de méta‑moteur de recherche, conçu d’abord pour les journalistes et les revues de presse des associations.
logo de Meta‑Press

Meta‑Press.es est techniquement simple, il permet d’interroger suffisamment de journaux pour découvrir plusieurs millions de résultats en quelques secondes, tout en rapatriant les dix derniers de chaque journal dans le navigateur de l’utilisateur.

De là, les résultats peuvent être triés, explorés, filtrés, sélectionnés et exportés. Une sélection de résultats peut être réimportée plus tard dans le navigateur ou bien dans le navigateur d’un autre utilisateur. Elle peut encore servir à alimenter le flux RSS de la revue de presse d’une association.

Sortie de Datafari 4.3, moteur de recherche open source pour entreprise

Posté par . Édité par Ysabeau, Nÿco, ZeroHeure, Davy Defaud, Xavier Claude et Pierre Jarillon. Modéré par ZeroHeure. Licence CC by-sa.
15
9
juil.
2019
Technologie

Nous avions déjà fait une dépêche pour présenter Datafari à l’occasion de la sortie de la version 4.1 (et nous avions oublié d’annoncer la 4.2…), nous sommes ravis de communiquer sur la sortie de la 4.3.

Datafari est une solution de recherche pour entreprise. Cela signifie qu’elle permet aux employés de retrouver les données où qu’elles soient, quelles qu’elles soient. Plus concrètement, il s’agit de récupérer et d’indexer les données et documents depuis de nombreuses sources différentes et plusieurs formats de fichiers, et de permettre de chercher aussi bien l’intérieur des documents que leurs métadonnées.

DATAFARI 4.1, moteur de recherche open source pour entreprise

Posté par Cedric ULMER . Édité par ZeroHeure, palm123, Davy Defaud, Ontologia et Pierre Jarillon. Modéré par ZeroHeure. Licence CC by-sa.
24
14
sept.
2018
Technologie

Datafari est une solution de recherche pour entreprise. Elle permet aux employés de retrouver les données où qu’elles soient, quelles qu’elles soient, en sécurité. Plus concrètement, Datafari récupère et indexe les données et documents depuis de nombreuses sources différentes et plusieurs formats de fichiers, et permet de chercher aussi bien à l’intérieur des documents que dans leurs métadonnées.

Datafari est disponible en version open source, appelée Datafari Community Edition, et en version propriétaire, appelée Datafari Enterprise Edition. Mais comme nous sommes ici sur LinuxFr.org, nous allons nous concentrer sur la version libre ! Celle‐ci est en licence Apache v2 pour limiter les contraintes de réutilisations (même si ça se peut se débattre).

Forum général.général Avancement du moteur de recherche de linuxfr

Posté par . Licence CC by-sa.
7
6
août
2018

Cher·e forum·e,

je t'ecrite pour solliciter une revue de code (ca serait bien gentil <3).

C'est ici, c'est ecrit en Scala vanilla: framagit.org/j_m/linuxfr-reader

Pour rappel le parser se decompose en trois executables independants. Oui, c'est enorme. C'est pire que des micro services. L'avantage c'est que c'est decoupe en petits morceaux et certaines parties sont remplacables.

A la fin ca devrait ressembler a ca:

$ linuxfr-reader | document-parser | es-writer

Voire a ca:

$ cat journaux.archives.json | document-parser | postgres-writer

Merci

Journal Crowd sourcing pour le nouveau data pipeline de linuxfr

Posté par . Licence CC by-sa.
8
22
juil.
2018

Bonjour'nal

L'outil de recherche integre a linuxfr est decevant. La population linuxfr gronde, en temoigne ce journal: computingfroggy/journaux/recherche-sur-dlfp. Les reproches sont nombreuses: impossible de retrouver un article lu recemment. Une recherche sur 0ad. renvoie un article de 2009 comme premier resultat, une recherche par les tags omet des articles recents aleatoirement. Et il y a plein d'autres problemes.

Certains utilisateurs desesperes se tournent meme vers "le grand mechant" (ref).

Considerant tout ceci, je propose de crowdsourcer un (...)

Journal Recherche sur DLFP

28
19
juil.
2018

Salut Nal,

Aujourd'hui, j'ai essayé de faire une recherche à propos d'un article relativement récent sur un outil de capture d'écran (qui permet d'effectuer des modifications de la capture directement) … sans succès.

Et ce n'est pas la première fois ! La recherche sur ce site (avec Duck Duck go) ramène les contenus par rapport à la pertinence des mots clefs quand la plupart du temps (pour ma part, en tout cas), il serait intéressant de trier le contenu trouvé (...)

Scrutari, moteur de recherche pour sites gentils

Posté par . Édité par ZeroHeure, patrick_g et Davy Defaud. Modéré par patrick_g. Licence CC by-sa.
29
26
jan.
2018
Internet

Scrutari est un moteur de recherche destiné à effectuer des recherches sur un nombre précis de sites (les sites « abonnés »). Sa particularité est de baser sa recherche sur les méta‐données transmises par les sites abonnés et non sur les documents des sites eux‐mêmes (pages HTML, fichier PDF, etc.), contrairement aux moteurs de recherche classiques.
logo Scrutari

Le projet s’est développé d’abord autour de besoins pratiques, initialement autour de la fondation Charles‐Léopold Mayer. En 2008, il a été relancé par la Coredem, dont le but est de rassembler des sites ressource autour des questions de développement, notamment international, qui ont décidé de partager leurs ressources documentaires et d’en faciliter l’accès à partir d’un même espace virtuel et via le moteur de recherche commun Scrutari.

Plus d’informations dans la suite de la dépêche.

Journal De la difficulté de trouver un moteur de recherche pertinent pour un site institutionnel du libre

32
11
jan.
2018

Avant de me lancer dans ce journal, j'ai commencé par effectuer une petite recherche "moteur de recherche" sur linuxfr. Il y a quelques pages de résultats. Je ne les ai pas tous consultés mais dans les premiers beaucoup sont vraiment vieux.

Et je suis même tombé sur cet article de 2012 indiquant que le moteur de recherche du site sera désormais interne et basé sur Elasticsearch, une initiative qui semble avoir fait long feu puisqu'aujourd'hui c'est duckduckgo (...)