Meta‑Press.es : un méta‑moteur de recherche pour la presse dans votre navigateur

38
1
nov.
2019
Mozilla

Mozilla vient de valider l’ajout de l’extension Meta‑Press.es à son catalogue. C’est l’aboutissement de plusieurs années d’efforts et c’est une étape importante pour ce projet de méta‑moteur de recherche, conçu d’abord pour les journalistes et les revues de presse des associations.
logo de Meta‑Press

Meta‑Press.es est techniquement simple, il permet d’interroger suffisamment de journaux pour découvrir plusieurs millions de résultats en quelques secondes, tout en rapatriant les dix derniers de chaque journal dans le navigateur de l’utilisateur.

De là, les résultats peuvent être triés, explorés, filtrés, sélectionnés et exportés. Une sélection de résultats peut être réimportée plus tard dans le navigateur ou bien dans le navigateur d’un autre utilisateur. Elle peut encore servir à alimenter le flux RSS de la revue de presse d’une association.

Sortie de Datafari 4.3, moteur de recherche open source pour entreprise

Posté par  . Édité par Ysabeau 🧶 🧦, Nÿco, ZeroHeure, Davy Defaud, claudex et Pierre Jarillon. Modéré par ZeroHeure. Licence CC By‑SA.
Étiquettes :
15
9
juil.
2019
Technologie

Nous avions déjà fait une dépêche pour présenter Datafari à l’occasion de la sortie de la version 4.1 (et nous avions oublié d’annoncer la 4.2…), nous sommes ravis de communiquer sur la sortie de la 4.3.

Datafari est une solution de recherche pour entreprise. Cela signifie qu’elle permet aux employés de retrouver les données où qu’elles soient, quelles qu’elles soient. Plus concrètement, il s’agit de récupérer et d’indexer les données et documents depuis de nombreuses sources différentes et plusieurs formats de fichiers, et de permettre de chercher aussi bien l’intérieur des documents que leurs métadonnées.

DATAFARI 4.1, moteur de recherche open source pour entreprise

Posté par Cedric ULMER . Édité par ZeroHeure, palm123, Davy Defaud, Ontologia et Pierre Jarillon. Modéré par ZeroHeure. Licence CC By‑SA.
24
14
sept.
2018
Technologie

Datafari est une solution de recherche pour entreprise. Elle permet aux employés de retrouver les données où qu’elles soient, quelles qu’elles soient, en sécurité. Plus concrètement, Datafari récupère et indexe les données et documents depuis de nombreuses sources différentes et plusieurs formats de fichiers, et permet de chercher aussi bien à l’intérieur des documents que dans leurs métadonnées.

Datafari est disponible en version open source, appelée Datafari Community Edition, et en version propriétaire, appelée Datafari Enterprise Edition. Mais comme nous sommes ici sur LinuxFr.org, nous allons nous concentrer sur la version libre ! Celle‐ci est en licence Apache v2 pour limiter les contraintes de réutilisations (même si ça se peut se débattre).

Forum général.général Avancement du moteur de recherche de linuxfr

Posté par  . Licence CC By‑SA.
7
6
août
2018

Cher·e forum·e,

je t'ecrite pour solliciter une revue de code (ca serait bien gentil <3).

C'est ici, c'est ecrit en Scala vanilla: framagit.org/j_m/linuxfr-reader

Pour rappel le parser se decompose en trois executables independants. Oui, c'est enorme. C'est pire que des micro services. L'avantage c'est que c'est decoupe en petits morceaux et certaines parties sont remplacables.

A la fin ca devrait ressembler a ca:

$ linuxfr-reader | document-parser | es-writer

Voire a ca:

$ cat journaux.archives.json | document-parser | postgres-writer

Merci

Journal Crowd sourcing pour le nouveau data pipeline de linuxfr

Posté par  . Licence CC By‑SA.
8
22
juil.
2018

Bonjour'nal

L'outil de recherche integre a linuxfr est decevant. La population linuxfr gronde, en temoigne ce journal: computingfroggy/journaux/recherche-sur-dlfp. Les reproches sont nombreuses: impossible de retrouver un article lu recemment. Une recherche sur 0ad. renvoie un article de 2009 comme premier resultat, une recherche par les tags omet des articles recents aleatoirement. Et il y a plein d'autres problemes.

Certains utilisateurs desesperes se tournent meme vers "le grand mechant" (ref).

Considerant tout ceci, je propose de crowdsourcer un (…)

Journal Recherche sur DLFP

28
19
juil.
2018

Salut Nal,

Aujourd'hui, j'ai essayé de faire une recherche à propos d'un article relativement récent sur un outil de capture d'écran (qui permet d'effectuer des modifications de la capture directement) … sans succès.

Et ce n'est pas la première fois ! La recherche sur ce site (avec Duck Duck go) ramène les contenus par rapport à la pertinence des mots clefs quand la plupart du temps (pour ma part, en tout cas), il serait intéressant de trier le contenu trouvé (…)

Scrutari, moteur de recherche pour sites gentils

Posté par  . Édité par ZeroHeure, patrick_g et Davy Defaud. Modéré par patrick_g. Licence CC By‑SA.
29
26
jan.
2018
Internet

Scrutari est un moteur de recherche destiné à effectuer des recherches sur un nombre précis de sites (les sites « abonnés »). Sa particularité est de baser sa recherche sur les méta‐données transmises par les sites abonnés et non sur les documents des sites eux‐mêmes (pages HTML, fichier PDF, etc.), contrairement aux moteurs de recherche classiques.
logo Scrutari

Le projet s’est développé d’abord autour de besoins pratiques, initialement autour de la fondation Charles‐Léopold Mayer. En 2008, il a été relancé par la Coredem, dont le but est de rassembler des sites ressource autour des questions de développement, notamment international, qui ont décidé de partager leurs ressources documentaires et d’en faciliter l’accès à partir d’un même espace virtuel et via le moteur de recherche commun Scrutari.

Plus d’informations dans la suite de la dépêche.

Journal De la difficulté de trouver un moteur de recherche pertinent pour un site institutionnel du libre

Posté par  . Licence CC By‑SA.
32
11
jan.
2018

Avant de me lancer dans ce journal, j'ai commencé par effectuer une petite recherche "moteur de recherche" sur linuxfr. Il y a quelques pages de résultats. Je ne les ai pas tous consultés mais dans les premiers beaucoup sont vraiment vieux.

Et je suis même tombé sur cet article de 2012 indiquant que le moteur de recherche du site sera désormais interne et basé sur Elasticsearch, une initiative qui semble avoir fait long feu puisqu'aujourd'hui c'est duckduckgo (…)

Journal DeuSu, un moteur de recherche libre avec son propre index

Posté par  . Licence CC By‑SA.
Étiquettes :
16
9
sept.
2016

DeuSu est un moteur de recherche libre, qui utilise son propre index (ce n'est pas un méta-moteur comme searx, qui vient de passer en v0.10), ne stocke pas les adresses IP et n'utilise pas de cookies.

Il clame aussi ne pas mettre de pubs et ne jamais en mettre, mais comme c'est un site géré par une seule personne, et qui cherche à financer son serveur par des dons (300€/mois), on ne peut en être sûr (…)

Forum général.cherche-logiciel Moteur de recherche avec interface web

Posté par  . Licence CC By‑SA.
3
16
avr.
2016

Bonjour,
j'ai un petit blog en local, je note pas mal de choses, et l'idée c'est de pouvoir récupérer et retrouver des anciennes infos/article assez facilement. Je me suis basé sur un blog en mode texte (qui n'utilise aucune base de donnée), et donc met tout nouveau post dans un répertoire, et à chaque fois dans un fichier.

L'idée serait d'avoir un moteur de recherche qui me faciliterait pour retrouver des articles basé sur le full-text (et de continuer avec (…)

Journal Passage à duckduckgo pour mes recherches au lieu de google

Posté par  (site web personnel) . Licence CC By‑SA.
28
21
oct.
2015

Cher 'Nal,

Je suis passé à https://duckduckgo.com/ récemment, même si je l'utilisais déjà sur LinuxFr.org
google m'imposant d'accepter ses conditions d'utilisation que je n'ai pas encore réussi à lire en entier(*), ce qui fait que je refuse et cela m'empêche d'utiliser leur moteur de recherche que j'appréciais bien avec adblock virant les liens sponsorisés.

Bref ddg c'est pas mal

configuration de Firefox pour désactiver les moteurs de recherche inopportuns

C'est trivial et bien expliqué sur la page idoine de sélection (…)