Lien Qwant écarte son président, Éric Léandri, après des mois de tourmente - numerama
Meta‑Press.es : un méta‑moteur de recherche pour la presse dans votre navigateur
Mozilla vient de valider l’ajout de l’extension Meta‑Press.es à son catalogue. C’est l’aboutissement de plusieurs années d’efforts et c’est une étape importante pour ce projet de méta‑moteur de recherche, conçu d’abord pour les journalistes et les revues de presse des associations.
Meta‑Press.es est techniquement simple, il permet d’interroger suffisamment de journaux pour découvrir plusieurs millions de résultats en quelques secondes, tout en rapatriant les dix derniers de chaque journal dans le navigateur de l’utilisateur.
De là, les résultats peuvent être triés, explorés, filtrés, sélectionnés et exportés. Une sélection de résultats peut être réimportée plus tard dans le navigateur ou bien dans le navigateur d’un autre utilisateur. Elle peut encore servir à alimenter le flux RSS de la revue de presse d’une association.
Sortie de Datafari 4.3, moteur de recherche open source pour entreprise
Nous avions déjà fait une dépêche pour présenter Datafari à l’occasion de la sortie de la version 4.1 (et nous avions oublié d’annoncer la 4.2…), nous sommes ravis de communiquer sur la sortie de la 4.3.
Datafari est une solution de recherche pour entreprise. Cela signifie qu’elle permet aux employés de retrouver les données où qu’elles soient, quelles qu’elles soient. Plus concrètement, il s’agit de récupérer et d’indexer les données et documents depuis de nombreuses sources différentes et plusieurs formats de fichiers, et de permettre de chercher aussi bien l’intérieur des documents que leurs métadonnées.
Lien Accord Microsoft/Qwant : les explications de Tristan Nitot - Twitter
DATAFARI 4.1, moteur de recherche open source pour entreprise
Datafari est une solution de recherche pour entreprise. Elle permet aux employés de retrouver les données où qu’elles soient, quelles qu’elles soient, en sécurité. Plus concrètement, Datafari récupère et indexe les données et documents depuis de nombreuses sources différentes et plusieurs formats de fichiers, et permet de chercher aussi bien à l’intérieur des documents que dans leurs métadonnées.
Datafari est disponible en version open source, appelée Datafari Community Edition, et en version propriétaire, appelée Datafari Enterprise Edition. Mais comme nous sommes ici sur LinuxFr.org, nous allons nous concentrer sur la version libre ! Celle‐ci est en licence Apache v2 pour limiter les contraintes de réutilisations (même si ça se peut se débattre).
Forum général.général Avancement du moteur de recherche de linuxfr
Cher·e forum·e,
je t'ecrite pour solliciter une revue de code (ca serait bien gentil <3).
C'est ici, c'est ecrit en Scala vanilla: framagit.org/j_m/linuxfr-reader
Pour rappel le parser se decompose en trois executables independants. Oui, c'est enorme. C'est pire que des micro services. L'avantage c'est que c'est decoupe en petits morceaux et certaines parties sont remplacables.
A la fin ca devrait ressembler a ca:
$ linuxfr-reader | document-parser | es-writer
Voire a ca:
$ cat journaux.archives.json | document-parser | postgres-writer
Merci
Journal Crowd sourcing pour le nouveau data pipeline de linuxfr
Bonjour'nal
L'outil de recherche integre a linuxfr est decevant. La population linuxfr gronde, en temoigne ce journal: computingfroggy/journaux/recherche-sur-dlfp. Les reproches sont nombreuses: impossible de retrouver un article lu recemment. Une recherche sur 0ad. renvoie un article de 2009 comme premier resultat, une recherche par les tags omet des articles recents aleatoirement. Et il y a plein d'autres problemes.
Certains utilisateurs desesperes se tournent meme vers "le grand mechant" (ref).
Considerant tout ceci, je propose de crowdsourcer un (…)
Journal Recherche sur DLFP
Salut Nal,
Aujourd'hui, j'ai essayé de faire une recherche à propos d'un article relativement récent sur un outil de capture d'écran (qui permet d'effectuer des modifications de la capture directement) … sans succès.
Et ce n'est pas la première fois ! La recherche sur ce site (avec Duck Duck go) ramène les contenus par rapport à la pertinence des mots clefs quand la plupart du temps (pour ma part, en tout cas), il serait intéressant de trier le contenu trouvé (…)
Scrutari, moteur de recherche pour sites gentils
Scrutari est un moteur de recherche destiné à effectuer des recherches sur un nombre précis de sites (les sites « abonnés »). Sa particularité est de baser sa recherche sur les méta‐données transmises par les sites abonnés et non sur les documents des sites eux‐mêmes (pages HTML, fichier PDF, etc.), contrairement aux moteurs de recherche classiques.
Le projet s’est développé d’abord autour de besoins pratiques, initialement autour de la fondation Charles‐Léopold Mayer. En 2008, il a été relancé par la Coredem, dont le but est de rassembler des sites ressource autour des questions de développement, notamment international, qui ont décidé de partager leurs ressources documentaires et d’en faciliter l’accès à partir d’un même espace virtuel et via le moteur de recherche commun Scrutari.
Plus d’informations dans la suite de la dépêche.
Journal De la difficulté de trouver un moteur de recherche pertinent pour un site institutionnel du libre
Avant de me lancer dans ce journal, j'ai commencé par effectuer une petite recherche "moteur de recherche" sur linuxfr. Il y a quelques pages de résultats. Je ne les ai pas tous consultés mais dans les premiers beaucoup sont vraiment vieux.
Et je suis même tombé sur cet article de 2012 indiquant que le moteur de recherche du site sera désormais interne et basé sur Elasticsearch, une initiative qui semble avoir fait long feu puisqu'aujourd'hui c'est duckduckgo (…)
Forum général.hors-sujets Requête en clair dans url du moteur de recherche ..
Journal DeuSu, un moteur de recherche libre avec son propre index
DeuSu est un moteur de recherche libre, qui utilise son propre index (ce n'est pas un méta-moteur comme searx, qui vient de passer en v0.10), ne stocke pas les adresses IP et n'utilise pas de cookies.
Il clame aussi ne pas mettre de pubs et ne jamais en mettre, mais comme c'est un site géré par une seule personne, et qui cherche à financer son serveur par des dons (300€/mois), on ne peut en être sûr (…)
Forum général.cherche-logiciel Moteur de recherche avec interface web
Bonjour,
j'ai un petit blog en local, je note pas mal de choses, et l'idée c'est de pouvoir récupérer et retrouver des anciennes infos/article assez facilement. Je me suis basé sur un blog en mode texte (qui n'utilise aucune base de donnée), et donc met tout nouveau post dans un répertoire, et à chaque fois dans un fichier.
L'idée serait d'avoir un moteur de recherche qui me faciliterait pour retrouver des articles basé sur le full-text (et de continuer avec (…)
Journal Passage à duckduckgo pour mes recherches au lieu de google
Cher 'Nal,
Je suis passé à https://duckduckgo.com/ récemment, même si je l'utilisais déjà sur LinuxFr.org
google m'imposant d'accepter ses conditions d'utilisation que je n'ai pas encore réussi à lire en entier(*), ce qui fait que je refuse et cela m'empêche d'utiliser leur moteur de recherche que j'appréciais bien avec adblock virant les liens sponsorisés.
Bref ddg c'est pas mal
configuration de Firefox pour désactiver les moteurs de recherche inopportuns
C'est trivial et bien expliqué sur la page idoine de sélection (…)