Journal Google : Panda, nouvel algorithme d’indexation

Posté par  . Licence CC By‑SA.
Étiquettes :
16
22
avr.
2011

Google a mis en place un nouvel algorithme d’indexation des pages web : Panda. Pour l'instant uniquement sur google US et UK.

Il permet d'en finir avec las fermes de contenus qui pollue google.

Panda permettra, quand il sera mis en place en France, de mettre enfin un terme à "comment ça marche", "info du net" ou dix pages de comparateur de prix quand on cherche des informations sur un produit.

http://www.pcinpact.com/actu/news/63227-google-panda-indexation-fermes-penalites-referencement.htm

Sortie de Seeks en version stable 0.2.4

Posté par  (site web personnel) . Modéré par Nÿco.
16
19
août
2010
Internet
Le Projet Seeks développe une architecture et une application libres pour la recherche collaborative sur le Web.

La première étape logicielle du projet est un méta moteur de recherche libre (AGPL), sous forme de serveur mandataire (proxy) ou de serveur HTTP. Seeks est déployable aussi bien en tant que moteur public que sur machine personnelle.

La version 0.2.4 est la seconde importante version livrée de Seeks. Elle comprend plusieurs nouveaux outils pour la recherche en ligne, comme la recherche d'images et l'analyse de similarité des résultats, y compris des images. Aujourd'hui il est possible à chacun de monter son propre nœud ou d'utiliser des nœuds publics.

La prochaine étape sera la livraison pour cet automne/hiver du module pair à pair pour le regroupement automatique des utilisateurs sur la base de la similarité de leurs requêtes. Cela permettra l'inter-connexion des noeuds existants et la collaboration entre utilisateurs à partir des résultats fournis par le méta-moteur. Sur cette base Seeks permettra l'émergence d'un véritable moteur décentralisé, avec un contrôle continu et collaboratif des utilisateurs sur les résultats et leurs données.

Comme le projet grandit, votre aide devient cruciale. Une aide indirecte mais simple aujourd'hui consiste à s'inscrire et voter pour nous sur la plate-forme Drumbeat de Mozilla. Toute participation est un plus, Seeks cherchant à redonner le contrôle aux utilisateurs sur leurs données de recherche et sur les algorithmes des moteurs existants.

Journal DeuSu, un moteur de recherche libre avec son propre index

Posté par  . Licence CC By‑SA.
Étiquettes :
16
9
sept.
2016

DeuSu est un moteur de recherche libre, qui utilise son propre index (ce n'est pas un méta-moteur comme searx, qui vient de passer en v0.10), ne stocke pas les adresses IP et n'utilise pas de cookies.

Il clame aussi ne pas mettre de pubs et ne jamais en mettre, mais comme c'est un site géré par une seule personne, et qui cherche à financer son serveur par des dons (300€/mois), on ne peut en être sûr (…)

Sortie de Datafari 4.3, moteur de recherche open source pour entreprise

Posté par  . Édité par Ysabeau 🧶 🧦, Nÿco, ZeroHeure, Davy Defaud, claudex et Pierre Jarillon. Modéré par ZeroHeure. Licence CC By‑SA.
Étiquettes :
15
9
juil.
2019
Technologie

Nous avions déjà fait une dépêche pour présenter Datafari à l’occasion de la sortie de la version 4.1 (et nous avions oublié d’annoncer la 4.2…), nous sommes ravis de communiquer sur la sortie de la 4.3.

Datafari est une solution de recherche pour entreprise. Cela signifie qu’elle permet aux employés de retrouver les données où qu’elles soient, quelles qu’elles soient. Plus concrètement, il s’agit de récupérer et d’indexer les données et documents depuis de nombreuses sources différentes et plusieurs formats de fichiers, et de permettre de chercher aussi bien l’intérieur des documents que leurs métadonnées.

Sortie d'Elastic Search en version 0.19

Posté par  (site web personnel) . Édité par baud123 et NeoX. Modéré par Lucas Bonnet. Licence CC By‑SA.
14
3
mar.
2012
Base de données

Elastic Search est un moteur de recherche full-text, sous licence Apache 2. Plus précisément, c'est une interface Rest (Representational State Transfer) distribuée, utilisant le format JSON, qui permet d'exposer des index Lucene pour construire des moteurs de recherche avec des fonctionnalités avancées comme de la recherche par facette. On peut donc le comparer à Solr, mais avec une approche plus moderne et plus proche du mouvement NoSQL.

Il existe de nombreux clients pour Elastic Search comme la gem Tire dans le monde Ruby ou ElasticSearch.pm pour Perl. Elastic Search est utilisé en production par Mozilla, Stumble Upon , yfrog, Klout, af83, etc.

NdM : LinuxFr.org utilise Elastic Search pour son moteur de recherche interne, dans sa version 0.19 depuis le jour de sa sortie. Merci Lukhas !

Journal Sonka, une librarie pour construire les interfaces graphiques de Seeks

Posté par  (site web personnel) . Licence CC By‑SA.
Étiquettes :
14
4
août
2011

Bonjour à tous, un petit journal pour exposer Sonka, un gros travail de Fab, contributeur du projet Seeks. Pour rappel, Seeks propose un méta-moteur de recherche collaboratif décentralisé.

Sonka est une librairie javascript basée sur JQuery et qui permet de construire des interfaces de recherche au-dessus d'un noeud Seeks en place, même distant. Sonka vient de sortir en version 4.0, http://www.kafe-in.net/index.html%3Fn=Blog.Sonka-400.html

Le nouveau moteur de Sonka est événementiel et modulaire, permettant même à chacun des utilisateurs de définir (…)

Journal Cliqz, un moteur de recherche libéré ?

Posté par  (site web personnel) . Licence CC By‑SA.
Étiquettes :
13
16
août
2020

Dans les commentaires d'un précédent journal, ZeroHeure partageait la carte des moteurs de recherche. En explorant, je découvre Cliqz, projet qui intégrait entre autres un moteur de recherche indépendant. Malheureusement, on ne peut plus le tester : le COVID a eu raison d'eux…

Concurrencer Bing et Google est une entreprise plus que hasardeuse. Pour suivre au fil des ans les diverses aventures des moteurs de recherche indépendants, ça se heurte toujours aux mêmes soucis : trop de (…)

Solr 1.4 est de sortie

Posté par  . Modéré par tuiu pol.
12
11
nov.
2009
Java
Solr est un moteur de recherche libre, écrit en java, et faisant partie du projet Apache. Après plus d'un an depuis la dernière version stable, Solr 1.4 est finalement disponible depuis hier en téléchargement.

Les améliorations sont nombreuses, tant au niveau de l'optimisation des performances que du point de vue fonctionnel. Au menu de cette version toute fraîche, on trouvera entre autre :
  • Meilleure intégration aux SGBD grâce au gestionnaire d'import de données ;

  • Possibilités d'indexation de documents externes (Word, OOo, PDF, HTML, etc.) grâce au projet Apache Tika ;

  • Clustering dynamique de résultats de recherche avec Carrot2 ;

  • Une tonne d'améliorations, de nouveaux greffons et de corrections de bugs ;

La liste des améliorations est vraiment très importante. Les intéressés auront tout intérêt à consulter le CHANGELOG complet.

Pour rappel, Lucene est une bibliothèque de recherche full-text écrite en Java et gérée par le projet Apache. Solr utilise Lucene pour proposer les fonctionnalités d'un moteur de recherche de qualité professionnelle (recherche à facette, recherches approximatives, requêtes booléennes, etc.).

La communication avec Solr se fait via appels de web-services, et des bibliothèques existent déjà dans la majorité des langages les plus utilisés. Il est ainsi parfaitement possible d'utiliser Solr pour gérer le moteur de recherche d'un site en PHP.

Journal Let's cc, moteur de recherche de contenu sous licence CC

Posté par  . Licence CC By‑SA.
8
20
avr.
2012

Le Graal : http://eng.letscc.net/

Un petit rappel: "Les licences Creative Commons constituent un ensemble de licences régissant les conditions de réutilisation et/ou de distribution d'œuvres (notamment d'œuvres multimédias diffusées sur Internet). Élaborées par Creative Commons, elles ont été publiées le 16 décembre 2002." wikipedia.org

Description:

Let’s CC n'est pas un moteur de recherche au sens traditionnel du terme mais permet plutôt, de se connecter aux services d'organisations externes et de trouver facilement des contenus sous license CC (musiques, textes, images). (…)