Journal Crowd sourcing pour le nouveau data pipeline de linuxfr

Posté par  . Licence CC By‑SA.
8
22
juil.
2018

Bonjour'nal

L'outil de recherche integre a linuxfr est decevant. La population linuxfr gronde, en temoigne ce journal: computingfroggy/journaux/recherche-sur-dlfp. Les reproches sont nombreuses: impossible de retrouver un article lu recemment. Une recherche sur 0ad. renvoie un article de 2009 comme premier resultat, une recherche par les tags omet des articles recents aleatoirement. Et il y a plein d'autres problemes.

Certains utilisateurs desesperes se tournent meme vers "le grand mechant" (ref).

Considerant tout ceci, je propose de crowdsourcer un (…)

Journal Moteur de recherche orange

Posté par  .
8
4
juil.
2011

Dans un élan de nostalgie, je suis allé faire un tour sur voila.fr

Mon attention s'est portée sur le moteur de recherche. En effet, c'est un moteur de recherche maison, et non pas une interface à grand moteur de recherche, comme le fait par exemple free avec google.

Sur l'assistance, qui liste les moteurs plébiscités par les internautes : http://assistance.orange.fr/les-moteurs-de-recherche-7.php On apprends que le moteur est disponible sur :

Après quelques recherches, il semblerait que ce soit (…)

Journal Google dé-référence la presse belge francophone

Posté par  .
8
16
juil.
2011

Les éditeurs de la presse belge francophone ont gagné leur procès face à Google pour que ce dernier arrête de reprendre les articles de presse et les photos dans Google News.

Google fait alors du zèle et retire toute la presse francophone belge de son moteur de recherche.

Juste de retour de bâton ou abus de position dominante ?

Les journaux LinuxFr.org les mieux notés du mois de mai 2013

7
5
juin
2013
LinuxFr.org

LinuxFr.org propose des dépêches et articles, soumis par tout un chacun, puis revus et corrigés par l'équipe de modération avant publication. C'est la partie la plus visible de LinuxFr.org, ce sont les dépêches qui sont le plus lues et suivies, sur le site, via Atom/RSS, ou bien via partage par messagerie instantanée, par mail, ou encore via médias sociaux.

Ce que l’on sait moins, c’est que LinuxFr.org vous propose également à tous de tenir vos propres articles directement publiables, sans validation a priori des modérateurs. Ceux-ci s'appellent des journaux. Voici un florilège d'un dizaine de ces journaux parmi les mieux notés par les utilisateurs… qui notent. Lumière sur ceux du mois de mai passé.

Forum général.général Avancement du moteur de recherche de linuxfr

Posté par  . Licence CC By‑SA.
7
6
août
2018

Cher·e forum·e,

je t'ecrite pour solliciter une revue de code (ca serait bien gentil <3).

C'est ici, c'est ecrit en Scala vanilla: framagit.org/j_m/linuxfr-reader

Pour rappel le parser se decompose en trois executables independants. Oui, c'est enorme. C'est pire que des micro services. L'avantage c'est que c'est decoupe en petits morceaux et certaines parties sont remplacables.

A la fin ca devrait ressembler a ca:

$ linuxfr-reader | document-parser | es-writer

Voire a ca:

$ cat journaux.archives.json | document-parser | postgres-writer

Merci

Forum Linux.général moteurs e recherche alternatifs : où aller?

Posté par  (Mastodon) . Licence CC By‑SA.
Étiquettes :
5
30
jan.
2022

hello,

à l'heure des moteurs de recherche utilisés pour des recherches "simples" (càd pas de la r/d ou résolution de problemes), type aller sur le site d'une organisation, mon habitude étant de passer par un moteur tierce.;; j'aurais aimé avoir vos avis/retours?

pour ma part :
searx est assez bon, mais en fonction du fournisseur, peut manquer de liens indexés, ou au contraire etre bloqué, comme par ex les résultats images pour google via recherche searx des serveurs disroot, qui (…)

Jeudis du Libre à Mons (Belgique) : Créer un moteur de recherche avec des logiciels libres

Posté par  (site web personnel) . Édité par tuiu pol, Nÿco et claudex. Modéré par claudex. Licence CC By‑SA.
5
7
mai
2012
Communauté

Ce mercredi 16 mai 2012 à 19h se déroulera la neuvième séance montoise des Jeudis du Libre de Belgique.

Attention, du fait du congé légal de l'ascension le jeudi 17 mai, la séance se déroulera la veille !

Le sujet de cette séance : Créer un moteur de recherche avec des logiciels libres
Thématique : Traitement des données
Public : sysadmin, entreprises, étudiants, Analystes-programmeurs

L'animateur conférencier : Robert Viseur est Docteur en Sciences Appliquées, Assistant dans le service d'Économie et de Management de l'Innovation à la Faculté Polytechnique de l'Université de Mons (UMONS) et Ingénieur de recherche Senior au Centre d'Excellence en Technologie de l'Information et de la Communication (CETIC) à Charleroi. Ses domaines d'expertise sont le management de l'Innovation, le logiciel libre et les technologies d'indexation (moteurs de recherche).

Lieu de cette séance : MUNDANEUM, 76 rue de Nimy à 7000 Mons (cf. ce plan sur le site d'Openstreetmap)

La participation sera gratuite et ne nécessitera que votre inscription nominative, de préférence préalable, ou à l'entrée de la séance. Merci d'indiquer votre intention (même incertaine) en vous inscrivant via la page http://jdl-mons-2012-mai.eventbrite.com/

Cette séance sera suivie d'un verre de l'amitié offert par le Mundaneum.

Si vous êtes intéressé(e) par ce cycle mensuel, n’hésitez pas à consulter l'agenda et à vous inscrire sur la liste de diffusion afin de recevoir systématiquement les annonces.