• # Pertinent ?

    Post√©¬†par¬† (Mastodon) . √Čvalu√©¬†√†¬†2.

    Cool (enfin, j'ai pas vérifié les détails niveau licence &co).
    Plus qu'à attendre qu'il s'améliore. En effet, mes quelques rapides premiers tests ont donné des résultats à la pertinence relativement relative.
    Avez-vous testé ? Avec des résultats qui vous sont utiles ?

    Surtout, ne pas tout prendre au sérieux !

    • [^] # Re: Pertinent ?

      Post√©¬†par¬† (site web personnel, Mastodon) . √Čvalu√©¬†√†¬†3.

      Très bof. Par exemple, si je cherche LinuxFr, je n'ai pas le site, pas dans les premières pages en tout cas.

      ¬ę‚ÄĮTak ne veut pas qu ľon pense √† lui, il veut qu ľon pense‚ÄĮ¬Ľ, Terry Pratchett, D√©raill√©.

      • [^] # Re: Pertinent ?

        Post√©¬†par¬† . √Čvalu√©¬†√†¬†2.

        ce qui parait en accord avec le nom choisi pour ce moteur de recherche: un chat noir n'est pas censé avoir du succès.

      • [^] # Re: Pertinent ?

        Post√©¬†par¬† (site web personnel, Mastodon) . √Čvalu√©¬†√†¬†2.

        En cochant tout, le second lien est la page wikipedia (pas mal) et le troisième le blog de Fabien Penso (que je ne connaissais pas)… Je n'ai parcouru que les trois premières pages, et les pages retenus ont tous linuxfr dans le titre ou le nom de leur page ainsi que dans le début de la page.

        ‚ÄúIt is seldom that liberty of any kind is lost all at once.‚ÄĚ ‚Äē David Hume

    • [^] # Re: Pertinent ?

      Post√©¬†par¬† . √Čvalu√©¬†√†¬†4.

      Derrière le lien "Cite" en bas, il y a un papier qui présente le projet, et dit entre autres :

      At the time of writing, Elastic ChatNoir indexes the ClueWeb09, the ClueWeb12, and a 2015 instance of the Common Crawl. Regarding the latter, we plan on updating to the newest version at regular intervals.

      De ce que j'ai compris, les données sont (relativement) petites et anciennes. C'est une preuve de concept, pas un moteur de recherche prêt à être comparé aux géants du web.

  • # √áa semble non libre

    Post√©¬†par¬† (site web personnel) . √Čvalu√©¬†√†¬†-2. Derni√®re modification le 21/06/22 √† 18:36.

    Je n'ai même pas encore trouvé le code source du frontend, mais la page technique cite Elasticsearch.

    Et par définition de libre de la FSF elle même qui exclut d'exclure à la tête de gens qu'on n'aime pas, Elasticsearch est 0% libre. Donc je ne vois pas comment tu peux dire que c'est un moteur de recherche libre.

    Pourquoi parles-tu donc de libre? Ton affirmation nécessite démonstration.

    • [^] # Re: √áa semble non libre

      Post√©¬†par¬† . √Čvalu√©¬†√†¬†3.

      C'est en licence MIT (y'a un lien github en bas vers le code du projet : https://github.com/chatnoir-eu)

      • [^] # Re: √áa semble non libre

        Post√©¬†par¬† (site web personnel) . √Čvalu√©¬†√†¬†0. Derni√®re modification le 21/06/22 √† 20:12.

        Pour la partie front end, OK, noté.
        Reste que le titre est sur le projet entier, et la ça a l'air de coincer.
        Rappelons qu'il suffit d'une ligne de code non libre pour être non libre. Alors un composant entier et obligatoire… ou est-ce que j'ai loupé un truc?
        (Oui oui, Firefox était limite un moment avec un composant optionel non libre…)

        • [^] # Re: √áa semble non libre

          Post√©¬†par¬† (site web personnel) . √Čvalu√©¬†√†¬†6.

          La dépendance à un composant non libre n'en fait pas un logiciel non libre, car ce composant ne fait pas partie du logiciel. C'est un peu comme si tu disais que Notepad++ n'est pas libre car il dépend de Windows. Tu peux aussi faire un plugin libre pour un logiciel non libre, ou inversement, le plugin n'en est pas moins libre.

          Mais peut-être que tu veux dire que ce n'est pas dans l'esprit du logiciel libre? ;)

          Un LUG en Lorraine : https://enunclic-cappel.fr

          • [^] # Re: √áa semble non libre

            Post√©¬†par¬† (site web personnel) . √Čvalu√©¬†√†¬†-2. Derni√®re modification le 22/06/22 √† 09:00.

            Oh mais pour l'esprit j'aurai pu troller mieux, et m'√©tonner de l'usage de "libre" alors que la licence est MIT donc plut√īt open source‚Ķ
            c'est fou comme on peut afficher qu'il y a une diff√©rence "fondamentale" entre libre et open source et parler ensuite de libre pour des projets qui semblent √™tre plus open source si on compare avec la diff√©rence affich√©e. C'est le c√īt√© pratique de ne pas √©crire la diff√©rence au cŇďur de la d√©finition, on peut adapter sa communication suivant les besoins d'affichage qu'on a √† un moment.

            Sinon, effectivement √ßa d√©pend de ce qu'on appelle "moteur de recherche", si le composant est vraiment bien externe et n'est que de la config, mon argumentaire tombe, apr√®s faut voir si mettre une UI diff√©rente √† Windows peut me faire dire que je fournis un OS libre, c'est sans doute dans la d√©finition de "moteur de recherche" que je me suis peut-√™tre trop avanc√©, je comprend que √ßa puisse se d√©battre et que je ne pourrai pas tenir longtemps un argumentaire. Mais en fait je m'attendais plut√īt √† m'amuser √† voir les gens outr√©s de ne pas consid√©rer Elasticsearch comme libre ou dans "l‚Äôesprit du libre", je suis d√©√ßu de ne pas avoir r√©ussi √† provoquer cette r√©action¬†;-).

            PS : le "moinssage" est une mauvaise manip de ma part, je voulais "plusser".

            • [^] # Re: √áa semble non libre

              Post√©¬†par¬† . √Čvalu√©¬†√†¬†4.

              Tout dépend si l'application est compatible avec opensearch.

            • [^] # Re: √áa semble non libre

              Post√©¬†par¬† (site web personnel) . √Čvalu√©¬†√†¬†5.

              c'est fou comme on peut afficher qu'il y a une diff√©rence "fondamentale" entre libre et open source et parler ensuite de libre pour des projets qui semblent √™tre plus open source si on compare avec la diff√©rence affich√©e. C'est le c√īt√© pratique de ne pas √©crire la diff√©rence au cŇďur de la d√©finition, on peut adapter sa communication suivant les besoins d'affichage qu'on a √† un moment.

              Je vois que tu constates que la quête à la cohérence globale ressemble à celle du St-Graal.
              Malheureusement le roi Arthur ne semble pas se présenter encore pour nous la rapporter. :(

    • [^] # Re: √áa semble non libre

      Post√©¬†par¬† (site web personnel) . √Čvalu√©¬†√†¬†8.

      Il existe une implémentation libre d'Elasticsearch: OpenSearch

      Le post ci-dessus est une grosse connerie, ne le lisez pas sérieusement.

  • # Lapin compris

    Post√©¬†par¬† . √Čvalu√©¬†√†¬†6.

    C'est quand même curieux à quel point on peut passer des années de boulot à faire un site et pas une minute à expliquer ce qu'il est censé faire. C'est un projet, une démonstration technique, un site utilisable, une publicité, une farce?

    Le moteur en lui-m√™me est naze, il suffit de taper une seule requ√™te pour s'en rendre compte. Il est probable que la base de donn√©es derri√®re est toute petite (par exemple, pas de lien vers Wikip√©dia; un moteur qui ne ferait que renvoyer vers Wikip√©dia serait d√©ja 100 fois plus pertinent), et il semble que le moteur ne sache pas reconnaitre la langue de la requ√™te‚ÄĒil retourne parfois des r√©sultats en allemand, souvent en anglais, mais sans logique. Z√©ro s√©mantique, √ßa ressemble √† une recherche par mot-cl√©. Par exemple, quand on demande "how many bats", on tombe sur des trucs de baseball. Google ne s'y trompe pas, il devine qu'on veut savoir combien il existe d'esp√®ces de chauve-souris.

    Pire, il ne semble avoir aucune protection en pratique contre le spam. Taper "chat noir moteur" mène en première réponse sur "Träffen swingerdateclub Irc chat El Singles Likemynudephoto sex chat rooms Thebangclub The erotic review Iniian dixk harrcore wide harem efficient adult-cocksuckers".

    En fait, c'est un projet secret pour nous faire aimer Google et nous montrer ce que serait Internet sans les GAFAM?

    Au final, c'est intéressant de voir comment il est difficile de créer un moteur de recherche qui soit aussi rapide, efficace, et fonctionnel que Google. Les "alternatives libres" qui s'y essayent sont en général assez foireuses, et celles qui ne le sont pas sont des aggrégateurs de réponses de différents moteurs (et comme les concurrents pompent tous plus ou moins Google, c'est en fait le résultat de Google).

    • [^] # Re: Lapin compris

      Post√©¬†par¬† (site web personnel) . √Čvalu√©¬†√†¬†5.

      Ce qui est inquiétant, c'est que Google et Bing sont aussi en baisse : je trouve leurs résultats de moins en moins pertinents chaque année.

      Le post ci-dessus est une grosse connerie, ne le lisez pas sérieusement.

      • [^] # Re: Lapin compris

        Post√©¬†par¬† . √Čvalu√©¬†√†¬†6.

        Peut-être les milliards de $ engloutis dans la recherche de méthodes pour biaiser les page rank finissent par porter leurs fruits…

    • [^] # Re: Lapin compris

      Post√©¬†par¬† (site web personnel, Mastodon) . √Čvalu√©¬†√†¬†-1.

      Tu n'as visiblement pas trouvé ce lien en bas de la page :
      https://www.chatnoir.eu/doc/architecture/

      ‚ÄúIt is seldom that liberty of any kind is lost all at once.‚ÄĚ ‚Äē David Hume

      • [^] # Re: Lapin compris

        Post√©¬†par¬† . √Čvalu√©¬†√†¬†3.

        C'est une doc technique incomplète sur l'architecture du moteur, je ne vois pas ce que ça dit sur la finalité du projet… Et si tu vas par là, certains liens en bas de la page mènent à des pages en Allemand, pas très pratique.

        En tout cas, si le but est de démontrer des possibilités techniques, ça fonctionne mal, ça n'a pas l'air mieux qu'un grep sur HTMLtoText… Peut-être que derrière, la base de données est bien construite et que c'est rapide et optimisé, mais un moteur de recherche c'est quand même bien plus qu'un Ctrl+F sur le web.

  • # site web disparu

    Post√©¬†par¬† . √Čvalu√©¬†√†¬†1. Derni√®re modification le 30/06/22 √† 15:48.

    Je me demande pourquoi, quand on recherche des livres libres,
    le site web : https://www.gutenberg.org n'est plus dans les réponses des moteurs de recherche ?

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.