Teardrop 1.1 : méta-moteur de recherche

Posté par  . Modéré par Jaimé Ragnagna.
Étiquettes :
0
1
nov.
2006
Internet
Voici la version 1.1 de Teardrop, un méta-moteur de recherche personnalisable. Au programme, l'amélioration de la liste des résultats, qui supporte maintenant les images sous formes de vignettes. On peut de ce fait utiliser Teardrop afin de rechercher des images ou des vidéos.

Il est possible d'exporter les résultats d'une recherche au format CSV, ce qui permet leur importation dans un tableur. On peut dorénavant mettre à jour l'ensemble des moteurs automatiquement. Il est également possible de vérifier la validité des liens de chaque résultat.

Enfin, le support de MacOS X a été ajouté. Les personnes motivées pour créer ou maintenir des moteurs ou contribuer de quelque manière que ce soit sont les bienvenues. Pour rappel, Teardrop vous permet d'interroger simultanément plusieurs moteurs de recherche et d'en extraire autant de résultats que souhaité, sous forme de liste (interface graphique), de page HTML ou directement sur la ligne de commande.

C'est un logiciel libre (GPL) destiné à faciliter les recherches spécifiques pour lesquelles on souhaite obtenir un maximum de ressources. En effet, certaines recherches demandent parfois de consulter plusieurs moteurs différents, par exemple lorsque les informations recherchées sont très précises ou encore lorsque les bases consultées sont peu complètes.

Il offre également la possibilité d'ajouter de nouveaux moteurs de recherche, ceci grâce à son format libre et ouvert.

Aller plus loin

  • # Intérêt ?

    Posté par  . Évalué à -1.

    Quel est aujourd'hui l'intérêt d'un métamoteur ?

    Ce que j'ai constaté, c'est que les résultats de google sont presque toujours de loin les plus pertinents, et que rajouter les résultats d'autres moteurs ne fait que polluer la réponse avec des résultats peu pertinents...

    Je me trompe ?
    • [^] # Re: Intérêt ?

      Posté par  (site web personnel) . Évalué à 2.

      Tu te trompes ;-)

      Les résultats de Google sont de moins en moins pertinents à cause de leurs différents filtres pour empêcher la spamdexing qui pénalisent aussi les sites web classiques.
    • [^] # Re: Intérêt ?

      Posté par  . Évalué à 4.

      L'intérêt pour google est plutôt limité. Mais Teardrop va plus loin en proposant d'autre moteurs moins connus, pour des recherches différentes.

      Les moteurs de recherches de fichiers sont un bon exemple. Chaque moteurs (FTP) n'indexe qu'une petite quantitée de sites. Si on réuni leurs résultats, on arrive à obtenir des résultats plus fournis. Par exemple, si je recherche l'iso d'une vieille distrib, je ne sais pas exactement sur quel moteur me tourner. Google ? Yahoo ? ce n'est pas le but premier de ces moteurs.

      les résultats de google sont presque toujours de loin les plus pertinents

      Oui,presque toujours. Dans le cas général, c'est vrai, mais prenons une recherche pour laquelle google ne va renvoyer que 3 liens. Ce sont les seuls infos disponibles sur tout le web ? J'en doute fort. Avoir plusieurs sources d'informations disponibles est toujours intéressant, même si parfois (souvent ?) ce n'est pas essentiel.
    • [^] # Re: Intérêt ?

      Posté par  . Évalué à 1.

      Je me pose une question proche de celle-ci : dans la mesure où il est possible d'intégrer plein de greffons pour la barre de recherche dans Firefox, que m'apporte Teardrop en plus ?

      Je ne souhaite vraiment pas dénigrer ce logiciel, mais plutôt avoir le retour de ses utilisateurs (ou du concepteur) pour me faire une idée. :-)
      • [^] # Re: Intérêt ?

        Posté par  . Évalué à 5.

        De mon point de vue (de concepteur), Teardrop n'est pas destiné a remplacé les recherche quotidiennes. La barre de recherche de firefox est très pratique pour ça.
        L'objectif est plutôt de permettre d'effectuer des recherches simultanée afin d'obtenir une vue significatives des ressources disponibles sur le web. Il m'arrive parfois d'avoir besoin d'un fichier quelconque. Je peux :
        - Le chercher sur Google & Cie : Même si j'utilise les keywords style intitle et autres, si le fichier est trouvé, il sera surement perdu au milieu de pages n'ayant aucun rapports. Le but de Google est la généralité, pas la recherche précise.
        - Chercher sur les moteurs FTP que je connais. C'est long si je ne trouve pas du premier coup, et je n'ai as envie de tester 15 moteurs différents pour être sur que mon fichier est introuvable.
        - Effectuer avec Teardrop une recherche sur ces même 15 moteurs, mais d'un coup cette fois. Tous les résultats disponibles m'arrivent rapidement, et même si le fichier n'est pas trouvé, je n'ai pas perdu 30 minutes de recherches.

        Pour info, j'utilise Google tous les jours.
      • [^] # La barre de recherche

        Posté par  . Évalué à 3.

        J'ai jamais trop compris l'intéret de cette zone et je l'ai d'ailleur retiré. Pourquoi ? tout simplement à cause des url paramétrable.
        Alors c'est sûr, c'est pas vraiment mis en avant et pas très ergonomique pour le novice qui va peut-être trouver ça compliquer d'aller rechercher dans l'url le &q=recherche pour mettre un &q=%s à la place.
        Mais je pense que ce n'est pas insurmontable et pourraît même être automatisable :
        on fait une recherche par exemple google, on lance l'outil de configuration qui redemande le mot rechercher. Il va analyser l'url et remplacer automatiquement ce mot par %s.
        l'avantage est la flexibilité dans ce cas là car comme dit plus haut il y a des cas particulier.
        Personnellement j'ai :
        gf : google français
        gm : google internationnal
        img : recherche d'images (sur alltheweb, je le trouve mieux fait que google pour ça)
        ub : recherche dans les forum d'ubuntu
        wp : recherche dans wikipedia
        à une époque lointaine où je regardé la télévision : tv me mettait le programme télé à l'heure voulu

        et on peut l'adapter à tout les sites que l'on veut

        Alors une zone en plus pour ça, pourquoi pas, si certain préfère, mais là, deuxième reproche, la configuration : par défaut, je crois que google renvoie sur google internationnal alors que le français moyen va souhaiter les résultats de google - francais.
        Et là, mystère complet pourquoi faut-il aller sur un site aller chercher des moteurs tout fait et que l'on ne peut pas en créer "à la main" de la même manière que pour les url paramétrés ?

        Voilà, ces urls paramétrées sont j'ai l'impression très peu connues alors qu'elles sont extrèment pratiques.

        Pour en revenir au programme dont il est question dans ce journal, le point très intéressant je trouve est l'export des résultats en csv.
        • [^] # Re: La barre de recherche

          Posté par  . Évalué à 2.

          je vois en effet mieux l'intérêt du logiciel dans la recherche de fichiers.

          quant aux URL paramétrables, je viens de les découvrir ici, donc va falloir que je me documente sur la question... ;-)

          je crois que le plus simple sera d'installer et de tester Teardrop, de toute façon ! :-D
          • [^] # Re: La barre de recherche

            Posté par  . Évalué à 4.

            Vu que ça a l'air très peu connu et que j'ai moi-même eu du mal à trouver sur internet
            voici un lien :

            http://www.geckozone.org/mozman/html/annexes-motscles.html

            Sinon, dans les grandes lignes :

            1) On lance une recherche dans un moteur de recherche (pour gagner du temps, vous pouvez cherchez "s")
            2) On enregistre le marque-page
            3) On fait bouton-droit, propriété pour l'éditer
            4) À la place de Adresse on recherche le mot cherché (ici s) et on le remplace par "%s" (sans les guillements)
            un exemple avec google :
            [...]&q=s&btnG[...] devient [...]&q=%s&btnG[...]
            5) Dans le champ Mot-Clef, on met le mot qu'on veut utilisé pour la recherche (par exemple gf

            C'est tout
            maintenant quand on tapes gf tessa martin dans la barre d'url, on lance automatiquement la recherche
            l'avantage étant que l'on peut en créer autant que l'on veut

            PS : de mémoire, c'est tout à fait faisable aussi avec konqueror, qui a en plus l'avantage de pouvoir utilisé plusieurs arguments.
  • # Indépendance et impartialité ?

    Posté par  (site web personnel) . Évalué à 5.

    Un moteur de recherche neutre, objectif, sincère, impartial et indépendant, est-ce que ça existe ? Pas sûr. En tout cas, nous n'avons aucune garantie.
    La solution du meta-moteur est donc une (la seule ?) façon de contourner le problème.
  • # Debian vs Ubuntu...

    Posté par  . Évalué à 4.

    Sans vouloir relancer un énième troll, ce serait pas mal de préçiser que le .deb fourni sur le site fonctionne très bien avec Debian (testé avec Etch)
    • [^] # Re: Debian vs Ubuntu...

      Posté par  . Évalué à 1.

      bonjour

      J'aurai deux questions :

      étant sur PPC ubuntu et macosx ou se trouve le paquet pour macosx, et pour l'ubuntu ppc je compile les sources à la main ?

      merci
      • [^] # Re: Debian vs Ubuntu...

        Posté par  . Évalué à 1.

        Je débute sous MacOS X. Le paquet n'existe simplement pas. Je ne connais pas bien les coutumes de MacOS X, et je ne sais pas trop quoi distribuer. En effet, Teardrop dépend de librairies tierces, qui ne sont pas présentes pas défaut, alors dois-je les fournir dans un package ? Dois-je compiler en static ?

        Pour ubuntu PPC, oui désolé, la compilation à la main s'impose. Mais en ajoutant les paquets dev des libraries indiquées sur mon site, j'imagine que ça ne devrai pas poser trop de problèmes...

        Si tu veux plus d'infos contacte moi.
    • [^] # Re: Debian vs Ubuntu...

      Posté par  . Évalué à 1.

      Merci pour la précision, je n'avait pas testé le paquet sous Debian. J'ai rajouté cette mention sur mon site.
  • # meta moteur

    Posté par  (site web personnel) . Évalué à 1.

    Les meta moteurs sur le net subissent souvent des pressions des moteurs de recherche "classique" ou sont souvent subordonné a ces derniers, par exemple ixquick a ces debuts integrait google, ce qu'il ne fait plus maitnenant ...
    l'avantage de teardrop c'est que ce genre de de chose ne peut pas arriver.
  • # Fonctionnalités

    Posté par  . Évalué à 4.

    Couc !

    Je n'ai pas pris le temps de tester, donc mes idées de fonctionnalités sont peut être déja implémentées. J'aurais voulu savoir si les fonctionnalités suivantes étaient prévues dans la liste des TODO :

    * la possibilité de limiter les résultats aux N premiers résultats de chaque moteur
    * un moyen de sauver la liste des résultats d'une recherche
    * un moyen de sauver les caractéristiques d'une recherche particulière (ie mot clef, et liste des moteurs)
    * la possibilité d'avoir la position des sites sur chaque moteur (pour une recherche donnée)
    * la possibilité de filtrer un resultat de recherche, pour par exemple n'afficher que un site particulier (le sien), et ainsi connaitre sa position pour une recherche donnée sur plusieurs moteurs à la fois, le tout en un seul click si on a moyen de sauver les parametres de cette recherche
    * la possibilité de comparer deux recherches identiques, faites à des moments différents (pour ne voir que les nouveaux site, ceux qui ont disparu, ou connaitre les progressions de chaque)

    Bref, en un mot, j'aurai voulu savoir si il était prévu de doter cet outil qui à l'air bien sympathique de fonctionnalités lui permettant, en plus d'étre un méta moteur, de devenir un outil d'analyse de référencement/positionnement libre.

    J'ai en effet un peu cherché et n'ai malheureusement trouvé aucun outil libre dans ce domaine. Donc si qqn a eu plus de chance que moi, qu'il n'hésite pas à poster un lien vers la perle rare...

    Et si qqn se sent l'envie de se lancer dans un tel projet, tous mes encouragemments de futur utilisateur/testeur l'accompagnent.

    J'y avais à une époque pensée, mais les journées sont bien trop courtes. Pour info, je voulais alors utiliser python comme langage, beautifulsoup comme bibliothéque pour parser "facilement" et de facon robuste les sites des moteurs de recherches (les mots clefs pour ce genre de trucs sont : screen scraping, ou web scraping).

    Pour des exemples de ce que Beautiful Soup sait faire, c'est ici :
    http://www.crummy.com/software/BeautifulSoup/documentation.h(...)

    Enfin bon, voila. Indépendemment du fait qu'un méta moteur ne sert effectivement à rien... pour ceux qui ne veulent utiliser qu'un seul moteur (mais se révelle bien pratique sinon), je pense qu'une évolution naturelle de ce genre d'outil est de permettre l'analyse de référencement.

    Bon surf à vous.

    Luzerne GANHIR
    • [^] # Re: Fonctionnalités

      Posté par  . Évalué à 3.

      Bonjour,

      Teardrop n'est pas encore capable de toutes ces fonctionnalité nativement. Ce la dit il peut y contribuer. Les deux derniers points que tu cite ne sont pour l'instant pas faisable depuis l'interface. Cela dit, si tu te débrouille avec un tableur, tu peux effectuer ta recherche, l'exporter en CSV, et l'ouvrir avec OOO Spreadsheet (ou MS Excel). C'est rudimentaire, mais bon...

      C'est en tout cas une évolution de fonctionnalité qui me plait.

      Merci pour ces conseils

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.