Internet DuckDuckGo

Posté par . Modéré par Bruno Michel. Licence CC by-sa
48
8
avr.
2011
Internet

DuckDuckGo est un moteur de recherche.

Créé par Gabriel Weinberg en février 2008, il utilise les résultats d'autres sites web (Crowdsourcing) comme Wikipedia. Son objectif est de permettre un accès rapide, pertinent et confidentiel à ces données brutes.

DuckDuckGo se différencie d'autres moteurs de recherche par une réelle confidentialité (versions SSL, non-JS, avec un service Tor caché, possibilité de remplacer le stockage des préférences personnelles par des urls personnalisées au lieu de cookies…).

Il vise aussi à donner une expérience de recherche plus rapide. Sur ce point, il permet d'obtenir des "réponses instantanées", c'est-à-dire des informations sans avoir besoin de cliquer sur l'un des résultats d'une recherche (un ou deux exemples). De plus, la syntaxe !bang permet d'effectuer des recherches sur des sites via DuckDuckGo. Ainsi, au lieu de taper "amazon" dans un moteur de recherche puis le titre du livre que vous voulez acheter sur le site d'amazon, vous pouvez taper directement, dans DuckDuckGo, "!a titre" ("!a" indique que "titre" sera cherché directement sur amazon.fr).

Le modèle économique de DuckDuckGo repose sur une publicité minimale et désactivable et sur les ventes effectuées à partir d'une recherche avec DuckDuckGo sur des site comme Amazon ou eBay. Il est possible de sélectionner le français pour la recherche mais pas encore pour l'interface.

Enfin, pour ne rien gâcher, DuckDuckGo consacre une partie de ses revenus à financer des projets libres.

  • # pan ! pan ! pan !

    Posté par (page perso) . Évalué à  10 .

    \_o< coin

  • # Le couteau suisse du web

    Posté par . Évalué à  9 .

    Ça fait un petit moment que je l'utilise, c'est un pur couteau suisse pour les geeks.

    Déjà pour son système de bangs, d'ailleurs rechercher « !bangs » sur DDG affiche directement la liste, il y a quasiment tout. Mais en plus, il redirige vers les versions HTTPS lorsque c'est possible.

    Depuis que je l'ai découvert, je l'utilise par défaut sous Epiphany, avec une bête recherche dans la barre d'adresse et un bang si besoin.
    Pour ceux que ça intéresse, il suffit de définir la clef GConf /apps/epiphany/general/url_search à https://duckduckgo.com/?q=%s

    Derniers détails :

    Par contre, je ne connaissais pas le service caché Tor, je vais jeter un œil.

    Article Quarante-Deux : Toute personne dépassant un kilomètre de haut doit quitter le Tribunal. -- Le Roi de Cœur

  • # intégration avec les navigateurs

    Posté par . Évalué à  2 .

    J'ai oublié de le préciser dans la dépêche mais il est possible d'intégrer ddg à votre navigateur préféré.

    La liste des navigateurs supportés est impressionnante !

    http://duckduckgo.com/tools.html

    • [^] # Re: intégration avec les navigateurs

      Posté par (page perso) . Évalué à  6 .

      A ce sujet, Midori 0.3.3 intègre "Duck Duck Go" comme moteur de recherche par défaut ... c'est d'ailleurs comme cela que je l'ai connu.

      Ce moteur un peu déroutant (difficile de perdre ses habitudes) au départ est finalement très agréable à utiliser

    • [^] # Re: intégration avec les navigateurs

      Posté par . Évalué à  0 .

      Personnellement je n'utilise plus de module machin pour l'intégration d'un moteurs de recherche dans le navigateur.

      Ma page d'accueil comporte un formulaire avec un seul champ "input" dans lequel je peux lancer une recherche yubnub:

      <form action="http://www.yubnub.org/parser/parse" method="get" name="input_box"><input type="text" name="command" size="55" value=""/> <input type="submit" value="Enter" /> </form>
      

      Cet méthode présente l'avantage de fonctionner de la même façon sur tous les navigateurs, y compris les navigateurs textes.

      Avec yubnub, DuckDuckGo est accessible notamment par le mot clef "ddg" pour la version standard, et "dg" pour la version ssl:

      http://yubnub.org/kernel/ls?args=duckduckgo

      • [^] # Re: intégration avec les navigateurs

        Posté par . Évalué à  1 .

        Ces sites (ddg ou yubnub) sont intéressants, mais je m'y "perd" un peu...
        Qu'elles sont leurs spécificités ou avantages chacuns et par rapport à escaline (qui semblerait plus orienté communauté française mais assez réduite...)
        J'avais découvert ce dernier (cette dernière on penserait à la drogue...) via dflp et avais aimé certaines recherches qui pointaient directement vers certaines pages (par exemple pour un parisien, bus 91 qui donnait le pdf de la ligne 91 - ça ne marche plus) et avoue toujours apprécier sur un écran large le w qui permet un split entre une recherche wikipédia fr & en

        Ensuite c'est bien le choix, mais ça en fait des "environnements" à tester... ça va occuper !

        Et dernière remarque, les réponses rapides de la page d'exemple de ddg, bah à part quelques liens en plus, ils peuvent surtout remercier Wolfram, non ?

  • # je peut l'installer sur mon serveur ?

    Posté par . Évalué à  4 .

    La FAQ me dit que duckduckgo est en partie non-« open source » :-(

    Dommage, allez je retourne sous mon seeks auto-hébergé, qui lui au moins est libre…

    • [^] # Re: je peut l'installer sur mon serveur ?

      Posté par (page perso) . Évalué à  3 .

      <troll> Fais gaffe, tes paquets IP passent par des routeurs non-libres. Sûrement des saletés de CISCO. Tu devrais couper ta connexion internet. Et ton PC a probablement un BIOS non libre non plus. Tu devrais cesser de l'utiliser. </troll>

      • [^] # Re: je peut l'installer sur mon serveur ?

        Posté par . Évalué à  5 .

        Excuse moi de préférer utiliser des logiciels libres, d'autant qu'il y a des concurrents sérieux tout libres, comme seeks (mais d'autres aussi).

        Donc oui si je peux utiliser seeks au lieu de DDG, gnash au lieu de flash-non-free, radeon au lieu de fglrx je le ferais…

      • [^] # Re: je peut l'installer sur mon serveur ?

        Posté par (page perso) . Évalué à  3 .

        Alors ça c'est du troll, sebsauvage, bravo.

        C'est peut-être du second degré, mais allez, je me prends au jeu :

        Tu confonds le but et le moyen. Le but, c'est de décentraliser les services qu'on utilise, afin d'en avoir le contrôle, en tant qu'utilisateur. Le moyen pour y arriver, c'est que ces logiciels soient libres, car on a besoin de liberté vis-à-vis des logiciels qu'on installe sur nos machines.

        Donc le fait que le DuckDuckGo distant qu'on utilise soit libre, effectivement on s'en fout un peu. En revanche, le fait qu'on puisse installer un DuckDuckGo libre sur sa propre machine, ça c'est important.

        Fais gaffe, tes paquets IP passent par des routeurs non-libres. Sûrement des saletés de CISCO. Tu devrais couper ta connexion internet. Et ton PC a probablement un BIOS non libre non plus. Tu devrais cesser de l'utiliser.

        Alors non, le fait que nos paquets IP passent par les routeurs non-libres de CISCO, ça n'est pas gênant, car ce sont des parties du réseau : que celui qui les possède soit libre ou pas on s'en fiche, du moment que ces routeurs font bien leur boulot et servent correctement l'utilisateur.

        En revanche, que nos PC utilisent des BIOS non-libres, ça c'est grave, puisqu'il s'agit de programmes installés et exécutés sur nos machines. C'est pourquoi je ne pense pas être le seul inscrit sur ce site à m'intéresser de près à l'évolution de Coreboot...

        • [^] # Re: je peut l'installer sur mon serveur ?

          Posté par (page perso) . Évalué à  2 .

          Si j’ai bien suivi, utiliser Google Doc c’est bien, vu que (même si c’est pas libre) c’est pas installé sur notre propre machine ?

          Et puis MSN en fait c’est cool du moment qu’on utilise un client libre comme aMSN.

          • [^] # Re: je peut l'installer sur mon serveur ?

            Posté par (page perso) . Évalué à  2 .

            Non, ce que je voulais dire c'est que Google Docs ne nuit pas à notre liberté, d'une part parce qu'on a toujours la possibilité d'utiliser une suite bureautique en local sur son PC, et libre, d'autre part parce que ces suites bureautiques (Google Docs, OpenOffice, LibreOffice...) utilisent des formats ouverts et libres.
            Un utilisateur de Google Docs peut échanger des documents avec un utilisateur de LibreOffice sans nuire à la liberté de ce dernier.
            Mais Google Docs reste du SaaS, il nuit bien sûr à la liberté de celui qui l'utilise directement.

            Par contre, MSN n'offre pas cette possibilité d'alternative. C'est un réseau centralisé reposant sur des formats (protocoles) fermés : je ne peux pas installer un serveur MSN libre chez moi. De plus l'utilisateur de MSN nuit à ma liberté, car si je veux communiquer avec lui, je dois utiliser des formats propriétaires (et on se fiche du fait que ces formats soient reconnus presque correctement par des logiciels libres à la limite de la légalité).

            Si CISCO ne nuisent pas à la liberté de l'utilisateur, c'est parce que, à ma connaissance, ils utilisent des protocoles ouverts et libres, et qu'on peut faire exactement la même chose ailleurs avec des logiciels libres.
            C'est un peu comme quand tu utilises un serveur jabber qui ne t'appartient pas : c'est du SaaS, tu n'as aucun contrôle dessus. Mais si le serveur jabber fait mal son boulot (défaillances, censure, etc...), tu peux monter le tien chez toi.

            • [^] # Re: je peut l'installer sur mon serveur ?

              Posté par . Évalué à  0 .

              Mais Google Docs reste du SaaS, il nuit bien sûr à la liberté de celui qui l'utilise directement

              Ah ?
              En quoi le SaaS nuit intrinsèquement à la liberté de ses clients ?

              BeOS le faisait il y a 15 ans !

              • [^] # Re: je peut l'installer sur mon serveur ?

                Posté par (page perso) . Évalué à  0 .

                De la même façon qu'un logiciel propriétaire. Avec un SaaS, l'utilisateur n'a pas de contrôle sur le logiciel, et perd en partie le contrôle de ses données.

                Enfin, c'est pas (que) moi qui le dit...

                • [^] # Re: je peut l'installer sur mon serveur ?

                  Posté par (page perso) . Évalué à  -2 .

                  dis*

                • [^] # Re: je peut l'installer sur mon serveur ?

                  Posté par (page perso) . Évalué à  -1 .

                  -1s/dit/dis/

                • [^] # Re: je peut l'installer sur mon serveur ?

                  Posté par . Évalué à  4 .

                  J'espère que la FSF va fermer cette abomination de GNU Savannah qui prive de liberté tant de développeurs alors.

                  BeOS le faisait il y a 15 ans !

                  • [^] # Re: je peut l'installer sur mon serveur ?

                    Posté par (page perso) . Évalué à  -1 .

                    T'as pas lu l'article ou tu le fais exprès ?

                    GNU Savannah est un site géré par la FSF, qui s'appuie sur un logiciel nommé Savane. Ce logiciel est libre , cornes de gnou, ça veut dire qu'on peut accéder au source et le modifier pour créer par exemple Gforge/FusionForge.

                    Comme on ne peut pas concevoir la gestion du développement d'un soft sans un minimum de centralisation, les devs de GNU utilisent Savannah pour faire leur boulot. Ainsi le réseau n'est pas acentré, mais il est décentralisé : si les utilisateurs de Savannah ne sont pas d'accord avec la façon dont le SaaS est géré, ils peuvent toujours créer leur propre communauté ailleurs, en l'appelant par exemple Gna!.

                    C'est quand même étonnant que tu utilises GNU Savannah comme exemple pour réfuter mes propos : cette forge a été créée justement comme alternative face aux problèmes de SourceForge, en se basant sur le code de celui-ci.

                    • [^] # Re: je peut l'installer sur mon serveur ?

                      Posté par . Évalué à  4 .

                      Avec un SaaS, l'utilisateur n'a pas de contrôle sur le logiciel, et perd en partie le contrôle de ses données.

                      Savannah est un logiciel de forge fournit comme un service.

                      Si je n'aime pas un comportement de savannah.gnu.org, est-ce que je peux patcher le serveur ?
                      Quel contrôle ai-je sur les données placées chez Savannah que je n'ai pas chez n'importequel autre prestataire SaaS (Google par exemple, qui propose de rapatrier toutes ses données par des moyens standards) ?

                      Mon contre exemple ne visait pas à dénigrer Savannah (au sujet duquel je n'ai aucun reproche à faire) mais plutot à illustrer par l'absurde ton association SaaS = cacapalibre

                      BeOS le faisait il y a 15 ans !

                      • [^] # Re: je peut l'installer sur mon serveur ?

                        Posté par (page perso) . Évalué à  0 .

                        C'est pas libre au sens où c'est centralisé, mais c'est libre au sens où c'est décentralisable.

                        Tout service centralisé sous-entend un contrat entre l'utilisateur et le fournisseur du service. Si tu n'a aucun reproche à faire à GNU Savannah, c'est que tu as confiance en ceux qui ont le véritable contrôle sur le service : tu sais qu'il ne sont pas du genre à altérer tes données, ou à mettre des DRM dans tes travaux, par exemple.

                        L'exemple qui me paraît le plus parlant, c'est celui du serveur Jabber : autrefois j'utilisais le serveur jabber de l'apinc : il était souvent indisponible, il y avait des changements trop fréquents de certificats, j'en ai eu marre, j'ai utilisé le serveur jabber de legtux, qui est moins souvent down. Désormais j'utilise également mon serveur jabber @home, sur lequel j'ai un contrôle total.

                        Pour revenir au sujet de départ, à savoir les moteurs de recherche, j'aime bien par exemple seeks, parce que seeks.fr marche bien et que j'ai la possibilité d'avoir mon seeks @home au cas où je perd confiance en seeks.fr. Par contre, il est regrettable que je n'ai pas cette possibilité avec DuckDuckGo, qui m'attire pourtant beaucoup pour ses qualités techniques.

    • [^] # Re: je peut l'installer sur mon serveur ?

      Posté par (page perso) . Évalué à  7 .

      De mémoire (pas d'éléphant), Gabriel fait tourner DDG sur FreeBSD. Le code est écrit en Perl et n'est pas publié.
      Si il n'a pas changé son architecture récemment, c'est hébergé dans son sous-sol sur une connection FiOS Verizon (20mbps symetrique pour $100 par mois) avec un secours sur Amazon EC2/S3.

      Pour un one-man-project, c'est plutot bien foutu. Mais ne vous leurrez pas, DDG n'est pas plus open source que Google.

      • [^] # Re: je peut l'installer sur mon serveur ?

        Posté par . Évalué à  7 .

        Les logiciels que ddg utilise : http://www.gabrielweinberg.com/blog/2009/03/duck-duck-go-architecture.html

        Le code de ddg (ou une partie ?): https://github.com/duckduckgo

        J'ai posté un message sur le forum de ddg pour savoir quels logiciels utilisés sont propriétaires et pourquoi ceux-ci sont utilisés (pas encore de réponse, je vous tiens au courant).

        En tout cas, le code semble accessible (en totalité ?) et ddg est largement fait avec des logiciels libres. De plus, il donne de l'argent aux FLOSS. Donc à moins d'être extrémiste à la Stallman, ddg est éthique et bon pour le web.

        • [^] # Re: je peut l'installer sur mon serveur ?

          Posté par (page perso) . Évalué à  6 .

          à moins d'être extrémiste à la Stallman

          à moins d'être aussi intègre que RMS.

          Le choix des mots ...

        • [^] # Re: je peut l'installer sur mon serveur ?

          Posté par . Évalué à  4 .

          Voici la réponse du créateur de ddg au sujet de l'open-source :

          A lot of it is still proprietary in the sense it is code written by DDG. There are several reasons why this stuff isn't open source, primarily spam and competitive.

          As for FOSS components, I don't think we're using any non-FOSS software components actually on the server-side. I could be wrong there, but can't think of any off the top of my head :).

          source : http://duck.co/#Topic/28469000000580069

          Donc pour les non-anglicistes, les raisons pour lesquelles ddg n'est pas totalement open-sources sont la pub et la concurrence (je comprend pour la concurrence mais je ne vois pas pour la pub). Sinon, il semble que ddg ne soit réalisé qu'à partir de logiciels libres.

          • [^] # Re: je peut l'installer sur mon serveur ?

            Posté par . Évalué à  5 .

            normal, spam et pub c'est quand même pas tout à fait pareil (ah bon ?)

          • [^] # Re: je peut l'installer sur mon serveur ?

            Posté par (page perso) . Évalué à  2 .

            mais je ne vois pas pour la pub

            Peut-être pour que certains sites ne connaissent pas l'algo de classement pour le fausser à leur avantage.

          • [^] # Re: je peut l'installer sur mon serveur ?

            Posté par . Évalué à  4 .

            Donc en gros on utilise du libre, mais on ne code pas libre, super…

            Un truc que je pige pas : les projets de moteur de recherche libre ont les mêmes problèmes de spam et compétition, pourtant ils font du libre. C'est un peu comme si on disais Openssh c'est pas libre parce que sinon des petits malins pourraient exploiter les failles, le raisonnement me semble foireux.

            • [^] # Re: je peut l'installer sur mon serveur ?

              Posté par . Évalué à  5 .

              Les moteurs de recherche libres? Lesquels, ceux qui se contentent d’agréger les résultats des autres, ou bien ceux qui ne marchent juste pas?

              (après, faut bien commencer quelque-part, je sais... mais ça fait une petite différence entre DDG et les MdR libres)

              • [^] # Re: je peut l'installer sur mon serveur ?

                Posté par . Évalué à  3 .

                C'est compliqué de faire un moteur de recherche libre qui n'utilise pas les autres moteurs à cause des ressources nécéssaires pour indexer le web et le mettre à disposition, mais il en existe un qui demande à chaque utilisateur de faire tourner un bot et weeks le ferras bientôt par indexation volontaire.

                Je suis dans ma tour d'ivoire (rien à foutre des autres, dites moi un truc pour moi), si je ne pose pas explicitement une question pour les 99%, les kévin, les Mm Michu alors c'est que je ne parle pas d'eux.

            • [^] # Re: je peut l'installer sur mon serveur ?

              Posté par (page perso) . Évalué à  2 .

              Serait ce si génant pour Google de libéré son code ?

              Si ils libéraient le code sous AGPL, quelqu'un qui ferait une copie n'aurait aucun intérêt car il lui faudrait des mois pour indexer autant de pages que Google. Et qui irait sur un site qui n'apporte rien de plus et qui est un ersatz de google ?
              Pour le concurrent, si il veut proposer quelque chose de mieux, soit il l'écrit from scratch (et aujourd'hui il peut le faire), soit il se base sur le code libéré de google, et, dans ce cas, google pourrait également implémenter les changements vu que l'AGPL l'oblige à reverser les changements.

              • [^] # Re: je peut l'installer sur mon serveur ?

                Posté par . Évalué à  2 .

                Un code libre ça veux aussi dire qu'en tant qu'utilisateur je pourrais savoir comment les résultats sont triés, je pourrait savoir quelle sont les meilleures choses à faire pour le référencement… Par exemple Linuxfr pourrait avoir son propre moteur de recherche pour le site web plutôt que de passer par google.
                bref il n'y a pas que le concurrent qui pourrait en profiter, mais les utilisateurs, d'autant que la recherche peut influencer très fortement la façon de penser, de développer de nouvelles idées…

          • [^] # Re: je peut l'installer sur mon serveur ?

            Posté par (page perso) . Évalué à  10 .

            Attention, ta traduction est mauvaise, il ne parle pas de « pub » mais de « spam ». Dans le cas du Web on parle d'ailleurs plutôt de « webspam » ou de « spamdexing ».

            Le spamdexing regroupe les techniques utilisées pour tricher avec les algorithmes de classements des moteurs de recherche afin qu'un site Web ce retrouve artificiellement mieux classé qu'il ne le devrait sur certaines requêtes.

            Dans les début des moteurs de recherche, par exemple, la principale méthodes de classement reposait sur une mesure très simple : le TF/IDF. Pour savoir si un document est bon vis-à-vis d'une requête, on regarde pour chaque mot de la requête sa fréquence dans le document par rapport à sa fréquence dans l'ensemble des pages indexées.
            Si le score du TF/IDF est bon, cela veut dire que globalement les mots de la requête apparaissent plus souvent dans ce document que dans un document moyen, il est donc probablement intéressant pour l'utilisateur.

            Rapidement, le gens ont compris comment marchait ce type de moteur et ils ont commencés à remplir leurs pages de mots-clés fréquemment utilisés dans les requêtes qui les intéressait. Et les résultats des moteurs de recherche ont commencé à devenir n'importe quoi.

            Ce fût le début de la guerre entre spammeurs et moteurs de recherche. Les moteurs trouvent de nouvelles manières de classer les pages et de déjouer les techniques des spammeurs, pendant que les spammeurs font l'inverse. C'est le problème de l'épée et du bouclier.

            La grosse amélioration apportée par Google à été la combinaison de deux scores : une mesure de pertinence tout-à-fait classique combinée à une mesure de confiance, le fameux « page-rank ». Le principe est tout simple : en général un site web ne contrôle que les liens qui sortent de chez lui, pas ceux qui pointent vers lui. Si on fait confiance à un site, on doit pouvoir faire confiance au site vers lesquels il pointe et vice-verca.

            On commence donc en donnant un bon score à quelques site de confiance et un mauvais score à des spammeurs et on propage une partie de ce score vers les sites qu'ils pointent. En itérant, le système finit par ce stabiliser avec des scores de confiance pour tout le monde. (je simplifie un peu...)

            Ça a bien marcher pendant un moment jusqu'à ce que les spammeurs comprennent comment contourner le truc : d'abord l'échange de liens puis « les fermes de liens ». C'est-à-dire un ensemble de site Webs comportant un très grands nombre de pages web très fortement connectées (plusieurs millions de pages) qui vont servir d'accumulateurs à page-rank.

            La guerre entre les deux est permanente et contrairement à la cryptographie par exemple, il est à peu près impossible de créer un algo qui soit résistant de manière intrinsèque car on ne contrôle que l'algo pas les données, les spammeurs peuvent donc étudier l'algo et produire des site web spécialement adapté pour cet algo.

            Pour avoir fait ma thèse dans le domaine je connais très bien le problème et je peut te garantir que les spammeurs suivent de très près toute la recherche qui est faite dans le domaine et sont très réactifs. Il n'est pas rare de voir apparaître de nouvelles technique de spams destinées à contrer des techniques anti-spam qui viennent d'être publiées et qui ne sont même pas encore arrivées dans les versions de production des moteurs de recherche.

            Je n'aime pas ça mais ici on est vraiment dans une situation ou les algos doivent rester secrets pour le bien de l'utilisateur, c'est ce qui permet d'avoir des résultats pertinents.

            Pour ce qui est des moteurs de recherche OpenSource, il ne sont tous simplement pas concernés, soient ils n'utilisent que des algos déjà publiés et donc les résultats sont pourris, soient il ne sont utilisés que par trois péquins et sont donc loin d'être une cible pour les spammeurs. Mais tu peut-être sûr que si un moteur de recherche OpenSource ce met à fournir des résultats pertinents et commence à avoir du succès, la qualité des résultats va vite chuter.

            Il y a pour le moment une incompatibilité fondamentale entre OpenSource, pertinence et succès.

            • [^] # Re: je peut l'installer sur mon serveur ?

              Posté par . Évalué à  1 .

              C'est marrant l'opposition spammeur contre moteur de recherche me rappelle vraiment l'opposition cracker contre créateur de logiciel…

              Or il se trouve que niveau sécurité le libre s'en sort très bien, donc je me dit naïvement que ça doit être possible dans le combat contre les spammeurs.

              Peut-être que du contenu trié en partie par les utilisateurs pourrait changer la donne ? On verra bien :-)

              • [^] # Re: je peut l'installer sur mon serveur ?

                Posté par (page perso) . Évalué à  8 .

                Et tu es bien naïf en effet.

                Au niveau sécurité, tu te bats chez toi dans un terrain que tu contrôles, le cadre est définis très clairement, tu as des moyens de tester, tu peux ajuster la surface d'attaque au minimum en fermant tout ce qui n'est pas utile...

                Pour un moteur de recherche la situation est différente ne te bas pas chez toi mais dans le capharnaüm qu'est le Web, où quasiment tous les sites font de l'optimisation pour être correctement classés et où la limite entre optimisation et spamdexing est très floue, et où la satisfaction de l'utilisateur est la seule mesure et elle est difficilement mesurable.

                Dis toi bien qu'il y a beaucoup de monde qui bosse la dessus et qu'il n'y en a pas beaucoup qui croient à la solution miracle. Le contenu trié par les utilisateurs est une piste en grande partie abandonnée depuis longtemps, dès que l'on permet à l'utilisateur de mettre son nez quelque part les spammeurs sont les premiers arrivés. Même sur des trucs plutôt confidentiels, il suffit de regarder la liste des commandes sur yubnub.org, elle est complètement inutilisable car pourrie de spam. C'est la même chose avec les commentaires de beaucoup de blogs, avec pas mal de wiki et autres.

                Dès que tu permet à l'utilisateur de donner son avis, si ça à un intérêt potentiel pour les spammeurs, ils mettent en place une troupe de bot pour biaiser le truc. Pour tous les site ou l'on peut commenter ou donner son avis sur un produit sans l'avoir acheter, la majorité des avis sont du spam.

                Et c'est pas un captchas ou autre qui va les arrêter, tu retrouves derrière des acteurs du porno sur le net qui ont plein de client près les remplir pour accéder à divers sites...

                • [^] # Re: je peut l'installer sur mon serveur ?

                  Posté par . Évalué à  4 .

                  tu retrouves derrière des acteurs du porno sur le net qui ont plein de client près les remplir

                  les clients participent un peu au film si j'ai bien compris ? ;)

                  Only wimps use tape backup: real men just upload their important stuff on megaupload, and let the rest of the world ~~mirror~~ link to it

  • # confidentialité ?

    Posté par . Évalué à  7 .

    une réelle confidentialité (versions SSL, non-JS,

    Et là, je vois pas le rapport. Entre JS et la confidentialité. JS peut être utilisé pour faire du tracking. Ou pas. Et on peut faire du tracking sans JS aussi.

    • [^] # Re: confidentialité ?

      Posté par (page perso) . Évalué à  6 .

      Je crois que l'intérêt est de pouvoir désactiver le javascript (pour éliminer ce vecteur d'attaque) et d'avoir quand même quelque chose d'utilisable.

      « Moi, lorsque je n’ai rien à dire, je veux qu’on le sache. » Raymond Devos

  • # Pertinence des resultats

    Posté par . Évalué à  0 .

    Si l'UI est attirante, je n'utiliserai pas ce moteur de recherches pour la simple et bonne raison que la pertinence des résultats est une catastrophe.

    Les deux premières recherches (sur mon nom, égocentrique que je suis, puis sur « minbif », un logiciel libre dont le site officiel n'est même pas sur la première page de résultats !) que j'ai effectuées m'ont dissuadé.

    • [^] # Re: Pertinence des resultats

      Posté par . Évalué à  3 .

      Pourtant quand je fais une recherche sur minbif, dans l'encadre s'affiche:

      Minbif aims to use the libpurple library from the Pidgin project to provide an IRC-friendly instant messaging client (GPLv2, IRC, Jabber, IM).

      Après c'est vrai qu'il n'y a pas l'adresse du site officiel, juste un lien sur freshmeat. Mais de là dire que

      la pertinence des résultats est une catastrophe.

      c'est légèrement abusé.

      Et sinon, as tu essayé une recherche sur weboob ?

      • [^] # Re: Pertinence des resultats

        Posté par . Évalué à  1 .

        On 08/Apr - 17:39, jiyuu wrote:

        c'est légèrement abusé.

        Cf ma réponse au commentaire ci-dessous.

        Et sinon, as tu essayé une recherche sur weboob ?

        Oui pour weboob les résultats restent correct, c'est pour ça que je ne l'ai pas cité. Cela dit, si les trois premiers sont pertinents, ça dérive vite lorsqu'il se met à ne parler quasiment plus que de « weblogs ».

        Je pense que c'est le principal problème, c'est qu'il va prendre des mots similaires sûrement plus utilisés que celui recherché, mais je ne pense pas que ce soit une bonne solution, puisque ça donne des résultats qui n'ont forcément rien à voir avec ce que la personne recherche. Un message du style de Google « Essayez avec tel mot » serait plus approprié.

    • [^] # Re: Pertinence des resultats

      Posté par . Évalué à  3 .

      le site de minbif c'est bien http://minbif.im/ ? Car c'est le premier résultat de la recherche avec DDG.

      En tout cas les résultats de la recherche me semblent plutôt pertinents.

      Only wimps use tape backup: real men just upload their important stuff on megaupload, and let the rest of the world ~~mirror~~ link to it

      • [^] # Re: Pertinence des resultats

        Posté par . Évalué à  3 .

        Hum, je ne sais pas si comme Google les résultats varient en fonction du visiteur, mais chez moi j'ai :

        • Freshmeat
        • frugalware.org
        • Wikipédia (hors sujet)
        • archlinux
        • gominis.com (hors sujet)
        • mini.com (hors sujet)
        • minix.org (wtf)
        • wlallemand.info
        • minisandfriends (wtf)
        • mini.co.uk (hors sujet)
        • downloadplex
        • heroesofnewerth.com
        • stumbleupen.com
        • countyfloors (hors sujet)
        • minidef.gov.sg (wtf)
        • minix-vmd.org (hors sujet)
        • minidibair (wtf)
        • debian
        • minidef.gov.bn (wtf)
        • minibar.com (hors sujet)
        • minix.hk (hors sujet)
        • ubuntu

        Les 21 premiers résultats de recherche sont quand même incroyables. Pas le site officiel du projet, dès le troisième résultat commencent à sortir des sites qui ne matchent pas exactement le mot et qui n'ont rien à voir, les sites de Debian et Ubuntu très très loin derrière des pages sans aucun intérêt, etc.

        • [^] # Re: Pertinence des resultats

          Posté par . Évalué à  2 .

          hmm, tu n'as pas tort. C'est bizarre parce qu'hier j'avais le site officiel en premier (juste en dessous de la définition donnée par freshmeat), et aujourd'hui le site officiel n'arrive effectivement pas en premier, ni même sur la première page.
          J'ai envoyé un message à propos de cela sur la page de feedbacks.

          Only wimps use tape backup: real men just upload their important stuff on megaupload, and let the rest of the world ~~mirror~~ link to it

  • # Images et vidéos

    Posté par (page perso) . Évalué à  1 .

    Je viens de tester avec le bang :
    * avec <!i> = direct sur Bing Images (argh)
    * avec <!v> = direct YouTube
    * quant à <!gi> ou <!gv>, c'est sur la plateforme Google et beaucoup plus rapide que par GG lui-même !

    Je crois que je vais délaisser Google et me mettre là-dessus :p

    Debug the Web together.

  • # euh...

    Posté par . Évalué à  2 .

    1) Je vais sur la page « exemples » donnés en lien dans la dépêche https://duckduckgo.com/goodies.html

    2) Je clique sur « time in london »

    3) Ça renvoie sur https://duckduckgo.com/html/?q=msft ... qui me renseigne sur le cours de l'action Microsoft ?????

    • [^] # Re: euh...

      Posté par (page perso) . Évalué à  2 .

      Je n'ai pas du tout ce comportement.

      « Moi, lorsque je n’ai rien à dire, je veux qu’on le sache. » Raymond Devos

      • [^] # Re: euh...

        Posté par . Évalué à  2 .

        J'ai oublié de dire, javascript est désactivé. C'est explicitement indiqué dans la dépêche qu'ils supportent les grincheux anti-javascript comme moi.

        • [^] # Re: euh...

          Posté par (page perso) . Évalué à  2 .

          Quand je désactive le JavaScript, le bouton ne fait tout simplement rien

          « Moi, lorsque je n’ai rien à dire, je veux qu’on le sache. » Raymond Devos

          • [^] # Re: euh...

            Posté par . Évalué à  2 .

            J'utilise Firefox 4, Firefox désactivé dans les options (Édition/Préférences). Le bouton, dans le code, dit :

            <input type="text" value="time in london" id="msft">

            <input type="button" onclick="goodie('msft')" value="go">

            Quand je clique dessus, j'obtiens une page avec le message :

            This page requires JavaScript. Get the non-JS version here.

            Et quand je clique sur « here », l'obtiens effectivement la page "msft", qui concerne les cours en bourse d'une entreprise.

            • [^] # Re: euh...

              Posté par (page perso) . Évalué à  3 .

              Essaye sans désactiver Firefox dans les options.

              Il marche moins bien une fois désactivé.

        • [^] # Re: euh...

          Posté par . Évalué à  2 .

          Attention, la version par défaut de ddg utilise js. Mais l'on peut utiliser une autre version non-js à l'adresse suivante : https://duckduckgo.com/html

          Il y a aussi

  • # Modèle économique

    Posté par . Évalué à  2 .

    « Le modèle économique de DuckDuckGo repose sur une publicité minimale et désactivable [...] »

    Où ça ? J'utilise sans javascript (puisqu'ils le supportent), avec ou sans images, je ne vois aucune publicité.

    « [...] et sur les ventes effectuées à partir d'une recherche avec DuckDuckGo sur des site comme Amazon ou eBay »

    firefox : network.http.sendRefererHeader → 0

    /etc/privoxy/user.action :

    {+hide-referrer{forge} }

    /

    C'est ma config depuis que certains sites s'amusent à surligner en diverses couleurs sur leur page, les mots-clefs de la recherche google que j'ai tapée. C'est pas exprès contre DDG mais pour moi ça ruine leur modèle économique.

    Le seul genre de pub qui passe, c'est des textes et liens non placés dans un DIV qui les discrimine. Voire une PNG placée sur leur propre serveur (pour les jours de fête où j'ai activé mis les images). Je veux bien regarder leur pub, voire cliquer sur des liens, mais j'ai pas moyen.

Suivre le flux des commentaires

Note : les commentaires appartiennent à ceux qui les ont postés. Nous n'en sommes pas responsables.