Ecila ce n'est qu'un au revoir

Posté par  (site web personnel) . Modéré par Fabien Penso.
Étiquettes :
0
4
sept.
2001
Internet
Triste jour que celui qui voit la fin de l'exploitation de ecila.fr par Tiscali. En effet Tiscali a décidé pour des raisons que nous ne commenterons pas ici d'arreter le service d'Ecila au profit de Nomade.

Je vous renvoie à l'annonce faites sur 01 Net et vous invite surtout à lire le texte de Loic et à le diffuser à ceux qui cherchent encore des arguments pour faire du Logiciel Libre, ou devrais-je plutôt dire, à ceux qui se cherchent encore.

Amitiés à tous et à toi Loic.

Aller plus loin

  • # Quelques questions...

    Posté par  (site web personnel) . Évalué à 7.

    Ecila va fermer ces portes et c'est bien triste.

    Cependant, comme Loic l'explique trés bien, les technologies utilisées sont libres et quiqonque peut continuer à faire vivre le moteur de recherche et tout le développement effectué durant ces 6 dernières années n'est pas perdu.

    Cependant si je veux continuer à faire vivre l'équivalent d'Ecila, ne vais-je pas être limité par le matériel nécessaire pour héberger un moteur de recherche ?

    Qu'est ce qu'il faut comme matos pour indexer l'Internet ?
    • [^] # Re: Quelques questions...

      Posté par  . Évalué à -1.

      Heu, un cluster de 12000 machines sous Linux par exemple ?
      • [^] # Re: Quelques questions...

        Posté par  (site web personnel) . Évalué à 7.

        Il me vient une idée comme ça en passant...

        Y a t'il un hacker de génie qui pourrait créer un moteur de recherche et d'indexation de l'Internet distribué ?
        Chaque machine appartenant au réseau du moteur de recherche contiendrait un index initial ainsi qu'un bout de la base de données et redirigerait les requètes vers la machine contenant la réponse.
        Ce serait l'ultime aboutissement d'un moteur de recherche Libre non ?

        C'est pas un peu comme ça que fonctionne Google ?
        • [^] # Re: Quelques questions...

          Posté par  . Évalué à 2.

          si tu veux avoir des bons temps de reponses, il te faut UNE base centralisée qui réponds a ta requete, il me semble. Ca coute cher en RAM, CPU et stockage. par contre, la partie "robot parcourant le reseau" est tres certainement distribuable.
          • [^] # Re: Quelques questions...

            Posté par  (site web personnel) . Évalué à 1.

            J'imaginais que les requêtes pouvait fonctionner à la manière du DNS. On interrogerait son moteur local qui fairait monter la requêtes hiérarchiquement jusqu'a une/des machines centrales qui fairaient redescendre sur la machine contenant la réponse. Les machines intermédiaire mettant en cache les requêtes les plus fréquentes.

            Une bases de données est généralement indéxées de manière hiérarchique. Qu'est ce qui empèche chaque noeud de la base d'être en fait une machine physiques distincts. Aprés tout le DNS qui fonctionne de la même manière est plutôt rapide...
            • [^] # Re: Quelques questions...

              Posté par  (site web personnel) . Évalué à 4.

              L'histoire, c'est que la structure d'un nom de domaine est hiérarchique :
              d'abord le .org, puis le linuxfr, puis le my, par exemple.

              Mais pour un moteur de recherche, si tu indexe en fonction du domaine, tu vas avoir un temps de réponse pire que lamentable. L'idée est donc de faire ca par thématique, avec
              un serveur = un theme, plus un métaserveur pour determiner la serveur a interroger en fonction de la requete.

              Le problème se situe plus au niveau organisationnel que technique : qui gère chaque thème ?
              • [^] # Re: Quelques questions...

                Posté par  . Évalué à 0.

                J'avais vu des techniques, ou on fait un hash de la requete, puis on fait correspondre la clé à une machine qui contient le résultat.
                La correspondance clé <-> hash change uniquement quand on change la quantité de machines.
                • [^] # Re: Quelques questions...

                  Posté par  . Évalué à 1.

                  Ca marche pour les bases a la Yahoo.
                  On sait d'avance comment on range les clefs et cela permet de router la question vers sa solution.
                  Mais pour une base comme Google, ca ne marche pas. où se trouve la réponse à la question (kiche and Lorraine) ?
        • [^] # Re: Quelques questions...

          Posté par  . Évalué à 4.

          Ce serait tout a fait possible, meme si ca n'aurait pas du tout les memes temps de reponse que Google (loin de la !)
          Il serait possible de creer un moteur de recherche p2p... mais il faudrait rendre ca plus original qu'une simple indexation de tout le web.
          Par exemple, tu te configures pour chercher dans les pages visitees par le profil "ados" ou bien "chercheur" et comme ca quand tu fais une recherche sur sexe tu as differentes reponses en fonction du groupe auquel tu t'identifies (dont je ne detaillerais pas les differences ici).
          Il commence a y avoir des plateformes sympas pour faire du P2P facilement comme JXTA par exemple. J'ai meme un moment pense a jouer avec cela, mais finalement je me suis raisonne :))

          C'est pas un peu comme ça que fonctionne Google ?
          Pas du tout ! Google utilise une "ferme" de serveurs qui independamment traitent les reponses, ce qui n'est pas la meme chose que ce que tu proposes. Par exemple un coup c'est google1 qui va traiter ta requete et un autre coup c'est google8000, mais les donnees restent centralisees.
        • [^] # Re: Quelques questions...

          Posté par  . Évalué à 6.

          Voici un lien chez Google pour expliquer son principe aux (rares?) personnes qui ne connaissent pas ce fabuleux moteur de recherche :

          http://www.google.com/intl/fr/why_use.html(...)
        • [^] # Re: Quelques questions...

          Posté par  . Évalué à 1.

          Il y a la technologie des agents mobiles qui répond un peu à ca.

          L'idée est la suivante: un agent mobile c'est un programme qui a la particularité de pouvoir migrer d'ordinateurs en ordinateurs dans une zone définie appelée "zone de migration". Il prend avec lui son petit sac à dos, on lui dit: allez mon petit, va faire un petit tour et ramènes moi tout ce que tu trouves sur "la reproduction des pingouins en Alaska", et hop, le voila parti d'ordis en ordis...

          Bon, autant le dire tout de suite, dans les exemples que j'ai vu le temps de recherche se comptait plutot en minutes ou en heures qu'en ms...donc c'est encore pas la panacée, mais c'est un sujet de recherche en plein développement.

          Tiens un petit programme bien marrant qui gère des agents mobiles qui partent à la recherche d'infos sur le web: ftp://ftp.tryllian.com(...) ,c'est bien marrant, et joli:)
          Un exemple d'agent mobile se trouve sur http://grasshopper.de(...) mais y'en a pleins d'autres, suffit de faire une recherche sur "mobile agent" dans google...
    • [^] # Re: Quelques questions...

      Posté par  . Évalué à 2.


      Qu'est ce qu'il faut comme matos pour indexer l'Internet ?


      Suite a une visite dans les locaux d'Infonie il y a un an, j'ai trebuche sur une machine portant une etiquette "Ecila". Il s agissait d un serveur Sun, tout gris, haut jusqu'au genou. Pas sur que ca aide, mais voila quoi :-p
      • [^] # Re: Quelques questions...

        Posté par  . Évalué à 1.

        Suite a une visite dans les locaux d'Infonie il y a un an, j'ai trebuche sur une machine portant une etiquette "Ecila".

        Ah, ba c'est toi qui l'a cassé alors
      • [^] # [off]

        Posté par  . Évalué à -1.

        Et tu y faisais quoi chez Infonie
        • [^] # Re: [off]

          Posté par  . Évalué à -1.

          Entretien d'embauche. Finalement ça ne s'est pas fait mais ce ne fut pas a cause de ce malencontreux coup de pied.
    • [^] # Re: Quelques questions...

      Posté par  . Évalué à 1.

      ben une enorme connection...8000 serveurs (pour faire aussi bien que google) et une ennnnnnnnnoooooooooooorme connection :)
      piur un systeme distribué, je pense que si quelq'un invente un protocol fiable et novateur, il y aurra un grand engouement, j'y participerai grandement, mais c'est tres complexe, deja dans u autre domaine, edonkey est le meilleur logiciel P2P, il ne l'est pas a 100 % mais c'est un debut, bref vive le P2P sous toutes ses formes !
    • [^] # Re: Quelques questions...

      Posté par  (site web personnel) . Évalué à 10.

      Ce qu'il faut, ce sont des machines puissantes.
      En effet pour le crawl et l'indexation les machines sont vraiment à genoux. De plus pour répondre au requêtes des internautes, il faut aussi une machine susceptible d'assurer le travail.

      Sur Ecila en ce moment:
      2 machines Bi 866 2Go et 70Go de disques pour répondre aux requêtes
      2 Machines Bi 866 1Go avec une baie de 200Go pour crawler et indexer.
    • [^] # Re: Quelques questions...

      Posté par  (site web personnel) . Évalué à 3.

      J'ai eu l'occasion de voir tourner Janas (moteur de recherche lié a tiscali aussi).

      Pour indexer les sites français il avait besoin de deux bi-pro sous debian et surtout d'une forte capacité en disque dur (on avait 3To y'avait de la marge) et puis une bonne bande passante.

      Il fallait voir les graphes quand il faisait une petite réactualisation.

      Et si, comme google, on fait de l'indexation et du stockage de page web ça doit être sacrément gourmand.
  • # Au delà du développeur

    Posté par  . Évalué à 9.

    En partant du développeur, le texte de loic pose la question des conditions de travail, étant un développeur ceci parait logique Or, je pense qu'il est temps de traiter l'implication des utilisateurs/bénéficiaires.
    Avoir un code ouvert et avoir une démarche publique permet une implication des utilisateurs, correction de bugs, publicité, ajout de modules, ... , c'est fondamental. Cependant le moteur principal des logiciels libres a été et reste encore la motivations de quelques individus (ceux qui codent le bas niveau des applications). Donc je pense que la problématique actuelle ne porte plus vraiment sur la légitimité des logiciels libres (ce qui n'empèche la diffusion des idées, ce que le texte de loic fait admirablement), mais sur l'infrastructure. Comment la croisssance en terme de nombre d'utilisateurs/bénéficiaires des logiciels libres peut renforcer/aider la production de logiciels libres ?
    D'une part, même si des entreprises basées sur les logiciels libres font du profit, il faut quand même souligner que leur fond technique a été réalisé dans un cadre complètement déconnecté de l'économie. D'autre part, il faut admettre que les logiciels libres ont quand même tendance à réduire la richesse artificielle et donc ne peuvent struturellement fournir un modèle économique juteux. Alors que faire pour que l'activité de production des logiciels libres soit plus intégrée dans les différents type d'économie (monétaire/non-monétaire, marchand/non-marchand, tiers secteur, bourse, ...) ?
  • # A part le coté deveveloppement... l'utilisation du moteur !

    Posté par  . Évalué à 6.

    euhh...
    Avez-vous utilisé Ecila récemment ?
    Parce que moi, oui.
    Et franchement, les réponses... beurk.
    J'ai retrouvé dans ce moteur des sites qui ont disparus depuis 4 ans, des descriptions de sites datant de la même époque, etc, etc...
    Tiscali a fais disparaitre Ecila parce que personne ne l'utilisait plus ! Pas parce que c'était GPL, faut arreter la parano ;-) Et ce n'est pas parce que un moteur est en GPL qu'il faut à tout pris qu'il reste en place. Darwin le prouve : seul les plus adaptés survivent.

    Vive Google !

    A+++

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.