Articles : Google et PageRank... L'avenir passe par le libre?
Posté par tiwaz (). Modéré le 26 février 2007.
Google doit une grande partie de son succès à l'algorithme du PageRank utilisé. Il peut être intéressant pour ceux qui sont novices en la matière de connaître son fonctionnement, ne serais-ce que pour une question de culture générale.
Le site Interstices propose un très bon article de vulgarisation, qui va plus loin que la simple analyse du moteur de recherche californien, en posant un certains nombre de questions sur le fonctionnement de l'entreprise derrière ce dernier. Entre les interrogations sur la valeur réelle du nombre de pages indexées, ou encore sur certains résultats étranges du moteur, tout comme sur les problèmes même de l'implémentation du PageRanking (est-ce vraiment lui qui est utilisé ?), l'article permet de mettre en perspective certains points intéressants.
En conclusion, l'article espère que le marché forcera plus de transparence pour les modèles utilisés, estimant que l'utilisateur préfère comprendre le classement dans un moteur de recherche plutôt que de faire confiance à une boite noire. Dans le cas contraire, un totalitarisme du marché des moteurs de recherche n'est pas à exclure...
Le site Interstices propose un très bon article de vulgarisation, qui va plus loin que la simple analyse du moteur de recherche californien, en posant un certains nombre de questions sur le fonctionnement de l'entreprise derrière ce dernier. Entre les interrogations sur la valeur réelle du nombre de pages indexées, ou encore sur certains résultats étranges du moteur, tout comme sur les problèmes même de l'implémentation du PageRanking (est-ce vraiment lui qui est utilisé ?), l'article permet de mettre en perspective certains points intéressants.
En conclusion, l'article espère que le marché forcera plus de transparence pour les modèles utilisés, estimant que l'utilisateur préfère comprendre le classement dans un moteur de recherche plutôt que de faire confiance à une boite noire. Dans le cas contraire, un totalitarisme du marché des moteurs de recherche n'est pas à exclure...
L'article d'Interstice (1066 hits)
Le PageRank sur Wikipedia (483 hits)
> Lire la suite (22 commentaires, moyenne: 3,1). [dépêche : 1165 caractères]
Vous avez demandé le commentaire #807793.



divulgation ou pas
Je pense qu'ils ne divulgent pas les détails sur leurs algo, pour au moins une raison : rendre difficile le travail des "tricheurs" en matière de référencement. En effet, plus tu sais comment leurs algos fonctionnent, mieux tu pourras "optimiser" tes pages pour que les résultats de recherche soient en ta faveur (et pas seulement sur les requêtes qui ont un réèl rapport avec ton site). Bref, polluer les résultats quoi...
[^]Re: divulgation ou pas
D'un autre côté, tout le monde sait bien que livrer le code source des logiciels libres entraîne irrémédiablement tous ces logiciels à être :
1) détournés pour des utilisations "frauduleuses"
2) truffés de cochonneries
3) etc.
Ton raisonnement ne tient pas la route!
[^]Re: divulgation ou pas
Ouais, enfin je trouve que l'argument "la sécurité par l'obscurité" est un peu trop facilement écarté / jeté aux orties, parce que c'est contraire aux principes du ll, parce que les ll c'est bien connu ils ont moins de failles, donc ça marche pas, blablabla raisonnement expédié. Ça marche très bien dans la rhétorique du libre.
La sécurité par l'obscurité ce n'est certe pas la panacée, mais ça peut être un élément d'une politique de sécurité, quoi qu'on en pense ici. Entre un algo sûr au sens ou il ne repose pas sur la sécurité par l'obscurité et publié, et le même algo mais inconnu de l'attaquant, je veux dire par là qu'il ne connait pas le principe de la protection, laquelle il aura le plus de mal à attaquer ? si il ne sait même pas par quel bout prendre le problème, sans même connaître l'algo à priori ça lui simplifie pas la tâche.
[^]Re: divulgation ou pas
Le problème de la sécu par la sécurité, c'est que tu crois rendre impossible une attaque par compréhension de l'algo. Or, il suffit de regarder ce qui se fait dans le milieu de la sécurité pour voir tout les outils de dépouillage/désossage/étude de binaire.
Un mecs habituté va te lire ton algo en ASM quasiement aussi bien que toi tu le lis en C. C'est juste une question d'habitude.
[^]Re: divulgation ou pas
Pas "impossible", seulement plus difficile. En plus, dans le cas de google par exemple, tu le lis comment le code asm du programme ?
[^]Re: divulgation ou pas
Bon, moi je connais rien en sécu.
Mais l'argument des LL sur la sécu, c'est pas plutôt que le fait que le code étant lisible par beaucoup de monde, beaucoup de monde peut dénicher les pb liés à la sécu et les corriger ou les divulguer pour que quelqu'un les corrige ? Alors qu'un algo "obscur", de fait, n'empêche généralement pas les maichans de trouver des failles, mais personne ne peut auditer le code pour les corriger.
[^]Re: divulgation ou pas
À relativiser: il peut y avoir des audits de code, mais c'est l'auteur du code qui choisi qui va l'auditer. Et il a tout intérêt à choisir des gens compétentss. Tout le monde ne peut pas le faire, certe, mais personne ne peut c'est faux.
La divulgation des failles, il y a des failles divulgées dans des LL comme dans des logiciels proprios. De même, dans le logiciel libre, si l'attaquant veut garder une faille qu'il a trouvé pour lui il le peut.
Le pari du ll c'est qu'en libérant le code on aura plus de lecture, donc plus de bugreports et tout. Le travail d'audit est facilité pour les gens "bienveillants" comme pour les gens "malveillants", donc il y a plus de chances que les bugs soient trouvés par l'un comme par l'autre, et qu'une faille trouvée par quelqu'un de bienveillant va sécuriser le logiciel, surtout si elle est trouvé aussi par quelqu'un de malveillant.
À relativiser aussi: pour certains logiciels, ça doit être plus facile de trouver des gens "bienveillants" pour auditer ton code, libre ou pas: qui lis le code d'openoffice ? dans tous les cas, il faut le vouloir pour trouver une faille. D'autre part, je crois savoir qu'il y a pas mal de techniques pour trouver des failles qui marchent sur le binaire, genre le fuzzing des entrées, faisables automatiquement, et donc qui marchent aussi bien sur du LL que du proprio.
Tout ça pour dire que le LL, la sécurité la favorise certe, mais ce n'est pas parce qu'un logiciel est libre qu'il sera magiquement sécurisé, et que ce n'est pas la panacée dans tous les cas. Il faut savoir relativiser son discours aussi un peu de temps en temps pour pas tomber dans l'aveuglement.
[^]Re: divulgation ou pas
Oups, mauvaise relecture, il manque un bout :
Qui lit volontairement le code d'openoffice pour le sécuriser? À part les auteurs de plugins d'E/S je vois pas trop ;)