[ Précédent :: 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 :: Suivant ]
Re: Errata
None fait 9,6 %. Pour un projet communautaire, on pouvait s'attendre à plus.
il y a aussi les 29,5% de Unknown qui peuvent etre compté dedans ...
29,5% de petits contributeurs et 9,6% de contributeurs autonomes ... cela fait presque 40% de contributions qui viennent de tout à chacun.
ce n'est pas si mal :)
[ Répondre ]
Re: de l'inutilité d'un moteur de recherche libre
je comprend ce que tu essaie de dire, mais tu confonds Second Life et l'algo de google.
Second Life est proche d'un logiciel de type MMORPG (meme si ce n'est pas un MMORPG d'apres ce que j'en sais).
Liberer le code source du client "Second Life", n'aura pas d'influence majeur sur le comportement des joueurs, puisque :
1. le client depend fortement du serveur
2. si tu monte ton propre serveur ou tu es dieu, tu n'auras que 3/4 joueurs pas 3/4 000 000 de joueurs puisque tu ne seras pas sur le serveur principal
3. quand bien meme tu arrives a faire certains trucs l33ts avec ton client, cela n'aura quasiment aucune portée dans le jeu
4. avec le code source du client que tu utilise, tu n'auras aucune influence sur le client des autres
Par contre, sur un moteur de recherche libre, il te faudra te prémunir contre toute personne qui ayant trouvé une faille dans le source ou l'algo du moteur, et en profite sans rien publier assurant ainsi la pérénite de la promotion de son site de vente de viagra.
Si le "profiteur" est malin il s'assurera une presence discrete mais pertinente pour eviter de rendre trop visible sa pollution. Par contre, statistiquement, il y aura un jour ou l'autre, des gros boulets qui rendront la faille trop visible en bourrinant comme des gorets pour etre ostensiblement présent.
Imagine que le probleme n'est pas au niveau de l'algo mais du code, évidemment en quelques heures, cela peut etre reglé.
Mais ici, l'on parle d'algorithme pas de maniere de coder un algorithme : cela implique que le meme algorithme est un sujet de R&D ... donc si une personne trouve une faille dans l'algorithme, les developpeurs se retrouverent dans les memes conditions que Sir Andrew Wiles en 1993 quand il fut forcé de retarder sa publication d'un an (c'est à titre d'exemple, il me semble qu'il y a aucun rapport entre le grand theoreme de Fermat et les moteurs de recherche ;) ).
Et 1 an de non-présence d'un site internet pour cause de réécriture de l'algorithme, cela s'appelle la mort d'un site.
Quand bien meme, l'algorithme serait modifié rapidement, il y a comme contrainte supplémentaire, la reconstruction de la base et donc potentiellement la réindexation de l'ensemble des sites antérieurement connu.
Enfin, quand on sait qu'aujourd'hui avec ses centaines de milliers de serveurs, l'algorithme de google converge en plus d'un mois ... ou est ce qu'un moteur open-source trouvera les liquidité pour se payer pareil redondance et puissance de calcul ? A moins que sa composante open-source ne soit qu'un leure pour s'acoquiner avec des libristes incapables d'en voir son absurdité.
Bien entendu, si un moteur de recherche arrive à mettre au point un algorithme pertinant et efficace, je pense que doucement une migration se ferait sentir vers celui ci dans les statistiques de l'ensemble des sites ... mais a part une constance assez provoquante et une pertinance des resultats hors mots-clés concurrencielles de google, personne ne se présente à l'horizon.
Pour faire une apparté, je rappelle que les statistiques de Linux restent désesperantes coté internaute pourtant, chacun ici utilise linux regulièrement et en tire satisfaction, et tout le monde est d'accord qu'il manque encore des choses à linux pour qu'il progresse auprès du grand public.
L'algorithme formellement inattaquable ne semble pas encore connu du grand public, donc l'hypothese du moteur open-source aura difficilement sa place.
[ Répondre ]
de l'inutilité d'un moteur de recherche libre
Apres moult lectures de l'articles, et quelques recherches sur l'auteur, je suis deçu par l'absence flagrante de qualité de cet article.
l'article me semble etre une tartine rance issu d'un fond de confiture moisi. le propos est dur, je le reconnais, peut etre meme un peu exagéré, mais elle repose sur certaines observations que je fais sur le texte.
Qu'un chercheur en mathematique fasse un article sur un algorithme d'un moteur de recherche et se pose sur le secret l'entourant, ne doit pas l'empecher de faire des recherches annexes, sur les personnes utilisant le moteur de recherche. Pourtant, cette personne ignore une grande partie, voire la plus grande partie des clients des moteurs de recherches : les webmasters & autres propriétaires de sites.
L'utilisateur premier aurait du être l'internaute, le gentil surfeur, la menagere de plus de 50 ans, ... mais la réalité est tout autre, le premier utilisateur de moteur de recherche est celui qui veut voir son site etre dans les 10 premiers liens de google sur certains mots clés.
L'article a été publié en novembre 2005, je présume qu'il n'a pas été écrit en 98 ou 99 mais plus probablement un peu avant novembre 2005. Durant la même année, j'ai eu pour mission de referencer certains sites, j'ai eu à me renseigner sur diverses techniques pour améliorer le réferencement sur google, yahoo, msn, et d'autres.
Le premier point qui me chiffone est celui ci : l'auteur ne semble pas savoir ce qu'est le cloaking , le duplicate-content , les PR10 locaux, le PR spoofing, et tant d'autres techniques qui permettent d'etre classé dans les 10 premiers liens ...
Dès que google a connu un peu de notoriété, le fameux article de Brin et Page fut publié, décortiqué, analysé, torturé pour comprendre un peu la mécanique sous-jacente ...
Et pour faire un parallèle avec la cryptographie, Google a subit des attaques d'un nouveau genre à son encontre : des attaques de referencement.
Google a donc modifié son algorithme au fil du temps car certaines de ces attaques nuisaient à la qualité des résultats.
un exemple tres simple et un des premiers si je me souviens bien :
si l'on regarde l'algo lui meme, on constate que si on reference X pages contenant une dizaine de liens vers diverses pages qui elle-meme pointent sur leur source et sur une destination unique, qui repointe sur certaines source de source, on peut creer des nébuleuse de PR 10 sans avoir aucune notoriété reelle.
Pourquoi ? tout simplement par ce que l'algorithme manipule un graphe qui est en fait une foret de graphe, c'est a dire que ce graphe représentant internet peut etre coupé en sous graphe sans couper aucun lien existant.
Maintenant, pour clarifier un point, cette attaque repose sur une contrainte budgetaire "avoir un portefeuille de domaine suffisament important" donc ce n'est pas avec 4 ou 10 domaines que l'on peut monter une attaque^W un referencement de la sorte :p
Google a donc changer son algo pour gerer ce type de problemes.
apres on trouve le tres classique SPAMlog :
c'est la meme IP qui balance plusieurs milliers de requetes sur certaines pages d'un site avec differents referers. si ce site publie ses statistiques web, le site fourni une page de referencement permettant de falsifier le PR d'un site.
Encore une fois, Google a cherché encore à contrer ce genre de choses.
il y a les liens "no-follow" et d'autres solutions proposés qui ont un impact au niveau meme de l'algo utilisé par google.
donc, l'algo d'origine quelqu'il soit, n'est plus le meme depuis des années :D ... et cette information et le pourquoi n'est meme pas evoqué dans l'article.
donc à mon sens, le seul interet potentiel de l'article aurait pu etre une reflexion sur l'interet ou non de publier l'algorithme, mais serieusement, si l'on reflechit 30s, publier l'algorithme c'est accepter de prendre le risque de devoir mettre en faillite google.
Quel est le lien entre la publication et ce risque de mise en faillite de google ?
il est simple :
un referenceur apres plusieurs mois d'analyse de l'algorithme, arrive a detourner l'algorithme de google, et fait apparaitre des liens pour son site de vente de Viagra quelque soit le mot clé utlisé dans sa recherche.
si google ne trouve pas une parade rapide (quelques heures), le moteur de recherche sera totalement decredibilisé, et plus personne n'utilisera le moteur de google, donc google connaitra la nécessité d'une mise en faillite.
Changer un algortihme de ce genre, ne se fait pas en quelques heures, c'est plusieurs mois de travail. l'expérience le prouve car il faut plusieurs mois pour que google detecte ce genre d'attaque encore aujourd'hui.
Aujourd'hui, l'open source ne peut pas fournir de garantie contre ce genre de risque là ou le closed-source offre une garantie :
celle que l'attaqant doivent tout refaire, tout réapprendre à chaque changement car il n'en a pas la connaissance.
La boite noire est la meilleur garantie d'une certaine tranquilité pour les 99,99999% des personnes qui utilise google pour autre chose qu'améliorer son propre referencement ( le pouilleme restant etant ceux qui seront satisfait par du viagra pour tous les mots clés ).
L'on peut me retorquer que sur l'argument du closed source pour éviter les détournement, l'article répond fort justement en disant : "Le Droit s'adapte pour prendre en compte l'évolution de la délinquance et personne n'en déduit que la loi doit être secrète." avec comme seul exemple, le google bombing. mais encore recemment, nous avons pu voir que certaines sociétés ont été victime de google bombing parce que leurs activités déplaisent à certains internautes.
Sur la problematique de moyen, je tiens à rappeler qu'un nom de domaine s'achete à moins de 10 euros l'unité, et qu'un hébegement mutualisé est souvent offert avec chaque domaine, et qu'un serveur dédié coute moins de 20 ¤/mois chez certains hébergeurs.
Apres, il y a une une erreur non-négligeable qui est commise, le droit est public et c'est ce qui garantie l'équité de chacun (dans une certaine mesure du moins). un algo de ce type pourrait etre public si il n'y a aucun moyen et/ou interet à le contourner.
la loi s'adapte lentement, mais s'adapte, et surtout il y a le juge qui est createur et garant du droit à chaque fois qu'un tier lui demande de prendre position.
La comparaison d'une chose reposant sur une propre faculté au vivant (pour certains de l'homme ) celle de conscience et d'independance d'etre, à une chose fonctionnant comme un automate-presse-puré est ... comment dire ... hum ... mais, si l'automate presse-puré avait une conscience, je pense qu'elle serait flatté :)( et d'un autre coté, un automate presse-puré avec une conscience ... pour moi, c'est un être vivant, mais c'est un autre débat ).
toujours est il que cette possible garantie d'équité ne répond pas à la question importante :
quelle garantie peut apporter le libre sur le fait que des qu'un algo critique est rendu public .cela facilite d'autant plus la pollution electronique ?
Cet algorithme est utilisé par des centaines de millions de personnes, et peut etre détourné de sa finalité, par un individu qui ne publiera jamais sa technique garantir la perenité de son interet/placement/investissement/operation.
Est ce que cet algorithme peut il etre rendu public ?
Oui, si cet algo est formellement inviolable. Or, l'experience prouve le contraire, puisque google le modifie sans cesse.
Oui, si il peut etre modifié rapidement sans nécessité de truquer la base de données ou de reconstruire l'integralité du savoir existant. Encore une fois, il est connu des referenceurs que google recalcule regulierement "from scratch" l'integralité de la base et que la convergence de l'algorithme est de l'ordre de plusieurs semaines voire quelques mois.
Dans un algorithme de chiffrement, l'algorithme rendu public est rendu public de maniere incomplete : il manque les clés utilisés.
A mon sens, rendre public cet algorithme, est comme si un admin libriste rendait public le mot de passe root de ses serveurs pour etre "open" jusqu'au bout.
Ma conclusion, google faisant de l'open-source sur certains dossiers, n'a pas de raisons de publier cet algo & son code source parce que :
- sa publication affaiblira la pertinence des resultats ( resultat deja connu, au travers du spamdex, googlebombing qui deviendrait un jeu d'enfants )
- sa publication ne garantira à aucun moment ni à terme que l'algorithme pourra etre rendu insensible aux corruptions
- sa publication ne garantira aucune amélioration de reactivité ou reduction de couts, par contre, cela a plus de risque d'augmenter les coûts
Cette reflexion sur l'interet de publier l'algorithme de google, s'applique sans mal à tout projet de publication d'un algorithme de recherche, si cet algorithme est utilisé par un moteur de recherche "grand public". Cela implique, que un moteur de recherche libre est soit condamné à n'être utilisé que par 3 personnes, soit à devenir une usine à SPAMdex et donc à être tellement pollué que plus personne ne l'utilisera. La seule possibilité d'un moteur de recherche libre est plus de l'ordre d'un annuaire libre qui connaitrait un engoument equivalent que wikipédia ... mais wikipédia n'est il pas déjà un peu cela ?
[ Répondre ]
Re: non-information
Même quand linus change de distrib ça fait moins de bruit.
deja il faudrait savoir si Linus recompile son noyau ou utilise un des noyaux de sa distrib.
je sais ou est la sortie -> []
[ Répondre ]
Re: heu?
Renseignement Generaux Informatisés
en gros une celulle de pirate-nakeurs travaillant pour l'état.
si tu preferes la version plus officielle :
Referentiel General d' Interoperabilité
[ Répondre ]
mon passage préféré ...
Executive Executive Summary
---------------------------
The Vista Content Protection specification could very well constitute the
longest suicide note in history [Note A].
[ Répondre ]
Re: Sagesse
ciel ! tu es Sage ! mon Oracle m'a dit que c'etait Edwards qui l'était et non toi.
[ Répondre ]
Re: au choix :
A avoir formé une personne qui a donc deja une experience en entreprise pour pouvoir l'integer rapidement ?
c'est normal à un moment ou à un autre qu'il produise quelque chose sinon ce n'est pas quelqu'un qui a réussi à mettre en pratique ...
... Par contre, demander une expérience significative et demander de developper et produire est une abération pour un stage.
un stagiaire n'est pas un salarié bradé, c'est une formation pratique des acquis theoriques en cours : cela veut dire qu'un stagiaire produira du bug, du bug, du bub et encore du bug avant de produire un truc propre :)
[ Répondre ]
Re: faut pas mélanger ...
reprend le discours chretien :
l'homme mauvais et le dieu bon
donc tout ce que fait l'homme est mauvais, et si il fait un truc de bon, c'est dieu qui agit au travers de lui.
Apres, vu que l'homme est mauvais, il vit une vie de merde et doit faire penitence pour devenir "bon" et avoir le droit au paradis dans une vie apres la mort .
... d'un autre coté, durant l'antiquité, il y avait des bains publics et des regles d'hygiene et que d'un autre, plus tard, le roi de france ne se lavait qu'une fois tous les 5 ans.
Si l'on regarde certaines pratiques risibles pour certains, mais tremper la viande dans du sel jusqu'a ce qu'elle soit exsangue, se laver les mains avant de passer à table, faire des bains rituels plusieurs fois par mois, ...
... c'est d'un point de vue des actes de religion sans aucun sens
... mais d'un autre, la religion n'est que pretexte garantissant dans une certaines mesures l'application de regle d'hygiene, de conservation alimentaire sans avoir à filer un bac+10 à un cretin qui ne saura pas reflechir tout seul.
Bizarrement, la chretienneté a viré tous ces rituels "absurdes" et n'a produit qu'une religion où c'est une foi interieur qu'il faut vivre au travers de priere ...
... aujourd'hui, on voit le resultat.
[ Répondre ]
Re: faut pas mélanger ...
d'un autre coté, je te sors la bible et c'est ecrit dedans que Dieu n'est ni omniscient ni omnipotent.
c'est triste à dire mais personne semble n'avoir serieusement lu la bible ...
donc :
- après le déluge, Dieu passe un accord avec Noé et sa descendance en disant : j'ai joué au con, plus jamais je ne le referai, tiens je te file un joli arc en ciel pour que tout le monde s'en souvienne ... moi le premier
si cela n'est pas une preuve irrefutable de la non omniscience de dieu, je sais pas ce qu'il te faut.
Apres, tu peux prendre plein d'autre passage.
La présence de Dieu n'est pas total pour son peuple puisque dans les combats entre les hamalecites et les fils d'israel dans le désert, Aaron et des proches vont jusqu'à solidifier les bras de Moise car quand les bras de Moise faiblissaient, le peuple perdait car la présence de dieu se réduisait.
et hop, voila pour la refutation de l'omnipotence de Dieu.
Donc, je pose la question :
comment la chretienneté a reussi a passer d'un dieu comme celui là, à ce Dieu omniscient, omnipotent, juste, misericordieux, bon, ... et surtout comment on est passé d'une culture où la culpabilité n'avait aucun sens, à un monde où le péché, la faute et la pénitence sont les seuls discours tenus meme par les soit disant laics et autres pseudo athés ?
ce que tu essaie de combattre n'est pas Dieu mais une vision de Dieu. dans ton interrogation, Dieu est un aspect totalement superflu puisque tu ne traite que de l'interpretation de Dieu et surtout de ce qu'en a fait la chretienneté.
[ Répondre ]
au choix :
ce que vous recherchez est :
a- un chinois/indien/marocain/yougoslave
b- salarié
c- un esclave corvéable à merci
par contre, ce n'est pas :
a- un apprenti
b- un stagiaire
un stagiaire n'est pas la pour produire où livrer, mais pour APPRENDRE, sinon c'est un salarié;
[ Répondre ]
Re: À titre de prévention...
un couteau, un pistolet, un fusil, un char d'assaut, une hache a double tranchant +25 en force +15 en agilité -200 en intelligence est aussi un argument convainquant pour qui veut vivre plutot que de mourir pour des idées.
[ Répondre ]
Re: faut pas mélanger ...
juste un truc ... a destruction de l'espece en pronant l'abstinence sexuelle ... est à lire à l'envers :
l'abstinence sexuelle avec un risque de destruction de l'espece
[ Répondre ]
faut pas mélanger ...
Déjà, le Dieu décrit et adoré par les chrétiens n'est pas le Dieu de l'ancien testament.
Je ne vois pas où est la bonté, la générosité, la miséricorde à détruire Sodome et Ghomor, à laisser mourir dans le désert pendant 40 le peuple qu'il a libéré, à faire tourner délibérement en rond ce meme peuple, à interdire à Moïse de rentrer en Canaan parce qu'il s'est énervé une fois, à accepter de discuter avec Abraham pour laisser vivre des hommes, a faire un pacte grandiloquent pour dire à noé "oups, j'ai fait une connerie et je ne la referai plus" ...
Par contre, il est interessant de voir que ce Dieu de l'ancien testament est ce meme Dieu qui se fait renvoyer chez lui ( dans le traité talmudique Baba metsia ) pour ces deux raisons : il a dit que l'homme devait prendre ses décisions à la majorité, et que Dieu n'interviendrait plus dans les décisions de l'homme.
Il est donc bon de noter que la distinction entre ce Dieu et l'idéal divin de la chretienneté qui produisit :
- l'humiliation des femmes pendant 1000 ans
- pres de 400 ans de sainte inquisition ( dernier brulé en 1830 !!! )
- la destruction de l'espece en pronant l'abstinence sexuelle
- le massacre systematique des juifs, musulmans, tziganes
- l'infaillabilité papale
Je prefere croire en un Dieu con, raleur, jaloux, bougon, impulsif, dangeureux, à un Dieu qui est somme tout imparfait comme l'homme, et qui doit affronter comme l'homme, le fait que ce qu'il a créé finit toujours par le dépasser et qu'il a du mal à l'accepter.
Ce Dieu là, a largement toute ma sympathie contrairement à un Dieu abject de compassion, miséricorde et gentillesse qui a laissé se faire Dachau, Birkenau, Auschwitz, Sobibor, Struthof, Treblimka, Buchenwald, Chelmno, Ravensbruck, Mauthausen, Flossemburg, Belzec, et tous ceux dont je ne me souviens pas du nom.
Mais si cela se trouve, en fait ce Dieu auquel je crois, il pourrait aussi s'appeler l'Homme.
[ Répondre ]
OpenXML , C#, qui est le suivant ?
devinette qui gueule le plus souvent pour le respect des standards et qui va se mordre les doigts pour faire respecter ces deux futurs standards que sont OpenXML et C# ?
d'un autre coté, si les standards deviennent le nouveau refuge des brevets logiciels ont est pas sortie de l'auberge :D
[ Répondre ]
Re: GNU/Linux
Je repondais sur le point de l'embarqué qui d'apres certains devrait etre GNU/linux parce qu'il compile avec GCC meme si il n'utilise pas la glibc ...
Meme microsoft ne sort pas pareil connerie ... Microsoft n'impose pas un MS/* ou un Win/* parce que tu as utilisé VC++ ou VB ou VStudio .
[ Répondre ]
Re: GNU/Linux
puis avec ton raisonnement, c'est GNU/OpenBSD , GNU/NetBSD , GNU/FreeBSD , GNU/Mac OS X non ?
[ Répondre ]
Re: GNU/Linux
va dire ca a OpenWRT ou à n'importe quel projet linux dans l'embarqué ... on va bien rire
si ca marche de maniere largement stable sur des machines qui sont tres restreintes pourquoi cela ne marcherait il pas deja sur des grosses machines ?
(et cela marche et sur des serveurs qui tiennent largement la charge ayant une conso que tu peux difficilement imaginer...)
[ Répondre ]
Re: GNU/Linux
mais tu es drole. tu dois avoir un diplome bac+5 en humour c pas possible.
en 1991, tcc n'existait pas.
en 1991, quand LBT compilait freax avec GCC et la premiere licence n'etait pas la GPL ( cf. http://kde.sw.com.sg/food/linus.html ).
et alors ?
combien d'outils utilise perl ? pourtant tout ne se prefixe pas par perl/* ...
puis, je te rappelle un detail, il disait quoi RMS en 1991-1993 ?
tiens un lien http://www.oreilly.com/openbook/freedom/ch10.html
After receiving the first notification of a Unix-like operating system that ran on PCs, Stallman says he delegated the task of examining the new operating system to a friend. Recalls Stallman, "He reported back that the software was modeled after System V, which was the inferior version of Unix. He also told me it wasn't portable."
Much has been made about the GNU Project's struggles during the 1990-1993 period. While some place the blame on Stallman for those struggles, Eric Raymond, an early member of the GNU Emacs team and later Stallman critic, says the problem was largely institutional. "The FSF got arrogant," Raymond says.
Shortly after the ["DEBIAN"] Manifesto's release, the Free Software Foundation made its first major request. Stallman wanted Murdock to call its distribution "GNU/Linux." At first, Murdock says, Stallman had wanted to use the term " Lignux"-"as in Linux with GNU at the heart of it"-but a sample testing of the term on Usenet and in various impromptu hacker focus groups had merited enough catcalls to convince Stallman to go with the less awkward GNU/Linux.
Although some would dismiss Stallman's attempt to add the "GNU" prefix as a belated quest for credit, Murdock saw it differently.
The deepest split, Murdock says, was over glibc. Short for GNU C Library, glibc is the package that lets programmers make "system calls" directed at the kernel. Over the course of 1993-1994, glibc emerged as a troublesome bottleneck in Linux development. Because so many new users were adding new functions to the Linux kernel, the GNU Project's glibc maintainers were soon overwhelmed with suggested changes. Frustrated by delays and the GNU Project's growing reputation for foot-dragging, some Linux developers suggested creating a " fork"-i.e., a Linux-specific C Library parallel to glibc.
Over time, however, Stallman began to sense that there was an underlying lack of awareness of the GNU Project and its objectives when reading Linux developers' emails.
je vais m'arreter là les citations, la page est tres interessante. et au regret de te faire chier, ayant vecu cette periode, ce n'est pas de l'anti-GNU, anti-RMS que de dire que la FSF passe plus de temps à essayer de communiquer autour d'elle qu'a livrer du code.
je vais me commander le bouquin, j'ai decouvert ce truc au hasard d'une recherche pour verifier des dates : les differents forks de GCC (egcs,gcc-pentium,...)
[ Répondre ]
[ Précédent :: 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 :: Suivant ]



reflexion
fallait pas demander toutes les tailles !!!!
apres faut pas s'etonner que l'on te proposer d'enlarger ton processus.
[ Répondre ]