Journal Wikipedia as a complex network

Posté par  .
Étiquettes :
0
23
fév.
2006
Wikipedia as a complex network
Est le titre d'un article produit par 4 Chercheurs Croates
dont le pre-print ( Version avant eventuelle publication ) est disponible sur arXiv
http://www.arxiv.org/abs/physics/0602149

Comme son titre l'indique Il cherche a appliquer les principes de l'etude de reseaux complexes aux liens entre les pages de Wikipedia et compare ainsi differente langue. Et conclus que que les structures des differentes versions de Wikipedia sont tres proches ( a l'exception de la version polonaise )
  • # ...

    Posté par  . Évalué à -9.

    J'avoue que j'ai pas lu l'article. Mais c'est quoi l'interet de cette etude ?
    • [^] # Re: ...

      Posté par  . Évalué à 10.

      Comme souvent pour les articles scientifiques, les raisons qui ont motivé la recherche que les auteurs ont menée sont expliquées dès l'introduction de l'article. Introduction sensée être compréhensible par quelqu'un dont ce n'est pas le domaine de recherche. Comme quoi il ne faut pas avoir peur de lire.
      • [^] # Re: ...

        Posté par  . Évalué à -5.

        Ouai je viens de lire en partie l'article et je me dis que ces gars la auraient peut être du passer leur temps à faire autre chose. Parce que la moi je vois ça comme du bon gros vent. Donc si quelqu'un pouvait m'expliquer avant de me moinsser :).
        • [^] # Re: ...

          Posté par  . Évalué à 10.

          Moi je me dis que tu aurais mieux fait de te renseigner que de perdre ton temps dans un commentaire qui ne nous apprends rien de nouveau sur ton ignorance du fonctionnement de la Recherche.

          Je ne suis pas spécialiste des réseaux complexes mais je vais essayer d'éclairer ta lanterne. D'abord il est clair qu'il n'y a pas d'applications directes de leur travail. Il ne profite principalament qu'aux gens qui travaillent sur ces réseaux complexes, en leur donnant des nouvelles données à simuler, ou pour tester leurs modèles, ou encore pour comparer avec d'autres réseaux.

          Les vraies applications viendront sans doute d'un autre domaine de recherche et il est difficile de le prévoir. Qui sait peut-être qu'un jour, par exemple, la rhéologie http://fr.wikipedia.org/wiki/Rh%C3%A9ologie nous sortira un matériau extrèment résitant, avec des polymères organisés en réseau complexe façon Wikipédia.

          Tojours est-il que lorsque Pierre Curie étudiait la piézoélectricité http://fr.wikipedia.org/wiki/Pi%C3%A9zo%C3%A9lectricit%C3%A9 il n'avait aucune idée de à quoi cela pourrait servir et ne savait pas quoi répondre lorsqu'on lui disait que ça n'aurait jamais aucune application. L'industrie de l'époque ayant besoin de courant énorme et non de μV.
          • [^] # Re: ...

            Posté par  . Évalué à 4.

            Je te remerci, maintenant je comprend un peu mieux. Je suis désolé mais je ne pense pas être le seul à avoir rien ou presque rien compris. Et s'il est interdit de poser des questions en plus.
            • [^] # Re: ...

              Posté par  . Évalué à 10.

              Il n'y a aucun mal à poser des questions, bien au contraire.

              Mais prétendre qu'ils perdaient leur temps parce que tu n'y voyais pas d'intérêt, c'était aller bien vite en besogne.
        • [^] # Re: ...

          Posté par  (Mastodon) . Évalué à 3.

          Ça ne t'empêchera pas de te faire inutiliser, mais si ça peut te rassurer, je suis aussi dubitatif sur l'intérêt de leur papier, après l'avoir lu rapidement. D'un autre côté, même s'ils n'ont rien trouvé de très surprenant, ils ne pouvaient pas le savoir avant d'avoir cherché.

          En tout cas j'ai un peu de mal à voir ce qui leur fait dire que Wikipedia "pourrait appartenir à une nouvelle classe de réseaux". À vue de nez, ça ressemble à un réseau social classique. En particulier, ils s'attendaient à ce que les relations entre trois articles dans Wikipedia ressemblent aux relations entre trois sites sur le Web, ou entre trois humains dans la vie... et ils trouvent que c'est le cas.
  • # J'en profite,

    Posté par  . Évalué à 8.

    pour poster un lien amusant : http://www.omnipelagos.com/
    c'est une page qui permet de trouver les liens entre 2 articles wikipedia, les résultats sont étonnants, souvent entre deux mots d'univers complètement différents il n'y a souvent que 3 ou 4 pages.

    Un autre : http://www.gamesforthebrain.com/game/wikitrivia/ c'est un quiz généré à partir des articles wikipedia
    • [^] # Re: J'en profite,

      Posté par  (Mastodon) . Évalué à 7.

      les résultats sont étonnants, souvent entre deux mots d'univers complètement différents il n'y a souvent que 3 ou 4 pages.

      Je me permet de préciser que c'est surprenant quand on n'a jamais été confronté à ce phénomène (dit "petit monde"), mais que c'est extrêmement courant dans les réseaux que l'on trouve dans la nature. Les gens qui travaillent sur des réseaux de ce type auraient été surpris que la distance entre deux articles soit en général plus grande, justement.

      Les exemples les plus connus du phénomène "petit monde":
      - Le nombre de Bacon: dans un réseau dont les n½uds sont des acteurs d'Hollywood et où deux n½uds sont relisés si ces acteurs ont tourné dans le même film, la distance entre un acteur quelconque et Kevin Bacon est appelée le nombre de Bacon. En général, le nombre de Bacon d'un acteur est 2 ou 3.

      - Le nombre d'Erdös: même idée, mais les n½uds du réseau sont des chercheurs, et deux chercheurs sont reliés s'ils ont signé une publication ensemble. http://www.oakland.edu/enp/

      - La plupart des réseaux biologiques semblent avoir la même propriété

      En règle générale, cette propriété apparaît dans les réseaux qui se forment par ajout successifs d'éléments, lorsque les éléments s'attachent de préférence aux éléments les plus connectés.
      • [^] # Re: J'en profite,

        Posté par  (Mastodon) . Évalué à 10.

        Je suis impardonnable, dans ma liste d'exemples, d'avoir oublié le plus intéressant: les réseaux de relations sexuelles sont aussi des petits mondes ;-)

        En dehors de l'aspect grivois de cette remarque, c'est intéressant pour une approche épidémiologique: si on trouve un vaccin contre le SIDA, il faut commencer par vacciner les gens qui couchent avec tout le monde, ce qui séparerait le réseau en petits bouts non reliés, et permettrait rapidement d'empêcher le virus de se répandre.
        • [^] # Re: J'en profite,

          Posté par  . Évalué à -5.

          "Vacciner ceux qui couchent avec tout le monde"
          Moui moui moui, vacciner les chauds lapins en priorité, on fait comment ?
          On vaccine dans la rue les nanas qui se balladent court vetues ?

          Et si ce vaccin a des effets secondaires , comme je ne sais pas , la stérilité , on rend stérile toutes les nanas un tant soit peu devetues du mollet dans la rue ?

          Ou on arrete d'y aller à la tete du client et on envoie en priorité ce vaccin en afrique et aux medecins urgentistes ?
          • [^] # Re: J'en profite,

            Posté par  (Mastodon) . Évalué à 4.

            vacciner les chauds lapins en priorité, on fait comment ?

            Et les sociologues qui ont construit les réseaux sociaux pour leurs études, ils ont fait comment ? [Indice: c'est leur métier]

            Ou on arrete d'y aller à la tete du client et on envoie en priorité ce vaccin en afrique et aux medecins urgentistes ?

            Et bien, partant du principe que ces vaccins ne seront pas tout de suite disponibles en quantité illimitée, il me semble qu'il peut être utile de savoir qu'à cause de la structure des réseaux sociaux, vacciner la population aléatoirement n'est pas efficace (jusqu'à un certain seuil), alors que vacciner quelques personnes ciblées est efficace.

            Évidemment, il s'agit de considérations techniques, et la vaccination sélective pose aussi des problèmes éthiques, mais je ne vois pas ce que ça retire à l'intérêt de l'observation. À moins que tu aies pensé que je préconisais d'envoyer l'armer vacciner les gens de force ?
            • [^] # Re: J'en profite,

              Posté par  . Évalué à -3.

              Ca ne réponds pas à ma question, comment veux tu désigner telle ou telle personne comme etant plus ciblée ou a risque qu'une autre ?

              Peut etre retrouver quelques relents mal-odorants des années 80 en décidant de considerer la population homosexuelle comme etant plus cilbée "SIDA"
              • [^] # Re: J'en profite,

                Posté par  (Mastodon) . Évalué à 7.

                Je n'ai pas parlé d'identifier les personnes les plus "à risque"... si je disais "il faut d'abord vacciner les personnes à risque", ce serait une évidence sans intérêt ni théorique ni pratique.

                Comme j'ai l'impression que le sujet fait vibrer une corde sensible chez toi, je vais le transposer dans le domaine informatique:
                - Imagine un réseau d'ordinateurs, et un nouveau virus.
                - Tu veux empêcher que le virus se répande, et pour ça tu dois agir vite, donc on va dire que tu as le temps d'appliquer des patches sur 1000 machines avant que le virus commence à se diffuser.

                Si tu ne sais rien sur ton réseau, tu n'as pas d'autre choix qu'appliquer les patches au hasard. Par contre, si tu sais que c'est un réseau de type scale-free et petit monde (comme le réseau Internet), tu sais que:

                - la plupart des ordinateurs sont très peu connectés, mais un petit nombre d'ordinateurs très connectés permettent d'atteindre n'importe quelle partie du réseau rapidement.

                Si tu sais cela, tu sais qu'en appliquant les patches sur le petit nombre d'ordinateurs très connectés, tu compliques énormément la vie du virus. Au lieu d'avoir une distance de 4 ou 5 vers n'importe quel point du réseau, il aura des distances beaucoup plus grandes, voire infinies.

                Ça n'a rien à voir avec le fait que ces ordinateurs très connectés soient plus en danger que les autres (même si c'est généralement vrai), ça a à voir avec le fait qu'en passant par ces ordinateurs, le virus a accès à tout le réseau rapidement.


                Bon, maintenant, revenons à notre réseau social. Des études ayant montré que le réseau des relations sexuelles a la même structure, si tu es dans la même situation et que tu disposes de 1000 vaccins, tu as intérêt à vacciner en priorité les gens qui font que ce réseau est un réseau petit monde, parce qu'en faisant ça tu bloques les routes de diffusion du virus.

                Vacciner les homosexuels n'a rien à voir: si tu vaccines un homo monogame, fidèle et timide, même en admettant qu'il soit plus exposé qu'un hétéro, ça ne bloquera pas le virus.

                Ensuite, identifier les "n½uds très connectés", ce n'est pas le boulot du théoricien, c'est un boulot qui revient à je ne sais pas trop qui, peut être les épidémiologues, peut-être les sociologues. Mais ce que dit la théorie, c'est que cette stratégie de vaccination, si tu peux la mettre en place, fonctionne.
                • [^] # Re: J'en profite,

                  Posté par  . Évalué à -1.

                  J'avais bien compris l'interet "pratique" de la chose.
                  C'est juste que tu admettra qu'il est tout de meme difficile éthiquement parlant de selectionner ces "routeurs".
                  Sur quel critères ? un questionnaire ? l'orientation sexuelle ? le style de vie , la religion ?

                  Tu te doutes bien qu'un pere de famille respectable et bien sous tout rapport n'ira pas se précipiter à la premiere vague de vaccination, combien meme il se taperais toutes les secrétaires stagiaires de son service.
                  De meme qu'une prostituée en situation irrégulière.

                  D'ailleurs tu penses bien qu'on ne songera pas à la proposer cette vaccination à ce bon chef de famille qui roule en 806 avec le siège bébé à l'arrière.

                  Par contre choppe n'importe quelle {gothique|lolita|raveuse|n importe quelle nana ayant un style de vie un peu décallé} et la plupart des gros cons s'accorderont à dire qu'étant une nymphomane en puissance , cette fille sera à vacciner en priorité.

                  Et l'adolescente un peu boulotte à cheveux gras un peu boutonneuse serait à exclure puisqu elle n'aurait *a priori* pas une sexualité hypertrophiée ?

                  C'est la que ca me gène; le choix des "routeurs" supposés pose vraiment trop de problemes ethiques et sociaux pour que tout ceci soit anodin.
                  • [^] # Re: J'en profite,

                    Posté par  (Mastodon) . Évalué à 8.

                    Sur quel critères ? un questionnaire ? l'orientation sexuelle ? le style de vie , la religion ?

                    Le critère est simple: avoir un degré élevé dans le graphe de relations sexuelles, ce que j'avais résumer par "coucher avec tout le monde". Que tu parles de religion m'intrigue au plus haut point.

                    Ensuite, les exemples de cas problématiques que tu donnes sont toujours des exemples où le détenteur du vaccin, donc le médecin, fait preuve de préjugés débiles. En principe, un médecin responsable et compétent ne supposerait pas que le chef de famille est monogame, que l'ado boutonneuse est vierge, et que la fille en mini-jupe est une salope. Toujours en principe, une campagne de vaccination sélective serait dirigée par des questionnaires effectués en aveugle, pour éviter justement les préjugés. Bref, je ne pense pas qu'on envisage de soumettre le choix des premiers vaccinés au vote du public par SMS.

                    Deuxième point: dans un raisonnement où le nombre de vaccins est limité, on n'a pas pour objectif de vacciner tous les "routeurs" ou de ne vacciner que les "routeurs". L'objectif est d'utiliser le peu de vaccins disponibles de manière efficace, mais pas forcément de manière optimale. Même dans un scénario imparfait où on manque des cibles importantes, il vaut toujours mieux viser les "routeurs" que viser au hasard.

                    le choix des "routeurs" supposés pose vraiment trop de problemes ethiques et sociaux pour que tout ceci soit anodin.

                    Déjà, à partir du moment où tu as moins de vaccins que d'individus, tu as un problème d'éthique assez gênant: il faut choisir à qui les donner. Le choix aléatoire est le seul équitable, mais s'il empêche de stopper l'épidémie, alors il est mauvais. Rien que pour ça, il faut s'intéresser à la question, il faut étudier les réseaux sociaux, la diffusion des virus. Il faut proposer des solutions théoriques, et ensuite se demander si on peut les mettre en pratique.

                    Maintenant, le problème social du tabou sur le sexe, c'est le problème qu'ont les sociologues pour faire une étude normale. C'est pour ça que j'y faisais référence plus haut, de manière un peu trop brève. Si les sociologues peuvent faire une étude fiable sur les réseaux de relations sexuelles, c'est parce qu'ils disposent des outils nécessaires, et on peut utiliser ces outils. Si un sociologue peut faire avouer à un type sous couvert d'anonymat qu'il couche avec toutes ses secrétaires, alors un épidémiologue peut le faire aussi.

                    Au final, je pense que le problème technique est négligeable, d'autant plus que si le manque de vaccins apparaît ce sera en Afrique, où des équipes médicales sont déployées depuis longtemps et effectuent déjà ce genre de travail. Si on veut, on peut globalement "viser juste". La décision finale est un problème d'éthique, et ce n'est pas aux scientifiques de décider. Leur boulot c'est de proposer des solutions viables, et la société en fait ce qu'elle veut.

                    (Pff, que j'ai tapé de texte ce soir... la prochaine fois je parlerai de canards sauvages qui ont la grippe, ça évitera les problèmes d'éthique, et ça aura exactement le même contenu scientifique =)
                    • [^] # Re: J'en profite,

                      Posté par  . Évalué à 1.

                      Joker pour la grippe aviaire et l'éthique.
                      Tu vaccines qui en premier , les canards à foie gras , peu nombreux mais qui valent tres chers.
                      Ou les poules fermieres, plus nombreuses, qui nourrissent les gens démunis à peu de frais avec leurs oeufs ? (mais qui rapportent moins)
                      (variable non déclarée: nombre de mois avant les fetes de fin d'année et leur lot de consommation de foie gras).
                  • [^] # Re: J'en profite,

                    Posté par  (Mastodon) . Évalué à 6.

                    Tiens, pour le fun, je te donne une méthode d'informaticien pour vacciner en priorité les routeurs. C'est très basique, très bête, et ça ne sera certainement jamais fait en pratique, mais ça marche:

                    1- Choisis un individu au hasard, et vaccine le en échange de la liste des gens avec qui il a couché jusqu'à présent. On ajoute ces gens à une liste L. Recommence une dizaine de fois pour initialiser l'algorithme.

                    2- Tant qu'il te reste des vaccins, choisir dans la liste L un des individus qui a été compté le plus grand nombre de fois, et vaccine le en échange de la liste des gens avec qui il a couché, que tu ajoutes à L.

                    (Bien sûr, on garantit à chaque individu qu'on ne divulguera pas la liste des gens avec qui il a couché, elle est juste utilisée pour construire la liste L.)

                    Les propriétés d'un réseau scale-free petit monde font que rapidement, tu vas avoir vacciné les sommets les plus connectés, parce que:
                    - comme tous les autres sommets, ils sont à une faible distance de n'importe quel autre,
                    - comme ils sont très connectés, ils seront vite comptés plusieurs fois dans L, et donc vite identifiés.

                    (Histoire de rendre à César ce qui lui appartient, c'est un algo que j'ai vu proposé par M. Lappe dans une thèse de bioinformatique que j'ai étudiée récemment, mais c'est tellement simple qu'on doit le retrouver un peu partout.)
        • [^] # Re: J'en profite,

          Posté par  (site web personnel) . Évalué à 2.

          Tu oublies aussi le plus grand : celui qui relie tous les hommes. Si mes souvenirs sont bons, il y a une conjecture selon laquelle on peut relier n'importe quelle paire d'humain en moins de 8 niveau, le critère de liaison étant simplement le fait de se connaître. Par contre je me souviens plus des hypothèses exactes. Si quelqu'un sait ça, j'ai pas retrouvé sur Google.
          • [^] # Re: J'en profite,

            Posté par  (Mastodon) . Évalué à 2.

            Au début où tout le monde parlait des graphes petit monde, un magazine (sûrement Pour la Science) avait publié un article de vulgarisation où ils prenaient comme exemple le réseau formé des humains reliés avec tous les gens dont ils ont un jour serré la main, c'est peut-être à celui là que tu penses.

            Ils devaient expliquer quelque chose du genre "on est tous à distance 3 de Chirac".
            • [^] # Re: J'en profite,

              Posté par  . Évalué à 10.

              >Ils devaient expliquer quelque chose du genre "on est tous à distance 3 de Chirac".

              Suffit de mettre sa main au cul d'une vache.
          • [^] # Re: J'en profite,

            Posté par  . Évalué à 1.

            Si je me souviens bien, le problème majeur de ces recherches (c'est Duncan Watts qui a lancé tout ça si mes souvenirs sont bons), c'est qu'on oublie de dire que tout le monde n'est pas connecté.

            En fait la première expérience commençait à donner un paquet à une personne X et lui dire que ça devait arriver à une personne Y inconnue de X. Pas le droit de rechercher sur Google, pages jaunes, etc. le seul moyen c'est de passer le paquet à une connaissance qui le passera à une connaissance, etc. Et de fait, beaucoup de paquets finissent par arriver. Mais ce beaucoup ça n'est jamais que 30% des paquets. On n'a que 30% de chaînes complètes, les autres s'arrêtent (flemme de la personne ? véritable non connectivité ?). La longueur moyennes des chaines complètes devait être de 6 ou 7 avec un écart-type relativement faible.

            Pour ceux que ça intéresse, les recherches continuent sur http://smallworld.columbia.edu/ Vous pouvez laisser votre mail si vous voulez être quelqu'un que quelqu'un d'autre cherchera à joindre ou initier vous-même une chaîne.
    • [^] # Re: J'en profite,

      Posté par  . Évalué à 3.

      http://www.omnipelagos.com/

      super interessant... domage que ca ne soit d'en anglais.
      je ne suis pas arrivé a faire plus de 6 "sauts"
      (exemple entre "Thermic reaction" et "toulouse")
      on lance un concours ? :)

      par contre j'ai trouvé deux elements sans connexion ("thermic reaction" et "queen")
      • [^] # Re: J'en profite,

        Posté par  (site web personnel, Mastodon) . Évalué à 1.

        Comique alors qu'il réussit à trouver 5 sauts entre "Lewis Trondheim" et "Tortoise (band)" (la distance est infinie dans l'autre sens), il ne trouve pas le 6ème saut qui irait à "TNT (album)". Et ce même en mettant les options qui vont bien (Look for more obscure path) ...

        Je suis sûre qu'en cherchant bien on doit trouver des chemins de 10 sauts. Il faudrait la db de wikipedia et un petit script python pour le découvrir.
      • [^] # Re: J'en profite,

        Posté par  . Évalué à 4.

        Moi aussi, j'ai trouvé des elements sans connexion :)

        No connections were found between "Nuclear" and "Elkasite".

        par contre j'ai trouvé deux elements sans connexion ("thermic reaction" et "queen")
        Jusqu'au jour où une drag queen s'appelle "thermic reaction". C'est un beau surnom pour un drag queen, non??!? ;)

        PS : je suis pas sur que ce commentaires soit du plus bel effet, j'en conviens...
        • [^] # Re: J'en profite,

          Posté par  . Évalué à 2.

          ouais, ok, j'ai pas été clair, le concours c'est de faire le plus de saut possible sans dépasser" (oui c'est comme au juste prix)
          et bien sur s'il y a plusieur chemin, on prends le plus court.

          (j'en ai plein plein des sans connexion)

          par contre j'ai trouvé un bug :
          entre "Ramesses" et "Mainframe computer" il y a un chemin (4 saut, c'est bof).
          dans la page "Mainframe computer" il y a un lien vers P"DP-11".
          mais quand je demande "Ramesses">>"PDP-11" il ne trouve pas

          WTF ?

          PS : le record du jour : 6 sauts (entre "hp48" et "suit")
          • [^] # Re: J'en profite,

            Posté par  . Évalué à 1.

            Bon, j'ajoute ma pierre a l'edifice avec un petit 8 entre fly et plate, en passant par Pierre Andre Latreille :)

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.