Statistiques sur le site

Posté par (page perso) . Modéré par Nÿco.
Tags :
0
20
nov.
2006
LinuxFr.org
Suite à un journal de Krunch sur l'analyse du réseau social du site LinuxFr.org, nous avons rendu public le graphe anonymé des échanges entre les utilisateurs du site. Ces données peuvent servir à analyser le fonctionnement et l'évolution de la communauté des visiteurs (de ceux authentifiés au moins) et nous sommes preneurs de toute analyse sur le sujet.

Bien évidemment nous prenons en compte les problèmes de vie privée et de données personnelles, c'est pourquoi nous avons anonymé ces données concernant actuellement plus de 760.000 commentaires.

La page de statistiques comprend maintenant des données sur :
  • les accès web
  • la fréquentation
  • le système de suivi
  • les utilisateurs
  • la modération
  • les principaux contributeurs
  • la charge serveur
  • le graphe anonymé des commentaires échangés entre les utilisateurs (au format Graphviz .dot)

Aller plus loin

  • # anonymat mitigé

    Posté par (page perso) . Évalué à 6.

    À noter qu'il est sans doute possible de « désanonymiser » la plupart des identifiants en effectuant une analyse parallèle avec un web crawler. Cependant je ne suis pas convaincu que cela consiste vraiment en une atteinte à la vie privée.

    pertinent adj. Approprié : qui se rapporte exactement à ce dont il est question.

    • [^] # Re: anonymat mitigé

      Posté par (page perso) . Évalué à 8.

      En même temps ré-extraire les centaines de milliers de commentaires via le web, ce n'est pas désanonymiser les données en question, c'est (tenter d')obtenir les mêmes données par une autre voie (avec un éventuel abus de ressources et un éventuel souci au niveau de la législation sur les bases de données). Sans parler du fait que ce n'est pas les données d'une personne qui sont intéressantes à mon avis, mais bien l'ensemble de données, collectivement.
      • [^] # Re: anonymat mitigé

        Posté par (page perso) . Évalué à 3.

        Je pense qu'en n'extrayant qu'une partie des données on peut inférer une approximation du reste et de là faire la correspondance avec les données exactes anonymisées. Donc si c'est possible, c'est bien de la désanonymisation des statistiques données.

        J'essairais bien de le faire mais j'ai pas trop le temps pour le moment (sans compter que je suis très fénéant et nul en math/stats).

        pertinent adj. Approprié : qui se rapporte exactement à ce dont il est question.

  • # Mais euh

    Posté par . Évalué à 6.

    Anonymé, ça perd beaucoup de son intérêt... ;-)
    • [^] # Re: Mais euh

      Posté par (page perso) . Évalué à 7.

      On peut faire de toi un cas d'étude si tu le souhaites. ;-)
      • [^] # Re: Mais euh

        Posté par (page perso) . Évalué à 4.

        Une case à cocher dans le profil « [ ] je ne souhaite pas être anonymisé dans le graphe de relations ». Évidemment ça rend encore plus aisé l'identification des personnes qui ne cochent pas la case.

        pertinent adj. Approprié : qui se rapporte exactement à ce dont il est question.

      • [^] # Re: Mais euh

        Posté par . Évalué à 5.

        En même temps, avoir mes relations avec des gens anonymes, ce ne sera pas très utile. On devrait pouvoir voir notre numéro dans notre profil, comme ça on pourrait regarder nos relations avec nos connaissances ;-)
  • # DLFP is dying

    Posté par (page perso) . Évalué à 3.

    [:totoz] On va tous mourir !!!
    Les moules et les enfants d'abord !

    L'association LinuxFr ne saurait être tenue responsable des propos légalement repréhensibles ou faisant allusion à l'évêque de Rome, au chef de l'Église catholique romaine ou au chef temporel de l'État du Vatican et se trouvant dans ce commentaire

  • # Format

    Posté par . Évalué à 7.

    Ca serais cool d'avoir le graph au forma jpg, png ou que sais-je encore...
    http://www.graphviz.org/doc/info/output.html

    Je dois ouvrir un tracker ?
    • [^] # Re: Format

      Posté par (page perso) . Évalué à 6.

      Un graph de 351 705 liens semble impossible à représenter en pratique. Si tu lances graphviz là dessus tu en as pour quelques centaines d'années pour générer un png qu'aucun programme ne saura ouvrir. L'idée c'est plutôt d'en extraire des sous graphes représentables (par exemple les 50 plus gros liens), calculer la moyenne de la largeur des liens, le degré de séparation moyen entre chaque couple d'utilisateurs de DLFP,...

      Je générerai p-ê quelques graphes et statistiques dans le genre dans la semaine si personne ne l'a fait entretemps.

      pertinent adj. Approprié : qui se rapporte exactement à ce dont il est question.

      • [^] # Re: Format

        Posté par . Évalué à 3.

        Je proteste, je suis sur que dans quelques centaines d'années, un programme saura certainement ouvrir un png représentant 351705 liens. Avec les 10000 pouces du future et les gogol octets de ram, ça devrait passer.
        • [^] # Re: Format

          Posté par (page perso) . Évalué à 4.

          Dans quelques centaines d'années plus aucune machine ne saura ouvrir un PNG quel que soit sa taille.

          pertinent adj. Approprié : qui se rapporte exactement à ce dont il est question.

      • [^] # Re: Format

        Posté par (page perso) . Évalué à 4.

        Il y a un outil pour selectionner des sous graphes ?
        Ou alors faut faire ca au pifometre?
        Parce que bon ...
        • [^] # Re: Format

          Posté par (page perso) . Évalué à 3.

          (e)Grep marche bien si tu veux juste récupérer les arcs ayant un poids supérieur à X.

          Par exemple :
          $ grep -vE "label = \"[0-7]\"" comments.dot
        • [^] # awk

          Posté par (page perso) . Évalué à 3.

          Par exemple
          $ awk -F'"' '$6 > 42'
          pour ne récupérer que les liens qui ont une largeur supérieure à 42.

          pertinent adj. Approprié : qui se rapporte exactement à ce dont il est question.

          • [^] # Re: awk

            Posté par (page perso) . Évalué à 3.

            Moui, mais moi je voudrais de beau graphes (avec beaucoup de relation etc .. )
            La, j'ai un peu peur que ca fasse des trous ... (quoique je doute) ...
  • # Pajek

    Posté par . Évalué à 2.

    Pour ceux qui sont intéressé par l'analyse de réseaux. Je leur conseil chaleureusement Pajek. http://vlado.fmf.uni-lj.si/pub/networks/pajek/
    (OK, c'est pas libre, mais c'est gratuit pour usage non commercial).

    Pajek et compagnie permettent (outre les calculs statistiques propres au réseaux) de dessiner les vertex selon leurs proximités (nombre de commentaire échanger).
  • # Score karmique ?

    Posté par (page perso) . Évalué à 9.

    Sur la page http://linuxfr.org/stats/utilisateurs.html , ca parle de score karmique tout a la fin, et je voudrais bien savoir comment savoir quel est son propre score karmique.

    Par exemple, je suppose qu'il y a une bijection entre le nombre de votes par jour et son score karmique, mais laquelle ?
    • [^] # Re: Score karmique ?

      Posté par . Évalué à 9.

      Les XPs n'existent pas.
      • [^] # Re: Score karmique ?

        Posté par . Évalué à 4.

        Comme la cabale ;-)

        P.S. je sors par la fenêtre, je sens que la porte risque d'étre occupée.
    • [^] # Re: Score karmique ?

      Posté par . Évalué à 3.

      J'ai compris ce score comme étant la note initiale d'un commentaire.
      Me gouré-je ?
      • [^] # Re: Score karmique ?

        Posté par (page perso) . Évalué à 5.

        Non c'est pas ça. La note initiale d'un commentaire est comprise entre -2 et 2. Et là les scores karmiques sont entre -1 et 5, donc je pense plutôt qu'ils sont en relation avec les XP, et donc le nombre de votes par jour.
        • [^] # Re: Score karmique ?

          Posté par (page perso) . Évalué à 6.

          Et bien tu te trompes :-)

          Il s'agit de la moyenne des commentaires récents. C'est ce qui sert à determiner le score initial des commentaires en dépassant pas -2 et +2 (donc les quelques personnes avec une moyenne supérieure à 2 postent à 2).

          Ca rentre aussi en compte dans l'évolution des XP mais ce n'est pas le seul facteur.

          Le nombre de votes par jour lui est quasiment directement déduit des XP (sauf cas particuliers, genre quelqu'un qui n'a pas participé dernièrement ou qui a voté trop pour la même personne la veille).
          • [^] # Re: Score karmique ?

            Posté par (page perso) . Évalué à 0.

            Je pense qu'on est au contraire bien d'accord.

            La note initiale d'un commentaire, n'a rien a voir avec le score karmique, mais plutot à la moyenne des derniers commentaires (limité a un intervale [-2; 2], comme tu l'as précisé.

            Par contre, je supose que le score karmique est directement lié aux XP, et donc aux nombre de votes par jour.

            Mais tu ne reponds cependant pas a ma question initiale, qui est :
            Quel est la relation exacte entre le nombre de votes par jour, et son score karmique.

            Par exemple je pense que pour un score karmique de 5 on a un certain nombre de votes par jour (40 ou 50 par exemple).
    • [^] # Re: Score karmique ?

      Posté par (page perso) . Évalué à 8.

      C'est calculé grâce à une constante...42...le mode de calcul lui étant aléatoire.
  • # M'houai...

    Posté par . Évalué à -2.

    Le but est clair.

    1) l'annonce de cette "collaboration" a lieu peu avant la sortie de MS Vista. Devant la poussée Linux, il fallait faire preuve de bon vouloir devant un Waterloo annoncé.

    2) Plus personnellement, je me souviens du malaise que m'a laissé le rachat de SuSe par Novell ainsi que de Ximian. Avec à la clé la publication de certain logiciel "fermé" en GPL. Cela me semblait très précipité et me laissait un arrière goût assez amère. Parce que n'est pas Sun ou IBM qui veut.

    3) mono qui "peu" clairement faire obstacle à MS et sur lequel, peut-être, MS peu faire pression.

    Donc à long terme, et selon les déclaration que l'on peut lire un peu partout , et celle de Balmer ne laisse place à aucun doute, il s'agit bien d'une manoeuvre d'abord promotionelle grâce à un effet d'annonce, mais surtout d'une stratégie à plus long terme. Quelqu'un a parler de cheval de Troie. : c'est exactement cela.

    La bonne nouvelle est que Sun libère Java en réaction, et pour cause ! Et là, il n'y a pas photo
    • [^] # Re: M'houai...

      Posté par . Évalué à 5.

      Finalement on le sait, on peut poster à travers un trou noir \o/
  • # Whouarg !!!

    Posté par . Évalué à 10.

    Purée : social et linuxfr.org à côté, ça fait un choc ! Faut prévenir la prochaine fois !
  • # Toolbar....

    Posté par . Évalué à 2.

    Salut
    C'est quoi la toolbar ?
    J'ai beau cocher et décocher la case dans mes préférences, je ne vois rien de plus ou de moins ....
    David.
    • [^] # Re: Toolbar....

      Posté par . Évalué à 4.

      C'est ma barre auto-masquée en bas de la fenêtre sur les pages de commentaires, qui permet entre autres de naviguer d'un commentaire à l'autre.

      D'ailleurs, chez moi elle cause de gros bugs d'affichage quand je scrolle. Je n'ai pas réussi à savoir si c'était Firefox, Xorg ou les deux ;)
      • [^] # Re: Toolbar....

        Posté par . Évalué à 2.

        C'est Firefox + Xorg + Composite + peut-être un autre truc.

        Essaie en désactivant Composite.
        • [^] # Re: Toolbar....

          Posté par . Évalué à 1.

          Ca me le faisait avec Compiz sous Sid. Je rejoins l'avis de Lucas, c'est surement l'extension Composite qui cause ce problème.
          • [^] # Re: Toolbar....

            Posté par (page perso) . Évalué à 3.

            Ce n'est pas la toolbar qui cause ce problème d'ailleurs, mais son style. Suffit d'utiliser une css personalisée (ce que la toolbar te propose) et hop :-)
  • # Karma ?

    Posté par . Évalué à 5.

    Où peut-on connaître son Karma ? (sur DFLP)
    • [^] # Re: Karma ?

      Posté par (page perso) . Évalué à 4.

      Si tu t'interressais aux explications de pascal, le score karmique, c'est la moyenne des derniers commentaires qui sert a determiner la note de tes futurs commentaires si j'ai bien suivi.
      • [^] # Re: Karma ?

        Posté par . Évalué à 2.

        Les combien derniers commentaires ? Ca doit pas être très compliqué à déterminer en regardant ses notes, mais comme j'ai pas des masses de commentaires à mon actif...
        • [^] # Re: Karma ?

          Posté par . Évalué à 3.

          c'est plus compliquer que tu ne le penses :-)

          Il me semble que la date d'un commentaire intervient aussi dans le calcul.

          chrisix< dans pycoincoin ( http://chrisix.free.fr/dotclear/ ) a un module qui calcul la moyenne, mais elle n'est pas la même que le score interne de DLFP. (Les voies de templeet sont impénétrable :-) )
          • [^] # Re: Karma ?

            Posté par . Évalué à 2.

            Ah vi... Ah bah j'avais pas pensé que la date pouvait intervenir ! Merci pour la précision.
            Les voies de templeet sont impénétrable :-)

            Quoi ?!?!?! Templeet n'est pas open source ?!?!?
  • # Charge du serveur ?

    Posté par . Évalué à 2.

    Quel outil avez vous utilisé pour obtenir le graph sur la charge du serveur ?

    merci d'avance..

    febo
    • [^] # Re: Charge du serveur ?

      Posté par . Évalué à 4.

      C'est marqué sur la droite du graphique : rrdtool :)

      Après y'a peut être une couche plus user-friendly par dessus (cacti, etc.)

Suivre le flux des commentaires

Note : les commentaires appartiennent à ceux qui les ont postés. Nous n'en sommes pas responsables.