Statistiques 2012 du site LinuxFr.org

Posté par (page perso) . Édité par Florent Zara et Bruno Michel. Modéré par patrick_g. Licence CC by-sa
37
2
jan.
2013
LinuxFr.org

Ce début d'année est propice à un petit regard en arrière sur les douze derniers mois d'activité de LinuxFr.org ; bref l'occasion d'étudier l'évolution en termes de trafic web, de contenus créés, de commentaires déposés, de navigateurs utilisés, d'utilisation des fonctionnalités du site, etc. Qu'est-ce qui a changé et comment durant 2012 ?

Le site rend accessible un grand nombre de statistiques (faites-vous plaisir si vous souhaitez vous plonger dedans, c'est fait pour) ; cette dépêche résume les variations constatées en 2012.

Toute l'équipe du site vous souhaite une bonne année 2013 libre, ouverte et net ! Happy hacking. Happy GNU year!

Sommaire

Statistiques web

La comparaison des statistiques annuelles (voir 2011 et 2012) montre

  • globalement un bon premier semestre puis un second semestre en retrait ; au final toujours en hausse (+17%) en volume (ko), pour moins de visites (-7,6%) et de pages servies (-16%) ; une visite est comptée comme le retour d'une même adresse IP après un certain temps, 10 min pour LinuxFr.org (les clients RSS/Atom qui reviennent plus régulièrement abaissent donc le chiffre) ;
  • côté navigateurs (sur les mois de décembre), on constate que
    • ceux identifiés comme Mozilla/5.0 sont en forte hausse à 56% (contrairement à l'année dernière, et pourtant ça ratisse large en terme de navigateurs différents) ;
    • les moteurs de recherche sont moins présents (environ 8% à eux tous, avec une forte baisse côté GoogleBot) ;
    • MSIE 6.0 (propriétaire) revient dans le classement (argh !) avec 1%, soit plus que MSIE 7 et 8 (re-aargh !) et presqu'autant que MSIE 9 ;
    • Opéra 9.8 (propriétaire) est cette année encore en baisse.

Stats web 2012

Contenus

Le site comporte environ 85 000 contenus répartis ainsi :

  • 21 100 dépêches publiées
    • l'augmentation de plus 4 500 dépêches publiées durant 2012 s'explique par 3 419 dépêches de 1999 et 2000 remises en ligne en mai 2012 et 1 132 écrites et publiées sur les 12 mois ; ce dernier chiffre montre une forte hausse de dépêches publiées, avec le meilleur chiffre depuis 2004.
    • pour la première année depuis 2002, la taille moyenne des dépêches a légèrement réduit, ceci n'empêchant pas globalement le volume des dépêches d'avoir augmenté par rapport à l'année 2011 ;
    • le temps moyen passé entre la création d'une dépêche (en rédaction ou directement envoyée en modération) et sa modération/publication est de 120 heures (la mesure du temps passé uniquement en modération n'est pas actuellement disponible), le temps médian est de 8 heures. L'augmentation du nombre de dépêches collaboratives restant plus longtemps en rédaction explique l'augmentation de ces durées. Le pic de modération est le mercredi (globalement le jour de plus grande activité du site en général) ;
  • 33 000 journaux (le nombre de journaux publiés par an est en hausse, avec le meilleur chiffre depuis 2008) ;
  • 29 600 entrées de forum (le nombre d'entrées de forums publiées par an est stable) ;
  • 285 sondages (nouveau record de publication en 2012 avec 55 sondages) ;
  • 138 pages de wiki (chiffre stable).

Le jour de publication préféré des contenus reste le mercredi, et un jour de semaine compte deux tiers de publications en plus qu'un jour de week-end.

Nouvelle statistique ajoutée en 2012, concernant la publication sous licence Creative Commons ou non (#566) : 80% des dépêches et 67% des journaux ont été publiés sous CC By-Sa en 2012. Depuis mi-décembre et les 10 ans de CC, nous utilisons maintenant cette licence par défaut pour les dépêches, car elle permet explicitement une rédaction collaborative ou un renvoi en re-rédaction, et pour les journaux (qui peuvent être convertis en dépêche). La multiplication des dépêches collaboratives sur le site est une des grandes réussites de l'année 2012.

Commentaires

Le site comporte 1,4 million de commentaires. Le nombre de commentaires par an est en augmentation de 4% pour arriver à 110 000. Il y a désormais, en moyenne, 50 commentaires par journal (52 précédemment), 23 par dépêches (26 préc.), 64 par sondage (72 préc., mais très dépendant des sondages considérés), 7 par entrée de forum, 3 par entrée de suivi et 1 ou 2 par page wiki.

Notes

Il n'y a pas (encore) de statistiques disponibles concernant les notes.

Tags

Autre nouvelle statistique en 2012, celle concernant les tags (#706) :

  • 4 900 tags dont 4 850 tags publics
  • 51 000 saisies de tags (tagués en moyenne 10 fois pour les tags publics et 16 fois pour les tags privés)
  • les tags sont répartis ainsi par contenus :
    • 5 000 pour les journaux (3,3 par journal en moyenne) ;
    • 3 900 pour les dépêches (3,4 par dépêche en moyenne) ;
    • 1 900 pour les forums (1,5 par dépêche en moyenne) ;
    • 45 pour les sondages (0,8 par sondage en moyenne) ;
    • 22 pour le système de suivi des défauts/évolutions (ce nombre de tags ne représente que 7% du nombre d'entrées, donc il y en a rarement sur une entrée) ;
    • 16 pour les pages wiki (1 par page wiki).

Globalement les chiffres sont en baisse par rapport à 2011, sauf pour les forums où les tags sont plus de deux fois plus nombreux.

On peut aussi noter une autre particularité : le jour où le plus de tags sont apposés est le lundi (et non le milieu de semaine qui est le pic de publication des contenus).

Équipe de bénévoles

Il y a actuellement 5 admin web/système, 9 modérateurs et 2 relecteurs qui font tourner ce site.

Code et développement

Le système de suivi de défauts/demandes d'évolutions contient actuellement 146 entrées (contre 118 début 2012). En 2012, il y a eu 294 entrées (91 entrées encore ouvertes venant s'ajouter aux 55 datant d'avant, 122 corrigées et 81 déclarées invalides). On peut remarquer ceux qui ouvrent le plus d'entrées sont des membres de l'équipe de modération (les 6 premières places).

C'est Bruno qui de loin a le plus corrigé d'entrées. Le temps moyen de résolution est de 45 jours. La moitié des entrées fermées ont été traitées en moins de 6 jours. Ces deux durées ont doublé en 2012, signe d'un besoin de nouveaux contributeurs côté code.

Actuellement, Ohloh évalue le code du site comme étant à 58% Ruby, 15% HTML, 11% Javascript, 10% HAML et 6% divers. Les 14 000 lignes de code sont évaluées à 3 hommes.an et 172 k$ (environ 133 k€). Ces statistiques ne concernent que le dépôt git principal, pas ceux des scripts d'administration, bibliothèques extraites de LinuxFr.org (french-rails, HTML truncator et HTML spellchecker) ou des daemons (board, share et img) : on atteindrait alors les 20 000 lignes de code avec eux.

La charge moyenne sur le serveur est de 0,36 (contre 1,6 en 2011) sur la machine actuelle (baptisée gruik). La charge minimale a été de 0,16 et la maximale de 4,5 (un mauvais jour aux alentours de la semaine 27 visiblement).

Comptes utilisateurs

En février 2012 a eu lieu un grand nettoyage dans les comptes utilisateur : 33 000 comptes fermés et 17 550 comptes supprimés.

Sur les 27 100 comptes utilisateur valides existant, 3 769 ont été utilisés au cours des 3 derniers mois (31% ont déjà rédigé des dépêches, 36% des journaux, 33% des entrées de forums, 7% des entrées dans le système de suivi, tous ces chiffres étant assez stables en comparaison avec 2011). 81% ont écrit des commentaires et 24% tagué des contenus. 28% des comptes actifs ont indiqué un site personnel, 14% un identifiant Jabber, 18% un avatar (en hausse) et 4% une signature.

Côté utilisation des fonctionnalités, 2% ont demandé à ne pas voir les signatures et 5% à ne pas voir les avatars (chiffres stables), et à peine quelques pourcents ont changé les contenus par défaut en page d'accueil. Peu de CSS/apparences du site sont utilisées : les trois quarts des visiteurs utilise celle par défaut ; il est facile d'en changer avec le lien Changer de style.

  • # Merci

    Posté par (page perso) . Évalué à  5 .

    Merci pour ces statistiques et l'analyse qui va avec. C'est toujours instructif :-)

    Bonne année à toutes et à tous !

  • # Quid des statistiques qualitatifs ?

    Posté par . Évalué à  8 .

    Ce serait intéressant de faire une revue statistiques de la qualité des journaux publiés (selon le nombre de votes reçu ).

    • Combien de journaux ont obtenu de scores positifs, au dessus de la moyenne en douze mois, en 6 mois, 3 et 1 mois ?

    • Quels sont les types de sujets abordés sous quels angles (technique , juridique, politique … ) ?

    Ce genre d'observation pourrait nous apprendre des choses qui nous sont passé inaperçus , noyés dans la quantité et la quotidiennetée

    • [^] # Re: Quid des statistiques qualitatifs ?

      Posté par (page perso) . Évalué à  9 .

      (ça ne serait qu'une analyse qualitative des journaux vu les questions posées)

      Combien de journaux ont obtenu de scores positifs, au dessus de la moyenne en douze mois, en 6 mois, 3 et 1 mois ?

      1503 journaux en 2012. 1279 à note strictement positive, 12 à note nulle et 212 à note strictement négative.

      Premier semestre 2012 : 655 positifs, 8 nuls, 110 négatifs (total 773). Score moyen 14 (écart-type 23). Au-dessus 374, en dessous 372

      Second semestre 2012 : 624 positifs, 4 nuls, 102 négatifs (total 730) . Score moyen 15 (écart-type 28). Au-dessus 401, en dessous 372.

      On reste sur aux alentours de 85% de positifs, 1% de nuls, 14% de négatifs. Avec un score moyen de 14,5 et un écart-type de 25 (donc des scores très étalés), 52% au dessus et 48% en dessous.

      Quels sont les types de sujets abordés sous quels angles (technique , juridique, politique … ) ?

      Hum, difficile sauf si quelques uns se motivent pour les tagguer…

      • [^] # Re: Quid des statistiques qualitatifs ?

        Posté par . Évalué à  3 .

        Merci de ces chiffres, ca permet de se faire une idée plus concrètes.

        Ce serait pas mal de pouvoir ajouter un conteneur de type "angle abordée". Par exemple sujet politique abordée sous l'angle technique (par exemple les mécanismes de fonctionnement technique du "Trusted Computing" ).

  • # Statistiques d'utilisations des coincoins sur dlfp

    Posté par (page perso) . Évalué à  9 .

    Pour compléter cette dépêche fort intéressante, voici un résumé de l'activité enregistrée par les clients de type coincoin sur le site.
    Ces graphiques sont réalisés à partir des statistiques webalizer du site, pour les coincoins apparaissant dans le top 15 des user-agents.

    Hits coincoin sur dlfp

    Pour ne pas surcharger ce commentaire, voici d'autres graphiques complémentaires sous forme de liens.

    Ce que l'on peut constater, c'est que si le nombre de hits global sur linuxfr est en décroissance, les hits des coincoins sont globalement stables, et donc leur part en % des user-agent suit mécaniquement une pente croissante. La déduction qui s'impose est que les moules forment une base d'utilisateurs très fidèle au site, lors que le reste de la communauté tend à se montrer déficiente (dans la mesure où le nombre de hits est représentatif de cette fidélité, ce qui n'est pas forcément tout à fait exact).

    • [^] # Re: Statistiques d'utilisations des coincoins sur dlfp

      Posté par (page perso) . Évalué à  5 .

      L'étrange manque de visibilité (aucun lien visible) de cet espace de débat qui a permis l'incubation de nombreux contenus de qualité est sans doute en cause.

      Newton Adventure est sur Lumière Verte : http://steamcommunity.com/sharedfiles/filedetails/?id=187107465

    • [^] # Re: Statistiques d'utilisations des coincoins sur dlfp

      Posté par (page perso) . Évalué à  4 .

      Ce qu'on peut surtout constater, c'est que gcoincoin ne fait toujours pas le moindre hit.
      Mais pourquoi donc??

    • [^] # Re: Statistiques d'utilisations des coincoins sur dlfp

      Posté par (page perso) . Évalué à  9 . Dernière modification : le 02/01/13 à 13:32

      La déduction qui s'impose est que les moules forment une base d'utilisateurs très fidèle au site, lors que le reste de la communauté tend à se montrer déficiente (dans la mesure où le nombre de hits est représentatif de cette fidélité, ce qui n'est pas forcément tout à fait exact).

      Les utilisateurs de coincoins utilisent le site en direct et à chaque fois, contrairement à des visiteurs qui le lisent indirectement via un autre moyen (par exemple flux Atom depuis un site d'agrégation), et ils le font très fréquemment (rafraîchissement du client). C'est difficile d'en tirer une conclusion en terme d'utilisateurs différents fréquentant la tribune.

      Ensuite, avant de parler de fidélité et de déficience, on pourrait se demander si les utilisateurs fréquentant la tribune sont uniquement des lecteurs ou aussi des contributeurs en terme de commentaires et/ou de contenus. A priori c'est difficile à dire, il y a probablement les auteurs des pires journaux en terme de notes, et aussi des auteurs de très bons contenus. Et il n'y a pas de données facilement utilisables pour analyser cela.

      Enfin on pourrait se demander la pertinence d'opposer les utilisateurs de la tribune aux autres visiteurs du site. J'y perçois, à tort ou à raison, un comportement grégaire des premiers et je ne vois pas d'intérêt particulier à creuser la question en fait.

      P.s. : et c'est une bonne idée d'avoir réalisé ce graphique, j'ai pensé à sortir les données sur les coincoins en écrivant la dépêche et ensuite j'ai zappé. Merci de l'avoir fait.

  • # Commentaire supprimé

    Posté par (page perso) . Évalué à  0 . Dernière modification : le 08/01/13 à 00:26

    Ce commentaire a été supprimé par l'équipe de modération.

  • # Commentaire supprimé

    Posté par (page perso) . Évalué à  1 . Dernière modification : le 08/01/13 à 00:27

    Ce commentaire a été supprimé par l'équipe de modération.

  • # Opera

    Posté par (page perso) . Évalué à  2 .

    Heu je crois qu'Opera 9.8 n'existe pas (jamais vu cette version) et les version 9.x datent déjà de quelques années, donc ça me paraît bizarre, votre truc de stats ne doit pas détecter correctement.

    « Je vois bien à quels excès peut conduire une démocratie d'opinion débridée, je le vis tous les jours. » (Nicolas Sarkozy)

Suivre le flux des commentaires

Note : les commentaires appartiennent à ceux qui les ont postés. Nous n'en sommes pas responsables.