Statistiques 2019 du site LinuxFr.org

Posté par  (site web personnel) . Édité par Davy Defaud, ZeroHeure et Nils Ratusznik. Modéré par ZeroHeure. Licence CC By‑SA.
35
3
jan.
2020
LinuxFr.org

En ce début d’année 2020, commençons par deux marronniers de saison : d’abord, bonne année à tous, meilleurs vœux, écrivez de belles dépêches en 2020, partagez et contribuez. Et ensuite, un petit regard en arrière sur les douze mois d’activité de LinuxFr.org en 2019 : quelles évolutions en termes de trafic Web, de contenus créés, de commentaires déposés, de navigateurs utilisés, d’utilisation des fonctionnalités du site, de contribution au code, etc. Bref, qu’est‐ce qui a changé et comment durant 2019 ?

Le site rend accessible un grand nombre de statistiques (faites‑vous plaisir si vous souhaitez vous plonger dedans, c’est fait pour) ; cette dépêche résume les variations constatées en 2019.

Sommaire

Statistiques Web

La comparaison des statistiques annuelles (voir 2018 et 2019) montre une baisse des visites et des consultations (pages, fichiers, hits), avec un passage à ~878 000 hits par jour et ~40 000 visites par jour, le tout pour ~1,5 Tio par mois (ça ça augmente toujours d’année en année).

Statistiques Web 2019

Le nombre de contenus publiés en un an remonte, mais à cause des liens et des entrées de forums (les autres contenus étant en baisse). Le nombre de commentaires publiés en un an augmente aussi (de 15 %).

Trafic de LinuxFr.org normalisé, entre 2002 et 2019

Contenus

Au 31 décembre 2019, le site comportait environ 104 941 contenus répartis ainsi :

  • 25 808 dépêches publiées :
    • 444 dépêches publiées en 2019 (en baisse par rapport à 2018 mais au‑dessus du minimum historique de 2017),
    • la taille moyenne (en code Markdown, hors images donc) des dépêches a encore augmenté de 8 % (une partie de l’explication vient des dépêches hebdomadaires tirées de l’Agenda du Libre) ;
  • 38 161 journaux (en baisse de 6 % par rapport à 2018) ;
  • 37 547 entrées de forum (en hausse de 6 % par rapport à 2018) ;
  • 422 sondages (quatorze publiés dans l’année, soit trois de moins qu’en 2018) ;
  • 146 pages de wiki (une petite vingtaine de tutoriels publiés en 2019) ;
  • 987 liens (le nouveau type de contenus apparus en mars 2018 connaît la plus forte hausse).

Changement cette année, le pic de publication des contenus devient le mardi (talonné par le mecredi), ce qui est une inversion par rapport aux années précédentes. À noter que ça correspond désormais au pic de modération aussi, voir la partie Modération plus bas).

Le pic de publication des contenus reste le mercredi (talonné par le mardi) sur l’ensemble des contenus (mais on note une différence entre les contenus modérés a priori et les autres, voir la partie Modération plus bas). Un jour de semaine compte 70 % de publications en plus qu’un jour de week‐end (chiffre stable par rapport à 2018).

La publication sous licence Creative Commons By-SA se fait par défaut depuis les dix ans de CC, fin 2012 pour les dépêches (permet explicitement une rédaction collaborative ou un renvoi en re‐rédaction) et les journaux (qui peuvent être convertis en dépêche) : tout naturellement, on retrouve 97 % de dépêches et 96 % des journaux sous cette licence au final (les autres étant notamment sous licence Art Libre ou autres, au choix de l’auteur).

Les dépêches collaboratives sont toujours aussi nombreuses sur de multiples sujets, vraies réussites du site ; nous sommes cependant toujours à la recherche de volontaires pour couvrir les nombreux sujets qui n’ont pu être abordés. Une liste des thèmes récurrents sur LinuxFr.org peut donner des idées de participation : si une dépêche n’a pas été créée dans les temps, tout inscrit peut la démarrer dans l’espace de rédaction.

Modération

Le temps moyen passé entre la création d’une dépêche (en rédaction ou directement envoyée en modération) et sa modération et publication est de 265 heures (contre 1007 h en 2018 et 696 h en 2017) ; la mesure du temps passé uniquement en modération n’est pas actuellement disponible (et la modération retient volontairement des dépêches non urgentes pour réguler la publication) ; le temps médian est toujours de 15 heures. Il y a des demandes de statistiques dans le suivi, envoyez les demandes d’intégration Git (pull‐requests). ;-)

Le jour de modération a priori des contenus est toujours le mardi pour les dépêches et le lundi pour les sondages.

Les nombres d’interdictions de tribune et d’interdictions de poster des commentaires (pour une durée de un ou deux jours, une semaine ou un mois) sont en augmentation, mais restent très faibles à l’échelle du site (respectivement 66 et 77 fois), utilisées surtout comme restrictions immédiates sur les spammeurs, en attendant la purge du compte fautif par un admin.

Commentaires

Au 31 décembre 2019, le site comporte 1,78 million de commentaires. Le nombre de commentaires par an est en hausse de 15% (après 6 années consécutives de baisse) pour arriver à 37 399.

Il y a désormais, en moyenne, 36 commentaires par journal (29 en 2018 et 36 en 2017), 16 par dépêches (15 en 2018 et 17 en 2017), 60 par sondage (40 précédemment, mais très dépendant des sondages considérés), 8 par entrée de forum (7 en 2018 et 2 précédemment), 3 par entrée de suivi, 3 par lien et une poignée par page wiki.

Le jour préféré pour commenter reste le mercredi, et un jour de semaine compte deux fois plus de commentaires qu’un jour de week‐end.

Notes

Il n’y a (toujours) pas de statistiques disponibles concernant les notes. Les entrées de suivi sur les statistiques ont trop peu avancé en 2019.

Néanmoins sur les trois derniers mois :

  • 8 015 commentaires notés « pertinents » par 1 079 visiteurs différents ;
  • 3 613 commentaires notés « inutiles » par 693 visiteurs différents ;
  • parmi lesquels 3 083 commentaires les deux ;
  • un total de 34 807 notes « pertinent » et 13 676 « inutile » sur les commentaires ;
  • 629 visiteurs différents ont utilisé au moins « pertinent » et « inutile » sur les commentaires ;
  • 12 953 contenus notés par 950 visiteurs différents, avec 10 720 « pertinents » et 2 233 « inutiles ».

Étiquettes (tags)

  • 11 675 étiquettes, dont 11 120 étiquettes publiques ;
  • 98 491 saisies d’étiquettes (étiquetées en moyenne huit fois pour les étiquettes publiques et six fois pour les étiquettes privées) ;
  • les étiquettes sont réparties ainsi par contenu :
    • 48 150 pour les dépêches,
    • 31 150 pour les journaux,
    • 14 850 pour les forums,
    • 3 100 pour les liens,
    • 740 pour les pages wiki,
    • 280 pour les sondages,
    • 220 pour le système de suivi des défauts et évolutions.

Depuis le début du site, on constate en moyenne 5 étiquettes par page wiki, 3 par lien, 1,9 par dépêche, 0,8 par journal, 0,7 par sondage, 0,4 par entrée de forum et 0,1 par entrée du suivi.

On peut aussi noter une autre particularité : le jour où le plus d’étiquettes sont apposées est le lundi (et non le mardi et le mercredi, qui constituent le pic de publication des contenus et des commentaires).

Équipe de bénévoles

Il y a actuellement 6 admins Web/système (départ de Lucas Bonnet), 14 modérateurs (+3, bienvenue à devnewton, Ysabeau, gUI, Arkem et ted, et départs de tuiu pol et Ontologia) et 6 animateurs de l’espace de rédaction (-1, arrivée d’antistress et départs d’ariasuni et Jiehong) qui font tourner ce site. Pour mémoire, il s’agit de bénévoles plus ou moins disponibles et donc absolument pas de 24 équivalents temps plein pour jargonner comme une entreprise. Merci pour le travail accompli.

Code et développement

Au 31 décembre 2019, le système de suivi de défauts et de demandes d’évolutions contient 166 entrées (contre 142 en 2018). On voit assez rapidement un manque de développeurs apparaître. En 2019, il y a eu 60 entrées ouvertes (contre 69 en 2018) : 34 entrées encore ouvertes venant s’ajouter à celles datant d’avant, 15 corrigées et 11 déclarées invalides). On peut noter que ceux qui ouvrent le plus d’entrées sont des membres actuels ou anciens de l’équipe du site.

C’est Bruno qui, de loin, a corrigé le plus d’entrées. Merci aussi à Adrien Dorsaz. Le temps moyen de résolution est de 115 jours (contre 112 précédemment), encore en hausse. La moitié des entrées fermées ont été traitées en moins de sept jours. On ressent donc toujours un besoin de nouveaux contributeurs côté code.

La charge moyenne sur le serveur est de 1,1 (contre 1,8 en 2018) sur la machine actuelle (baptisée gruik). La charge minimale a été de 0,7 et la maximale de 2,6.

La consommation mémoire a diminué courant janvier‐février puis est restée stable sur la partie de l’année sur laquelle ces statistiques existent. Le trafic réseau sur la partie Web est en moyenne de 6 Mbit/s sortants (contre 5,6 précédemment) pour 550 kbit/s entrants (contre 535 précédemment), avec des pics à deux et demi fois ces valeurs). Le trafic réseau total est en moyenne de 8,7 Mbit/s sortants (contre 7,1 précédemment) pour 607 kbit/s entrants (=), avec des pics à 19 Mbit/s sortants.

Comptes utilisateur

Au 31 décembre 2019, sur les 50 436 comptes utilisateur valides existants, 2 522 ont été utilisés au cours des trois derniers mois, dont 33 % (=) ont déjà rédigé des dépêches, 39 % (+1) des journaux, 38 % (=) des entrées de forums, 9 % (-1) des entrées dans le système de suivi, 7 % des liens et 2 % une page de wiki ; 80 % (+1 point) ont écrit des commentaires et 42 % étiqueté des contenus (=) ; 24 % (-1) des comptes actifs ont indiqué un site personnel, 10 % (-1) un identifiant XMPP, 25 % (+2 points) un avatar et 5 % (=) une signature.

Côté utilisation des fonctionnalités, 3 % ont demandé à ne pas voir les signatures, 5 % à ne pas voir les avatars et 8 % avec le tri chronologique en page d’accueil (chiffres stables) et à peine quelques pourcents ont changé les contenus par défaut en page d’accueil (souvent pour retirer les sondages et ajouter les journaux). Peu de feuilles de style CSS du site sont utilisées : presque quatre visiteurs sur cinq utilisent celle par défaut ; il est facile d’en changer avec le lien Changer de style.

Une quinzaine de comptes ont un karma négatif, soit 0 % des visiteurs actifs ; 18 % des comptes actifs durant les trois derniers mois ont été créés en 2019.

36 % des visiteurs actifs ont une adresse de courriel GMail, 12 % chez Free, 5 % chez Yahoo, 4 % chez Hotmail ou Outlook, 3 % chez LaPoste et 2 % chez Orange ou Wanadoo.

Soucis divers

Le compteur d’années sans mises en demeure reçues s’est incrémenté, puis est passé de 1 à 0, avec deux mises en demeure reçues en 2019 (voir la dépêche sur la no 3 en attendant la publication d’informations sur la no 4).

/ Only four formal notices in the default \
\   install, in a heck of a long time!    /
 -----------------------------------------
   \
    \
        .--.            / Ouep...  \
       |o_o |           \ Euh coin /
       |:_/ |            ----------
      //   \ \              \ 
     (|     | )               \
    /'\_   _/`\                \ >()_
    \___)=(___/                   (__)__ _

Depuis la création du site, statistiques liées au légal (dans les sens liés à la force publique ou à du juridique) :

  • quatre mises en demeure reçues (pour zéro assignation) ;
  • une réquisition judiciaire reçue (qui au final ne nous concernait pas, mais a donné l’occasion de discuter avec la police nationale) ;
  • un cas d’usurpation d’identité et de harcèlement type « revenge porn » (discussion avec la gendarmerie nationale).

Dans les choses toujours à dire et à faire

Il y a encore bien d’autres choses à dire et à faire concernant les statistiques du site, notamment des statistiques supplémentaires demandées par mjourdan dans le cadre de l’amélioration de l’expérience utilisateur sur le site ou les entrées de suivi concernant les statistiques.

Aller plus loin

  • # Actif

    Posté par  (site web personnel) . Évalué à 9.

    2 522 [de comptes] ont été utilisés au cours des trois derniers mois, dont 33 % (=) ont déjà rédigé des dépêches, 39 % (+1) des journaux, 38 % (=) des entrées de forums, 9 % (-1) des entrées dans le système de suivi, 7 % des liens et 2 % une page de wiki ; 80 % (+1 point) ont écrit des commentaires et 42 % étiqueté des contenus (=) 

    Wow ça fait un site avec des utilisateurs très actifs !

  • # Vénérable webalizer

    Posté par  (site web personnel) . Évalué à 6.

    Vu que nous avons indirectement un commentaire concernant Webalizer provenant de christophe brocas, rappelons que nous avions testé d'autres solutions en 2017/2018. Pour résumer, les solutions basées sur du code dans les pages ne sont pas forcément ce que l'on souhaite/dont nous avons besoin. Et pour les solutions basées sur les journaux système, on a donc webalizer qui fait le taf sommairement, Awstats et Analog qui avaient été exclus, et on aurait pu (re)tester Matomo et GoAccess (avec un a priori pour ce dernier qui bénéficie d'un paquet Debian).

    • [^] # Re: Vénérable webalizer

      Posté par  (site web personnel) . Évalué à 5. Dernière modification le 04 janvier 2020 à 16:59.

      En parlant de vieux trucs, on a aussi du RRD, et il dit qu'on a eu un souci transitoire (un petit souci réseau au datacenter à première vue) dans l'après-midi :

      Charge 20200104

      Réseau 2020104

    • [^] # Re: Vénérable webalizer

      Posté par  (site web personnel) . Évalué à 3.

      J'attends impatiemment un journal ou une dépêche là dessus! J'aimerai bien arriver à analyser les logs Apache de mon hébergement perso; j'ai pas trop envie d'ajouter du code dans les pages affichées.

      Un LUG en Lorraine : https://enunclic-cappel.fr

      • [^] # Re: Vénérable webalizer

        Posté par  . Évalué à 7.

        Personnellement, je trouve que goacces, c'est le plus simple. Tu lui donne juste tes logs avec le format et il te sort les résultats en CLI ou en web.

        « Rappelez-vous toujours que si la Gestapo avait les moyens de vous faire parler, les politiciens ont, eux, les moyens de vous faire taire. » Coluche

        • [^] # Re: Vénérable webalizer

          Posté par  (site web personnel) . Évalué à 3.

          C'est marrant, j'avais cherché il y a un mois dans les dépôts de quoi avoir des stats et je ne suis pas tombé dessus. Je viens de l'installer depuis les dépôts et de le lancer dans le terminal, c'est génial! En couleur, visuellement pas mal! Je vais bien m'amuser avec ce truc :)

          Un LUG en Lorraine : https://enunclic-cappel.fr

    • [^] # Re: Vénérable webalizer

      Posté par  (site web personnel) . Évalué à 3.

      J'aime bien webalizer, sa simplicité suffit la plupart du temps. Des stats plus complètes n'ont d'intéret que si on trouve le temps de les exploiter.

      "La liberté est à l'homme ce que les ailes sont à l'oiseau" Jean-Pierre Rosnay

      • [^] # Re: Vénérable webalizer

        Posté par  (site web personnel, Mastodon) . Évalué à 1.

        Moi je l’ai aussi sur le serveur, mais, en fait, je me contente des stats de SPIP qui sont plus que largement suffisantes pour ce que j’en fais.

        « Tak ne veut pas quʼon pense à lui, il veut quʼon pense », Terry Pratchett, Déraillé.

  • # Commentaire supprimé

    Posté par  . Évalué à -2. Dernière modification le 04 janvier 2020 à 22:42.

    Ce commentaire a été supprimé par l’équipe de modération.

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.