Statistiques 2022 du site LinuxFr.org

Posté par  (site web personnel) . Édité par Florent Zara, Xavier Teyssier et nud. Modéré par patrick_g. Licence CC By‑SA.
Étiquettes :
24
3
jan.
2023
LinuxFr.org

2022 a été une année calme, plate, atone, apaisée et pondérée, et il ne s’est rien passé d’important. C’est évidemment faux, mais bon il faut bien une introduction à cette dépêche. Quid de l’activité du site LinuxFr.org en 2022 ? Quels changements en termes de trafic Web, de contenus créés, de commentaires déposés, de navigateurs utilisés, d’utilisation des fonctionnalités du site, de contribution au code, etc. Bref, qu’est‐ce qui a changé et de quelle manière durant 2022 ?

Le site rend accessible un grand nombre de statistiques (faites‑vous plaisir si vous souhaitez vous plonger dedans, c’est fait pour) ; cette dépêche résume les variations constatées en 2022.

Sommaire

Statistiques Web

La comparaison des statistiques annuelles (voir 2021 et 2022) montre une nouvelle hausse des visites et des consultations (pages, fichiers), comme l’année passée, mais aussi une hausse des hits, avec un passage à ~858 000 hits par jour et ~55 640 visites par jour, le tout pour ~1,19 Tio par mois (en hausse cette année, mais inférieur à 2020 par exemple).

Statistiques Web 2022

Le nombre de contenus publiés en un an diminue cette année encore (de 5%). Le nombre de commentaires publiés en un an diminue cette année (de 20%).

Trafic de LinuxFr.org normalisé, entre 2002 et 2022

Contenus

Au 31 décembre 2022, le site comportait environ 114 400 contenus publiés répartis ainsi :

  • 27 054 dépêches :
    • 360 dépêches publiées en 2022 (en baisse par rapport aux 435 en 2021),
    • la taille moyenne (en code Markdown, hors images donc) des dépêches se remet à augmenter, tout en restant inférieure à la valeur de 2020 ;
  • 39 671 journaux (438 en 2022 en baisse par rapport aux 518 de 2021),
  • 39 677 entrées de forums (641 en 2022 en baisse par rapport aux 692 en 2021),
  • 5411 liens (1573 en 2022 en hausse par rapport aux 1530 en 2021),
  • 449 sondages (9 en 2022 en hausse par rapport aux 7 en 2021),
  • 154 pages de wiki (3 en 2022, soit autant qu’en 2021).

Pour plus de détails sur les liens, le seul type de contenus significativement en hausse en 2022, voir la dépêche À propos des liens sur le site LinuxFr.org d’avril 2022.

Pour la quatrième année, le pic de publication des contenus est le mardi (talonné par le mercredi). À noter que ça correspond désormais au pic de modération aussi, voir la partie Modération plus bas).

Un jour de semaine compte 60 % de publications en plus qu’un jour de week‐end.

La publication sous licence Creative Commons By-SA se fait par défaut depuis les dix ans de CC, fin 2012 pour les dépêches (permet explicitement une rédaction collaborative ou un renvoi en re‐rédaction) et les journaux (qui peuvent être convertis en dépêches) : tout naturellement, on retrouve 96 % de dépêches et 98 % des journaux sous cette licence au final (les autres étant notamment sous licence Art Libre ou autre, au choix de l’auteur).

Les dépêches collaboratives (et pas uniquement celles réattribuées à l’utilisateur Collectif) sur de multiples sujets sont toujours à compter parmi les vraies réussites du site ; nous sommes cependant toujours à la recherche de volontaires pour couvrir les nombreux sujets qui n’ont pu être abordés. Une liste des thèmes récurrents sur LinuxFr.org peut donner des idées de participation : si une dépêche n’a pas été créée dans les temps, tout inscrit peut la démarrer dans l’espace de rédaction.

Modération

Le temps moyen passé entre la création d’une dépêche (en rédaction ou directement envoyée en modération) et sa modération et publication est de 359 heures (contre 1 039 h en 2021 et 758 h en 2020) ; la mesure du temps passé uniquement en modération n’est pas actuellement disponible (et la modération retient volontairement des dépêches non urgentes pour réguler la publication) ; le temps médian est stable à 21 heures. Il y a des demandes de statistiques dans le suivi, envoyez les demandes d’intégration Git (pull‐requests). ;-)

Le jour de modération a priori des contenus est toujours le mardi pour les dépêches et le lundi pour les sondages.

Les nombres d’interdictions de tribune et d’interdictions de poster des commentaires (pour une durée de un ou deux jours, une semaine ou un mois) sont encore en augmentation, mais restent très faibles à l’échelle du site (respectivement 139 et 145 fois, contre 186 et 208 en 2021), utilisées surtout comme restrictions immédiates sur les spammeurs, en attendant la purge du compte fautif par un admin.

Commentaires

Au 31 décembre 2022, le site comporte 1,89 million de commentaires. Le nombre de commentaires publiés en un an diminue cette année (de 20 %) pour arriver à 33 490. La diminution est due aux baisses cumulées du nombre de contenus et du nombre de commentaires par contenu.

Il y a désormais, en moyenne, 33 commentaires par journal (39 en 2021 et 32 en 2020), 10 par dépêches (13 en 2021 et 16 en 2020), 54 par sondage (46 précédemment, mais très dépendant des sondages considérés), 7 par entrée de forum (9 en 2021 et 8 en 2020), 5 par entrée de suivi, 7 par lien (contre 6 en 2021) et une poignée par page wiki.

Le jour préféré pour commenter reste le mercredi, et un jour de semaine compte deux fois plus de commentaires qu’un jour de week‐end.

Notes

Il n’y a (toujours) pas de statistiques disponibles concernant les notes. Les entrées de suivi sur les statistiques n’ont pas avancé.

Néanmoins diverses statistiques concernant la notation sur les contenus et les commentaires ont été données en juin 2021, avec des graphes.

Étiquettes (tags)

Au 31 décembre 2022, le site comporte :

  • 14 024 étiquettes, dont 12 0444 étiquettes publiques (contre 11 574 fin 2021) ;
  • 152 426 saisies d’étiquettes (étiquetées en moyenne onze fois pour les étiquettes publiques et cinq fois pour les étiquettes privées) ;
  • les étiquettes sont réparties ainsi par contenu :
    • 60 099 pour les dépêches,
    • 46 822 pour les journaux,
    • 26 904 pour les forums,
    • 17 022 pour les liens,
    • 799 pour les pages wiki,
    • 326 pour les sondages,
    • 454 pour le système de suivi des défauts et évolutions.

Plus de détails dans la dépêche de février 2022 À propos des étiquettes sur le site LinuxFr.org.

Depuis le début du site, on constate en moyenne 5 étiquettes par page wiki, 3 par lien, 2,2 par dépêche, 1,2 par journal, 0,7 par sondage, 0,7 par entrée de forum et 0,2 par entrée du suivi.

On peut aussi noter une autre particularité : le jour où le plus d’étiquettes sont apposées est le lundi (et non le mardi et le mercredi, qui constituent le pic de publication des contenus et des commentaires).

Équipe de bénévoles

Il y a actuellement 5 personnes pour l’administration du site (merci à Bruno Michel), 13 pour la modération et 7 pour l’animation de l’espace de rédaction qui font tourner ce site. Pour mémoire, il s’agit de bénévoles plus ou moins disponibles et donc absolument pas de 25 équivalents temps plein pour jargonner comme une entreprise. Merci pour le travail accompli.

Code et développement

Au 31 décembre 2022, le système de suivi de défauts et de demandes d’évolutions contient 215 entrées ouvertes (contre 199 en 2021). On voit assez rapidement un manque de développeurs apparaître. En 2022, il y a eu 24 entrées ouvertes (contre 57 en 2021) : 17 entrées encore ouvertes venant s’ajouter à celles datant d’avant, 6 corrigées et 1 déclarée invalide. On peut noter que ceux qui ouvrent le plus d’entrées sont des membres actuels ou anciens de l’équipe du site.

À noter la dépêche de novembre 2022 qui analyse les logs Ruby on Rails du site.

C’est Bruno qui garde le record de correction d’entrées. Merci aussi à Adrien Dorsaz. Le temps moyen de résolution est de 128 jours (contre 129 précédemment). La moitié des entrées fermées ont été traitées en moins de sept jours. On ressent donc toujours un besoin de nouveaux contributeurs côté code.

La charge moyenne sur le serveur est de 1,3 (contre 1,1 en 2021) sur la machine actuelle (baptisée gruik). La charge minimale a été de 0,9 et la maximale de 4,8.

La consommation mémoire est restée stable. Le trafic réseau sur la partie Web uniquement est en moyenne de 4,9 Mbit/s sortants. Le trafic réseau total est en moyenne de 6,4 Mbit/s sortants (comme précédemment), avec des pics à 13,5 Mbit/s sortants.

Comptes utilisateur

Au 31 décembre 2022, sur les 53 734 comptes utilisateur valides existants, 1 786 ont été utilisés au cours des trois derniers mois, dont 32 % (=) ont déjà rédigé des dépêches, 42 % (=) des journaux, 41 % (+1) des entrées de forums, 10 % (=) des entrées dans le système de suivi, 16 % des liens (+2) et 2 % une page de wiki ; 83 % (-1 point) ont écrit des commentaires et 48 % (+1) étiqueté des contenus ; 34 % (-1) ont contribué sur au moins une dépêche ; 25 % (+1) des comptes actifs ont indiqué un site personnel, 9 % (=) un identifiant XMPP, 28 % (+1) un avatar et 6 % (+1) une signature.

Côté utilisation des fonctionnalités, 3 % (=) ont demandé à ne pas voir les signatures, 5 % (-1) à ne pas voir les avatars et 8 % (=) avec le tri chronologique en page d’accueil, et à peine quelques pourcents ont changé les contenus par défaut en page d’accueil (souvent pour retirer les sondages et ajouter les journaux). Peu de feuilles de style CSS du site sont utilisées : plus de quatre visiteurs sur cinq utilisent celle par défaut ; il est facile d’en changer avec le lien Changer de style.

Seuls neuf comptes ont un karma négatif et aucun n’a un karma nul, soit 0 % des visiteurs actifs ; 12 % des comptes actifs durant les trois derniers mois ont été créés en 2022.

32 % (-2) des visiteurs actifs ont une adresse de courriel GMail, 12 % (=) chez Free, 4 % (=) chez LaPoste, 3 % (+1) chez Yahoo, 3 % (=) chez Hotmail ou Outlook et 2 % (=) chez Orange ou Wanadoo.

Soucis divers

Le compteur d’années sans mises en demeure reçues passe à deux (après deux mises en demeure en 2019 et une en 2020, voir la dépêche sur la no 3 en attendant la publication d’informations sur les no 4 et 5).

/ Only five formal notices in the default \
\   install, in a heck of a long time!    /
 -----------------------------------------
   \
    \
        .--.            / Ouep...  \
       |o_o |           \ Euh coin /
       |:_/ |            ----------
      //   \ \              \ 
     (|     | )               \
    /'\_   _/`\                \ >()_
    \___)=(___/                   (__)__ _

Depuis la création du site, statistiques liées au légal (dans les sens liés à la force publique ou à du juridique) :

  • cinq mises en demeure reçues (pour zéro assignation) ;
  • une réquisition judiciaire reçue (qui au final ne nous concernait pas, mais a donné l’occasion de discuter avec la police nationale) ;
  • un cas d’usurpation d’identité et de harcèlement type « revenge porn » (discussion avec la gendarmerie nationale).

Aller plus loin

  • # Dépêche publiée un ?

    Posté par  . Évalué à 2.

    Mardi, bien sûr !
    (merci pour le travail de synthèse, et pour tout le reste à l'ensemble de l'équipe)

  • # Béotien

    Posté par  (site web personnel) . Évalué à 4.

    La comparaison des statistiques annuelles (voir 2021 et 2022) montre une nouvelle hausse des visites et des consultations (pages, fichiers), comme l’année passée, mais aussi une hausse des hits, avec un passage à ~858 000 hits par jour

    C'est quoi des hits ?

    • [^] # Re: Béotien

      Posté par  (site web personnel) . Évalué à 10.

      Par exemple n'importe quelle chanson de Félix Gray et Didier Barbelivien des 90ies

    • [^] # Re: Béotien

      Posté par  (site web personnel, Mastodon) . Évalué à 3.

      L'émission des deux machines sur Métropole 6…
      <mode sérieux activé>
      Plus sérieusement, c'est le nombre de ressources renvoyées pour générer l'affichage d'une page —résumé de www.MediaCollege.com
      <mode sérieux éteint>
      Et si les ressources sont de toute beauté, on a un hit-parade.

      “It is seldom that liberty of any kind is lost all at once.” ― David Hume

    • [^] # Re: Béotien

      Posté par  . Évalué à 3.

      C'est n'importe quel truc demandé par le navigateur au serveur http — image, css, page html, page redemandée parce qu'un bout s'est perdu, requête ajax, etc.

      • [^] # Re: Béotien

        Posté par  (site web personnel) . Évalué à 2.

        Merci pour ces précisions. Sur le 2e graphique, sur la période 2020-2022 les hits remontent beaucoup moins vite que les visites et pages. Comment ça se fait ? Est-ce que ça voudrait dire que quelque chose a changé dans le fonctionnement du site ?

        • [^] # Re: Béotien

          Posté par  . Évalué à 3.

          Ça pourrait être une amélioration des caches (navigateurs, fai), moins d'images ajoutées dans les contenus, un code html demandant moins de fichiers externes qu'avant (actuellement une CSS et un JS je crois), les miracles de l'extension Decentraleyes, la tribune moins active ou utilisée sans http, … Il y a probablement plusieurs facteurs à la fois. Pour le fonctionnement du site, fouille dans les changelogs du source.

    • [^] # Re: Béotien

      Posté par  (site web personnel) . Évalué à 7. Dernière modification le 04 janvier 2023 à 16:09.

      Exemple avec https://linuxfr.org/webalizer/usage_202301.html

      Total Hits  2250629
      Total Files     1901346
      (...)
      Undefined response code 0.51%   11558
      Code 200 - OK   84.48%  1901346
      Code 201 - Created  0.03%   640
      Code 204 - No Content   0.00%   7
      Code 206 - Partial Content  0.01%   270
      Code 301 - Moved Permanently    0.64%   14313
      Code 302 - Found    0.27%   6052
      Code 304 - Not Modified 13.03%  293315
      Code 400 - Bad Request  0.03%   671
      Code 401 - Unauthorized 0.00%   9
      Code 403 - Forbidden    0.02%   401
      Code 404 - Not Found    0.89%   20108
      Code 405 - Method Not Allowed   0.00%   17
      Code 406 - Not Acceptable   0.00%   80
      Code 408 - Request Timeout  0.00%   2
      Code 410 - Gone 0.07%   1657
      Code 502 - Bad Gateway  0.00%   36
      Code 503 - Service Unavailable  0.01%   147
      

      Files c'est réponse 200 OK, que Hits c'est la somme de toutes les entrées nginx / toutes les requêtes HTTP.

      Donc c'est la répartition des 200 par rapport aux autres réponses qui a un peu évolué.

      Requêtes HTTP sur LinuxFr.org 2020-2022
      Répartition des requêtes HTTP sur LinuxFr.org 2020-2022

      • [^] # Re: Béotien

        Posté par  (site web personnel, Mastodon) . Évalué à 2.

        Code 406 - Not Acceptable   0.00%   80
        Code 408 - Request Timeout  0.00%   2
        Code 410 - Gone 0.07%   1657
        

        Et pas un seul 451 ? Coincidence ? Je ne crois pas… #noussachons

        Code 502 - Bad Gateway  0.00%   36
        Code 503 - Service Unavailable  0.01%   147
        
  • # Domaines XMPP

    Posté par  (site web personnel) . Évalué à 5.

    Statistique qui vient s'être ajoutée https://linuxfr.org/statistiques/users#stats_xmpp

    2% des comptes actifs ont une adresse XMPP jabber.fr, 1% chez gmail.com, 1% chez im.apinc.org, 1%
    chez jabber.org, ~0% chez movim.eu. (pour un total de 8% de comptes actifs avec une adresse xmpp, valide ou non, active ou non).

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.