Statistiques 2023 du site LinuxFr.org

Posté par  (site web personnel) . Édité par Ysabeau 🧶. Modéré par Ysabeau 🧶. Licence CC By‑SA.
Étiquettes :
23
2
jan.
2024
LinuxFr.org

2023 a été une année de taille moyenne, par rapport à 2024. Cela n’a évidemment pas grande pertinence, mais bon il faut bien une introduction à cette dépêche. Quid de l’activité du site LinuxFr.org en 2023 ? Quels changements en termes de trafic Web, de contenus créés, de commentaires déposés, de navigateurs utilisés, d’utilisation des fonctionnalités du site, de contribution au code, etc. Bref, qu’est‐ce qui a changé et de quelle manière durant 2023 ?

Le site rend accessible un grand nombre de statistiques (faites‑vous plaisir si vous souhaitez vous plonger dedans, c’est fait pour) ; cette dépêche résume les variations constatées en 2023.

Sommaire

Statistiques Web

La comparaison des statistiques annuelles (voir 2022 et 2023) montre une baisse des visites et des consultations (pages, fichiers), comme l’année passée, mais aussi des hits, avec un passage à ~726 000 hits par jour et ~52 340 visites par jour, le tout pour ~1,09 Tio par mois.

Statistiques Web 2023

Le nombre de contenus publiés en un an augmente de 13 %. Le nombre de commentaires publiés en un an augmente cette année de 6%.

Trafic de LinuxFr.org normalisé, entre 2002 et 2023

Contenus

Au 31 décembre 2023, le site comportait environ 117 460 contenus publiés répartis ainsi :

  • 27 416 dépêches :
    • 364 dépêches publiées en 2023 (360 en 2022),
    • la taille moyenne (en code Markdown, hors images donc) des dépêches se remet à augmenter, tout en restant inférieure à la valeur de 2019 ;
  • 39 837 journaux (458 en 2023 en hausse par rapport aux 435 en 2022),
  • 40 185 entrées de forums (574 en baisse par rapport aux 641 en 2022),
  • 7377 liens (1970 en forte hausse par rapport aux 1573 en 2022),
  • 458 sondages (9 en 2023 et 2022),
  • 157 pages de wiki (3 en 2023 et 2022).

Pour plus de détails sur les liens, le seul type de contenus significativement en hausse en 2022, voir la dépêche À propos des liens sur le site LinuxFr.org d’avril 2022.

Pour la première année, le pic de publication des contenus est le mercredi (qui détrône quatre ans de mardi). Ce qui diffère désormais du pic de modération, voir la partie Modération plus bas).

Un jour de semaine compte 64 % de publications en plus qu’un jour de week‐end.

La publication sous licence Creative Commons By-SA se fait par défaut depuis les dix ans de CC, fin 2012 pour les dépêches (permet explicitement une rédaction collaborative ou un renvoi en re‐rédaction) et les journaux (qui peuvent être convertis en dépêches) : tout naturellement, on retrouve 98 % de dépêches et 98 % des journaux sous cette licence au final (les autres étant notamment sous licence Art Libre ou autre, au choix de l’auteur).

Les dépêches collaboratives (et pas uniquement celles réattribuées à l’utilisateur Collectif) sur de multiples sujets sont toujours à compter parmi les vraies réussites du site ; nous sommes cependant toujours à la recherche de volontaires pour couvrir les nombreux sujets qui n’ont pu être abordés. Une liste des thèmes récurrents sur LinuxFr.org peut donner des idées de participation : si une dépêche n’a pas été créée dans les temps, tout inscrit peut la démarrer dans l’espace de rédaction.

Modération

Le temps moyen passé entre la création d’une dépêche (en rédaction ou directement envoyée en modération) et sa modération et publication est de 309 heures (contre 359 h en 2022 et 1 039 h en 2021) ; la mesure du temps passé uniquement en modération n’est pas actuellement disponible (et la modération retient volontairement des dépêches non urgentes pour réguler la publication) ; le temps médian est descendu à 19 heures. Il y a des demandes de statistiques dans le suivi, envoyez les demandes d’intégration Git (pull‐requests). ;-)

Le jour de modération a priori des contenus est toujours le mardi pour les dépêches et le lundi pour les sondages.

Les nombres d’interdictions de tribune et d’interdictions de poster des commentaires (pour une durée de un ou deux jours, une semaine ou un mois) sont encore en augmentation, mais restent très faibles à l’échelle du site (respectivement 81 et 91 fois, contre 139 et 145 en 2022), utilisées surtout comme restrictions immédiates sur les spammeurs, en attendant la purge du compte fautif par un admin.

Commentaires

Au 31 décembre 2023, le site comporte 1,91 million de commentaires. Le nombre de commentaires publiés en un an augmente cette année de 6 % pour arriver à 35 480. L’augmentation est due à l’augmentation du nombre de contenus.

Il y a désormais, en moyenne, 29 commentaires par journal (33 en 2022 et 39 en 2021), 9 par dépêches (10 en 2022 et 13 en 2021), 36 par sondage (54 précédemment, mais très dépendant des sondages considérés), 7 par entrée de forum (7 en 2022 et 9 en 2021), 4 par entrée de suivi, 7 par lien (contre 7 en 2022 et 6 en 2021) et une poignée par page wiki.

Le jour préféré pour commenter reste le mercredi, et un jour de semaine compte deux fois plus de commentaires qu’un jour de week‐end.

Notes

Il n’y a (toujours) pas de statistiques disponibles concernant les notes. Les entrées de suivi sur les statistiques n’ont pas avancé.

Néanmoins diverses statistiques concernant la notation sur les contenus et les commentaires ont été données en juin 2021, avec des graphes.

Étiquettes (tags)

Au 31 décembre 2023, le site comporte :

  • 14 842 étiquettes, dont 12 294 étiquettes publiques (contre 12 044 fin 2022) ;
  • 166 915 saisies d’étiquettes (étiquetées en moyenne douze fois pour les étiquettes publiques et cinq fois pour les étiquettes privées) ;
  • les étiquettes sont réparties ainsi par contenu :
    • 63 199 pour les dépêches,
    • 49 291 pour les journaux,
    • 28 530 pour les forums,
    • 24 216 pour les liens,
    • 823 pour les pages wiki,
    • 354 pour les sondages,
    • 502 pour le système de suivi des défauts et évolutions.

Plus de détails dans la dépêche de février 2022 À propos des étiquettes sur le site LinuxFr.org.

Depuis le début du site, on constate en moyenne 5 étiquettes par page wiki, 3 par lien, 2,3 par dépêche, 1,2 par journal, 0,8 par sondage, 0,7 par entrée de forum et 0,3 par entrée du suivi.

On peut aussi noter une autre particularité : le jour où le plus d’étiquettes sont apposées est le lundi (et non le mardi et le mercredi, qui constituent le pic de publication des contenus et des commentaires).

Équipe de bénévoles

Il y a actuellement 4 personnes pour l’administration du site (merci à Bruno Michel), 12 pour la modération, 7 pour l’animation de l’espace de rédaction et 2 pour la maintenance qui font tourner ce site. Pour mémoire, il s’agit de bénévoles plus ou moins disponibles et donc absolument pas de 25 équivalents temps plein pour jargonner comme une entreprise. Merci pour le travail accompli.

Code et développement

Au 31 décembre 2023, le système de suivi de défauts et de demandes d’évolutions contient 243 entrées ouvertes (contre 215 en 2022). On voit assez rapidement un manque de développeurs apparaître. En 2022, il y a eu 46 entrées ouvertes (contre 24 en 2021) : 33 entrées encore ouvertes venant s’ajouter à celles datant d’avant, 13 corrigées et 0 déclarée invalide. On peut noter que ceux qui ouvrent le plus d’entrées sont des membres actuels ou anciens de l’équipe du site.

À noter la dépêche de novembre 2022 qui analyse les logs Ruby on Rails du site.

C’est Bruno qui garde le record de correction d’entrées. Merci aussi à Adrien Dorsaz. Le temps moyen de résolution est de 132 jours (contre 128 précédemment). La moitié des entrées fermées ont été traitées en moins de sept jours. On ressent donc toujours un besoin de nouveaux contributeurs côté code.

La charge moyenne sur le serveur est de 1,2 (contre 1,3 en 2022) sur la machine actuelle (baptisée gruik). La charge minimale a été de 0,7 et la maximale de 3,7.

La consommation mémoire est restée stable. Le trafic réseau sur la partie Web uniquement est en moyenne de 4,6 Mbit/s sortants. Le trafic réseau total est en moyenne de 5,9 Mbit/s sortants (en baisse), avec des pics à 14 Mbit/s sortants.

Comptes utilisateur

Au 31 décembre 2023, sur les 53 344 comptes utilisateur valides existants, 2 287 ont été utilisés au cours des trois derniers mois, dont 32 % (=) ont déjà rédigé des dépêches, 43 % (+1) des journaux, 41 % (=) des entrées de forums, 11 % (+1) des entrées dans le système de suivi, 15 % des liens (-1) et 1 % une page de wiki ; 87 % (+4 points) ont écrit des commentaires et 50 % (+2) étiqueté des contenus ; 34 % (=) ont contribué sur au moins une dépêche ; 26 % (+1) des comptes actifs ont indiqué un site personnel, 8 % (-1) un identifiant XMPP, 4 % une adresse Mastodon, 30 % (+2) un avatar et 6 % (=) une signature.

Côté utilisation des fonctionnalités, 3 % (=) ont demandé à ne pas voir les signatures, 5 % (=) à ne pas voir les avatars et 8 % (=) avec le tri chronologique en page d’accueil, et à peine quelques pourcents ont changé les contenus par défaut en page d’accueil (souvent pour retirer les sondages et ajouter les journaux). Peu de feuilles de style CSS du site sont utilisées : plus de quatre visiteurs sur cinq utilisent celle par défaut ; il est facile d’en changer avec le lien Changer de style.

Seuls dix comptes ont un karma négatif et aucun n’a un karma nul, soit 0 % des visiteurs actifs ; 10 % des comptes actifs durant les trois derniers mois ont été créés en 2023.

31 % (-1) des visiteurs actifs ont une adresse de courriel GMail, 13 % (+1) chez Free, 4 % (=) chez LaPoste, 4 % (+1) chez Yahoo, 3 % (=) chez Hotmail ou Outlook et 2 % (=) chez Orange ou Wanadoo.

2023 correspond aussi à la mise à place de nouvelles règles de pérennité des comptes LinuxFr.org et données à caractère personnel.

Soucis divers

Le compteur d’années sans mises en demeure reçues passe à trois (après deux mises en demeure en 2019 et une en 2020, voir la dépêche sur la no 3 en attendant la publication d’informations sur les no 4 et 5).

/ Only five formal notices in the default \
\   install, in a heck of a long time!    /
 -----------------------------------------
   \
    \
        .--.            / Ouep...  \
       |o_o |           \ Euh coin /
       |:_/ |            ----------
      //   \ \              \ 
     (|     | )               \
    /'\_   _/`\                \ >()_
    \___)=(___/                   (__)__ _

Depuis la création du site, statistiques liées au légal (dans les sens liés à la force publique ou à du juridique) :

  • cinq mises en demeure reçues (pour zéro assignation) ;
  • une réquisition judiciaire reçue (qui au final ne nous concernait pas, mais a donné l’occasion de discuter avec la police nationale) ;
  • un cas d’usurpation d’identité et de harcèlement type « revenge porn » (discussion avec la gendarmerie nationale).

Aller plus loin

  • # pic et pic et colégram

    Posté par  (site web personnel) . Évalué à 3. Dernière modification le 02 janvier 2024 à 14:13.

    Étonnant ce soudain pic de visites vers 2006-2007 qui redescend aussi vite, ça a déjà été discuté ici à l'occasion d'une précédente dépêche Statistiques Web ?

  • # Bravo

    Posté par  (site web personnel) . Évalué à 6. Dernière modification le 02 janvier 2024 à 14:14.

    [sur les comptes utilisateurice utilisés au cours des trois derniers mois], 32 % (=) ont déjà rédigé des dépêches, 43 % (+1) des journaux, 41 % (=) des entrées de forums, 11 % (+1) des entrées dans le système de suivi, 15 % des liens (-1) et 1 % une page de wiki ; 87 % (+4 points) ont écrit des commentaires et 50 % (+2) étiqueté des contenus ; 34 % (=) ont contribué sur au moins une dépêche

    Très belle statistique pour un site effectivement collaboratif, bravo à tout le monde !

    • [^] # Re: Bravo

      Posté par  (site web personnel) . Évalué à 3.

      Statistiques refaites ce jour :

      2289 comptes utilisés dans les 90 derniers jours

      • dépêches 32 %
      • journaux 44 %
      • forums 41 %
      • suivi 11 %
      • liens 15 %
      • wiki 1 %
      • commentaires 87 %
      • étiquetages 49 %
      • éditions de dépêches 33 %
      • éditions de pages wiki 5 %

      jusque là, à part des évolutions d'un point potentiellement dues à des arrondis, rien de neuf (à part l'ajout de l'info sur les éditions de pages wiki).

      • dépêches : des comptes créés de 1999 à 2024
      • journaux : des comptes créés de 1999 à 2023
      • forums : des comptes créés de 1999 à 2024
      • suivi : des comptes créés de 1999 à 2021 (peu d'entrées créées et pas par les derniers comptes créées)
      • liens : des comptes créés de 1999 à 2024
      • wiki : des comptes créés de 1999 à 2011, ou 2013, ou 2017 (ie. peu de nouvelles pages créées)
      • commentaires : des comptes créés de 1999 à 2024
      • étiquetages : des comptes créés de 1999 à 2024
      • éditions de dépêches : des comptes créés de 1999 à 2024
      • éditions de pages wiki : des comptes créés de 1999 à 2022 (ie. peu de nouvelles pages créées et peu d'éditions)

      -> pas de "rupture générationnelle" marquée entre les comptes 1999 et 2024 en termes d'utilisations des fonctionnalités

      Les « aucun commentaire » : 85% de comptes non-commentateurs (11% du total) n'ont strictement aucune contribution (seconde combinaison la plus présente si on considère les 10 critères de contribution). Il y a des comptes de 2001 à 2024, donc des comptes récents qui découvrent, mais aussi des comptes simplement « silencieux », et probablement des bots et des spammeurs. Aucune entrée de suivi ou de page wiki ou d'édition de page wiki pour les comptes qui ne commentent pas. Et ils cochent très peu de contributions de types différents

      Les « avec commentaire(s) » : 23% des comptes commentateurs (19% du total) n'ont strictement aucune autre contribution. C'est la combinaison la plus présente si on considère les 10 critères de contribution.

      Si on retire les critères page wiki et édition de page wiki et le suivi qui concernent peu de comptes, toujours pour les comptes ayant commenté : 50% ont eu une dépêche publiée, 53% un journal, 48% une entrée de forum, 18% un lien, 58% un étiquetage et 40% une édition de dépêche. On peut faire l'hypothèse qu'on commence par commenter avant d'avoir des contenus publiés.

      Globalement :

      • 1% des comptes cochent les 10 critères.
      • 11% cochent les 6 critères les plus représentés (dépêche, forum, journal, étiquetage, édition de dépêche, commentaire)
  • # Et le « users » de Linuxfr le plus populaire est ?

    Posté par  (site web personnel, Mastodon) . Évalué à 4. Dernière modification le 02 janvier 2024 à 21:40.

    Puisqu’on y est si gentiment invité, je me suis plongée dedans (pas trop profondément) histoire de voir ce qui figure dans le trio de tête du top 10. Et j’espère ne pas avoir fait trop de fautes de frappe dans le relevé des nombres.

    Les expressions recherchées :

    Dans le « Top 20 of 300 Total Search Strings », j’aimerais bien voir la tête des personnes qui arrivent sur linuxfr.org après certaines de ces recherches :

    • wwwxxxvvv : 5 fois dans ce « top 3 », 2e en février (3,44 % des hits), 1er en mai (3,62 %), 3e en juin (2,85 %), 2e en juillet (3,38%) et 1er en octobre (4,61%),
    • ex-æquo avec une 404, l’histoire de la petite fourmi travailleuse de linuce qui arrive, quant à elle en 3e position en février (2,10 %), en 3e en mars (2,52%), 2e en avril (2,99 %), en mai (2,35%) et en juin (2,85%),
    • et linuxfr : 3 fois dans ce palmarès, 1er (4,21%), 2e en mars (2,91%) et en 1er en juin (3,42%).

    Sinon on a aussi deux fois /e/ os et xvideo. Si ça peut vous rassurer, en décembre, la recherche comment bloque le site porno sur le telephone mobile de touche bouton (sic) est en 2e position (1,04 % des hits) juste après xvideo (6,53 % des hits !).

    Les pages d’entrée

    Pour les pages d’entrée, je n’ai pris en compte que les pages « significatives » et ai laissé de côté les pages « génériques » du style /news, journaux, liens, etc. C’est pour cela que les pages du « top 3 » du « top 10 » ne figurent généralement pas dans les 4-5 premières pages d’entrée.

    Il semblerait que le linuxfrien le plus populaire de l’année ait été pullkomandy qui figure 6 fois dans ce peloton de tête. Mais avant qu’il ne se précipite sur des magasins en ligne pour s’acheter des chaussettes et des bonnets d’une pointure plus grande, relativisons en mettant en regard le pourcentage par rapport au nombre total des pages d’entrée : en 8e en février (0,39 % des pages d’entrée), et en juillet (0,41 %), 4e en août (1,32 %) et en 4e en octobre (0,68 %), 9e en septembre (0,47 %) et 10e en décembre (0,26 %). De toute façon, il fait aussi pas mal partie du top 10 des pages de sortie.

    Les 2es linuxiens les plus populaires, ils sont ex-æquo, sont Laurent Pointecouteau qui figure en 8e position des pages d’entrée en mai (0,29 %) et en octobre (0,42 %) et raspbeguy qui, lui est 10e du « top 10 » des pages d’entrée en octobre (0,28 %) décembre (0,27 %).

    Il n’y a pas d’autre page non-générique, si je ne me suis pas trompée, qui fait plus d’une entrée dans le « top 10 ».

    Sinon, je n’ai pas regardé pour d’autres mois, mais, en décembre, le trio de tête des origines géographiques, pour autant que ça ait un sens est, dans l’ordre :

    • France 33,04 % des hits,
    • USA, 30,02 %,
    • et le Canada, 20,26 %.

    Il y a sûrement d’autres trucs plus ou moins rigolos à relever. Je laisse ce soin à d’autres.

    « Tak ne veut pas quʼon pense à lui, il veut quʼon pense », Terry Pratchett, Déraillé.

  • # étiquettes

    Posté par  (site web personnel) . Évalué à 3.

    Je me demande s'il faudrait ouvrir une réflexion sur le fait que le thème mobile par défaut ne montre pas les étiquettes

    • [^] # Re: étiquettes

      Posté par  (site web personnel) . Évalué à 3.

      Deux soucis sur mobile de mon point de vue :

      • le non-affichage des étiquettes (sauf à basculer son Firefox en "Version ordinateur")
      • écrire des longs textes dessus est pénible (et si beaucoup de gens sont sur mobile ça a un effet sur les productions de contenus "longs")
      • [^] # Re: étiquettes

        Posté par  (site web personnel) . Évalué à 3.

        écrire des longs textes dessus est pénible

        A cause de la mise en page ?

        • [^] # Re: étiquettes

          Posté par  (site web personnel) . Évalué à 3.

          • clavier virtuel sur un téléphone
          • taille de l'écran
          • gros doigts
          • autocorrection
          • absence de Grammalecte
          • copier-coller moins pratique
          • [^] # Re: étiquettes

            Posté par  (site web personnel) . Évalué à 3.

            Certes, mais quel est le rapport avec linuxfr.org mon cher Benoît ?

            • [^] # Re: étiquettes

              Posté par  (site web personnel) . Évalué à 5.

              Ça me semblait évident, mais précisons :

              1. Les contenus textuels "longs" ou disons structurés sont plus chiants à écrire sur un smartphone qu'un ordinateur (ça serait différent si on parlait d'audio ou de vidéo)
              2. La proportion des visites depuis un mobile augmente
              3. Il va y avoir moins de contenus "longs" soumis/publiés (*)
              4. Moins de contenus diminue le lectorat. Le changement de nature des contenus change le lectorat.
              5. Profi… ah non pas là

              (*) sauf autodiscipline où l'écriture serait juste reportée au moment où tu es devant un vrai clavier mais je n'y crois guère en moyenne

              • [^] # Re: étiquettes

                Posté par  (site web personnel) . Évalué à 3.

                Oui oui oui j'avais compris, mais ce n'est pas propre à LinuxFr et il n'y a rien à y faire, si ?

                • [^] # Re: étiquettes

                  Posté par  (site web personnel) . Évalué à 3. Dernière modification le 05 janvier 2024 à 11:20.

                  • interdire les portables
                  • interdire les jeunes qui utilisent les portables plus que les autres
                  • améliorer l'interface (mais j'ai du mal à voir comment ça ferait des miracles)
                  • donner des comptes premium avec des avantages de ouf' à ceux qui produisent des contenus "longs"
                  • en parler pour trouver des solutions ou changer le problème
                  • se résigner et accepter
                  • se faire violence pour abandonner le texte et avoir de l'audio et la vidéo
                  • [^] # Re: étiquettes

                    Posté par  (site web personnel) . Évalué à 5. Dernière modification le 05 janvier 2024 à 11:41.

                    « Que la force me soit donnée de supporter ce qui ne peut être changé ; le courage de changer ce qui peut l'être ; et la sagesse de distinguer l'un de l'autre » xD

              • [^] # Re: étiquettes

                Posté par  (site web personnel, Mastodon) . Évalué à 4.

                Il m'arrive de lire Linuxfr depuis un téléphone. Ça ne m'empêche pas de prendre un ordinateur avec un vrai clavier quand j'ai besoin ou envie d'écrire quelque chose de long.

                Donc, il faudrait plutôt regarder la proportion d'utilisateurices qui ne se connectent jamais depuis une machine avec un clavier, pour voir si ça a vraiment un impact sur les contenus longs, ou si c'est juste qu'on a aujourd'hui le luxe de pouvoir utiliser des terminaux différents pour la production et la consommation des informations.

  • # Visibilité par contenu

    Posté par  (site web personnel) . Évalué à 3. Dernière modification le 13 janvier 2024 à 14:22.

    Il a la visibilité directe sur le site, par les comptes authentifiés ou non, plus la visibilité indirecte via les flux atom, les reprises sur d'autres sites, la lettre quotidienne par courriel, etc., mais tous les indicateurs disent la même chose :

    • répartition du nombre de requêtes GET/HEAD sur les flux de contenus :

      • dépêches 68%
      • journaux 22%
      • liens 5%
      • forums 3%
      • sondages 1%
      • suivi 0%
      • pages wiki 0%
    • affichage en page d'accueil pour les comptes authentifiés :

      • dépêches 99%
      • journaux 14%
      • liens 4%
      • forums 4%
      • sondages 90%
      • pages wiki 3%
      • suivi 3%
    • sur les statistiques uniquement de décembre 2023, en nombre de hits sur les 5 dépêches, les 5 journaux et les 5 liens les plus vus :

      • dépêches : 8724 à 10529 hits
      • journaux : 4774 à 8037 hits -> les journaux ont jusqu'à deux fois moins de visibilité que les dépêches, faites des dépêches…
      • liens : 2169 à 2720 hits -> les liens ont beaucoup moins de visibilité que les journaux et les dépêches, donc préférez faire des dépêches (ou des journaux)

    Pour avoir de la visibilité, privilégiez les dépêches !

  • # Statistiques manquantes sur les comptes utilisateur

    Posté par  (site web personnel) . Évalué à 3.

    Il manquait deux pourcentages d'utilisation des préférences :

    • Affichage des contenus avec une note négative 13%
    • Affichage de la tribune dans une boîte latérale 4%

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.