Prédire la note d’un journal sur LinuxFr.org

139
9
juin
2017
LinuxFr.org

Cette dépêche traite de l’exploration de données sur des données issues de LinuxFr.org.

Ayant découvert récemment scikit-learn, une bibliothèque Python d’apprentissage statistique (machine learning). Je voulais partager ici un début d’analyse sur des contenus issus de LinuxFr.org.

Avertissement : je ne suis pas programmeur, ni statisticien. Je ne maîtrise pas encore tous les arcanes de scikit-learn et de nombreux éléments théoriques m’échappent encore. Je pense néanmoins que les éléments présentés ici pourront en intéresser plus d’un(e).

Tous les scripts sont codés en Python et l’analyse à proprement parler a été réalisée à l’aide d’un notebook Jupyter. Un dépôt contenant les données et les scripts est disponible sur GitLab.

Journal Quelques stats des services Framasoft

Posté par  (site web personnel) . Licence CC By‑SA.
63
23
déc.
2022

Cher Nal,
ça fait plus de 4 ans que je ne t'ai pas écrit dessus (chacun ses kinks).

Mais là, je me suis dit : « tiens, cette info pourrait intéresser les moules, entre la paella et la buche 🤔 »

En effet, à l'occasion de cette fin d'année 2022, nous (Framasoft) avons publié les statistiques de quelques un de nos services.

Et en le faisant, je me suis rendu compte qu'on devait gérer certains des services les plus (…)

Journal Debunking sur le virus Zika

Posté par  . Licence CC By‑SA.
59
15
fév.
2016

Ce journal est une réponse à ce journal. J'ai choisi de le mettre en journal, et non en simple réponse, parce qu'il me semblait important de répondre à certaines contre-vérités sans que la réponse soit enterrée sous un tombereau de trolls. Cette idée m'est venue en cours de rédaction, c'est pourquoi il m'arrive de parler à la deuxième personne : cette personne est l'auteur du journal cité en lien.

Bonne lecture.

Une épidémie récente

On va commencer par l'affirmation (…)

Journal Base de données de scanners : besoin de contributeurs (yep, encore)

Posté par  (site web personnel) . Licence CC By‑SA.
52
6
sept.
2019

Cher ’nal,

J’ai développé pendant quelques années une bibliothèque Python multi‐plate‐forme d’accès aux scanners (SANE sous GNU/Linux, WIA2 sous Windows). L’année dernière, j’ai entrepris de réécrire cette bibliothèque en C : Libinsane. Cette nouvelle bibliothèque inclut un certain nombre de contournements pour divers pilotes de scanners plus ou moins moisis. Et croyez‐moi, il y en a un paquet, aussi bien sous GNU/Linux que Windows. Le problème est aussi d’assurer un comportement cohérent quelque soit l’API ou le scanner (…)

Journal Base de données de scanners : besoin de contributeurs

52
7
mar.
2018

Cher 'nal,

Je développe depuis quelques années une librairie Python cross-platform d'accès aux scanners (Sane sous Linux, WIA2 sous Windows). Elle inclue aussi un certain nombres de contournements pour divers pilotes de scanners plus ou moins moisis. Et croyez-moi, il y en a un paquet, aussi bien sous Linux que Windows.
Le problème, c'est que j'ai sous-estimé l'ampleur de la tâche, surtout sous Windows. Je pensais que l'API Twain était mourante et donc je n'avais pas implémenté son support (perdu) (…)

Statistiques 2015 du site LinuxFr.org

Posté par  (site web personnel) . Édité par Davy Defaud. Modéré par Nÿco. Licence CC By‑SA.
45
7
jan.
2016
LinuxFr.org

En ce début d’année 2016, commençons par un petit regard en arrière sur les douze derniers mois d’activité de LinuxFr.org : quelle évolution en termes de trafic Web, de contenus créés, de commentaires déposés, de navigateurs utilisés, d’utilisation des fonctionnalités du site, etc. Qu’est‐ce qui a changé et comment durant 2015 ?

Le site rend accessible un grand nombre de statistiques (faites‐vous plaisir si vous souhaitez vous plonger dedans, c’est fait pour) ; cette dépêche résume les variations constatées en 2015.

Toute l’équipe du site vous souhaite une bonne année 2016 libre, ouverte et net ! Happy hacking. Happy GNU year!

Remise en ligne d'anciennes dépêches de 1999 et 2000

Posté par  (site web personnel) . Édité par Nÿco, Florent Zara, Bruno Michel et Nils Ratusznik. Modéré par claudex. Licence CC By‑SA.
43
2
mai
2012
LinuxFr.org

Il y a longtemps, lors d'une mise à jour du site (le passage au CMS daCode le 9 septembre 2000), les premières dépêches ne furent pas réimportées (cas de la tâche repoussée aux calendes grecques, ad kalendas graecas).

Les archéologues numériques du futur en étaient déjà désespérés par rétro-anticipation. Fort heureusement, il y a quelques mois, nous sommes retombés par hasard sur une archive de la liste de diffusion qui annonce quotidiennement les nouvelles dépêches.

Comme c'était pénible à faire, inutile et donc totalement indispensable, nous - Bruno et moi - les avons réimportées : 3 413 dépêches couvrant la période du 20 mai 1999 au 6 septembre 2000 (mise à jour : ainsi que 6 autres du 2 mars 1999 grâce à webarchive). Leurs éventuels commentaires sont par contre perdus.

Pour les consulter, aller voir les dépêches et demander à voir les dernières (lien « Dernier » en bas pour la pagination). Quelques titres choisis assez arbitrairement pour vous remettre dans l'époque : RedHat 6.0, Mandrake 7.0 (devenue Mandriva), Carte à puce: Roland Moreno (décédé il y a quelques jours) offre un million de francs, SSF le SSH français, PHP 4.0, le bug du 29 février 2000 (ça n'arriverait plus des choses comme ça…), le noyau 2.2.14, Blender 2.0, RSA dans le domaine public, WindowMaker 0.62.1, etc.

Statistiques 2013 du site LinuxFr.org

Posté par  (site web personnel) . Édité par Bruno Michel. Modéré par claudex. Licence CC By‑SA.
42
1
jan.
2014
LinuxFr.org

Ce début d'année est propice à un petit regard en arrière sur les douze derniers mois d'activité de LinuxFr.org ; bref l'occasion d'étudier l'évolution en termes de trafic web, de contenus créés, de commentaires déposés, de navigateurs utilisés, d'utilisation des fonctionnalités du site, etc. Qu'est-ce qui a changé et comment durant 2013 ?

Le site rend accessible un grand nombre de statistiques (faites-vous plaisir si vous souhaitez vous plonger dedans, c'est fait pour) ; cette dépêche résume les variations constatées en 2013.

Toute l'équipe du site vous souhaite une bonne année 2014 libre, ouverte et net ! Happy hacking. Happy GNU year!

Journal Où l'on fait le bilan des domaines .fr d'une et deux lettres, un an après leur ouverture au public

Posté par  (site web personnel) . Licence CC By‑SA.
42
29
sept.
2016
Ce journal a été promu en dépêche : Bilan à un an des domaines .fr d’une et deux lettres.

Le 9 décembre 2014, l’Afnic a commencé à accepter l’enregistrement de noms de domaine en .fr de moins de trois lettres, en trois phases :

  1. 9 décembre 2014 : les titulaires de droits ont pu demander l’enregistrement de leur nom de domaine (pour 200 €)
  2. 16 février 2015 : ouverture à tout le monde, au tarif de 15 000 €
  3. 23 février 2015 : le tarif passe à 10 000 €
  4. 2 mars 2015 : 5 000 €
  5. 9 mars 2015 : 100 €
  6. 11 mars 2015 (…)

Évolution des hyperliens sur LinuxFr.org

Posté par  (site web personnel) . Édité par Davy Defaud, BAud, Nils Ratusznik et dovik. Modéré par ZeroHeure. Licence CC By‑SA.
38
27
sept.
2018
LinuxFr.org

Un matin, une question existentielle a fait jour dans mon esprit, comme ça, venue d’on ne sait où. Probablement dans le même genre que l’envie de Google de virer le « www. » dans les URL — même si www.example.com et example.com ne sont pas forcément équivalents, ou ses autres envies de virer carrément les URL ou HPKP.

Bref, je me demandais « quels sont les schémas d’URI (scheme) et les domaines les plus utilisés par les visiteurs de LinuxFr.org dans les contenus et commentaires, et est‐ce que (plutôt comment) ça a changé au fil des années ? ».

Évidemment, ça ne donnera un état et une évolution que sur les visiteurs du site, et pas sur Internet en général (même si certains ne connaissent d’Internet que leur réseau social préféré, mais ceux‐là ne nous intéressent pas ici, car soit ils ne viennent donc pas sur LinuxFr.org, soit ils y sont en permanence mais ne mettent pas de liens pour en sortir vu qu’ils n’en sortent pas).


N. B. : Étonnamment, cette question a été jugée prioritaire par votre serviteur par rapport à la dépêche « Statistiques 2017 du site LinuxFr.org (2/2) » qui se bonifie en rédaction depuis le 7 janvier…

Statistiques 2012 du site LinuxFr.org

Posté par  (site web personnel) . Édité par Florent Zara et Bruno Michel. Modéré par patrick_g. Licence CC By‑SA.
37
2
jan.
2013
LinuxFr.org

Ce début d'année est propice à un petit regard en arrière sur les douze derniers mois d'activité de LinuxFr.org ; bref l'occasion d'étudier l'évolution en termes de trafic web, de contenus créés, de commentaires déposés, de navigateurs utilisés, d'utilisation des fonctionnalités du site, etc. Qu'est-ce qui a changé et comment durant 2012 ?

Le site rend accessible un grand nombre de statistiques (faites-vous plaisir si vous souhaitez vous plonger dedans, c'est fait pour) ; cette dépêche résume les variations constatées en 2012.

Toute l'équipe du site vous souhaite une bonne année 2013 libre, ouverte et net ! Happy hacking. Happy GNU year!

SHM : des métriques d’usage pour applications self-hosted… sans espionner les utilisateurs

Posté par  (site web personnel) . Édité par Xavier Teyssier. Modéré par Ysabeau 🧶. Licence CC By‑SA.
37
19
déc.
2025
Supervision

Quand on développe et distribue des applications open-source auto-hébergées, il y a une question très simple à laquelle il est presque impossible de répondre :

Combien d’instances actives de mon application sont réellement utilisées ?

SHM

C’est exactement le problème que j’ai rencontré avec Ackify, une application open-source de preuve de lecture de documents (politiques internes, procédures, formations, etc.), déployée en self-hosted par ses utilisateurs - sans que j'ai le moindre contrôle dessus.

Pas de SaaS, pas de compte centralisé, pas de tracking utilisateur.
Résultat : zéro visibilité.

👉 Combien d’instances Ackify tournent vraiment ?
👉 Quelles versions sont encore actives ?
👉 Quelles fonctionnalités sont utilisées (ou pas) ?

C’est pour répondre à ce besoin très concret que j’ai créé SHM – Self-Hosted Metrics.

Statistiques 2018 du site LinuxFr.org

37
6
jan.
2019
LinuxFr.org

En ce début d’année 2019, commençons par deux marronniers de saison : d’abord, bonne année à tous, meilleurs vœux, écrivez de belles dépêches en 2019, partagez et contribuez. Et ensuite, un petit regard en arrière sur les douze mois d’activité de LinuxFr.org en 2018 : quelles évolutions en termes de trafic Web, de contenus créés, de commentaires déposés, de navigateurs utilisés, d’utilisation des fonctionnalités du site, de contribution au code, etc. Bref, qu’est‐ce qui a changé et comment durant 2018 ?

Le site rend accessible un grand nombre de statistiques (faites‐vous plaisir si vous souhaitez vous plonger dedans, c’est fait pour) ; cette dépêche résume les variations constatées en 2018.

Journal À la recherche du Linuxfrien type

36
6
jan.
2026

Dans le cadre de cette étude, nous nous sommes penchée sur le lectorat de LinuxFR : qui est-il, quels sont ses réseaux ? En nous basant principalement sur les divers contenus, nous en avons dégagé un portrait du Linuxfrien type. Nous pensons qu’il est assez fidèle compte tenu de la qualité des données dont nous disposions.

Il se pourrait qu’il se glisse dans ce journal des références ou des allusions à des films, musiques, livres ou autres, voire, des jeux (…)

Statistiques 2019 du site LinuxFr.org

Posté par  (site web personnel) . Édité par Davy Defaud, ZeroHeure et Nils Ratusznik. Modéré par ZeroHeure. Licence CC By‑SA.
35
3
jan.
2020
LinuxFr.org

En ce début d’année 2020, commençons par deux marronniers de saison : d’abord, bonne année à tous, meilleurs vœux, écrivez de belles dépêches en 2020, partagez et contribuez. Et ensuite, un petit regard en arrière sur les douze mois d’activité de LinuxFr.org en 2019 : quelles évolutions en termes de trafic Web, de contenus créés, de commentaires déposés, de navigateurs utilisés, d’utilisation des fonctionnalités du site, de contribution au code, etc. Bref, qu’est‐ce qui a changé et comment durant 2019 ?

Le site rend accessible un grand nombre de statistiques (faites‑vous plaisir si vous souhaitez vous plonger dedans, c’est fait pour) ; cette dépêche résume les variations constatées en 2019.