Prédire la note d’un journal sur LinuxFr.org

137
9
juin
2017
LinuxFr.org

Cette dépêche traite de l’exploration de données sur des données issues de LinuxFr.org.

Ayant découvert récemment scikit-learn, une bibliothèque Python d’apprentissage statistique (machine learning). Je voulais partager ici un début d’analyse sur des contenus issus de LinuxFr.org.

Avertissement : je ne suis pas programmeur, ni statisticien. Je ne maîtrise pas encore tous les arcanes de scikit-learn et de nombreux éléments théoriques m’échappent encore. Je pense néanmoins que les éléments présentés ici pourront en intéresser plus d’un(e).

Tous les scripts sont codés en Python et l’analyse à proprement parler a été réalisée à l’aide d’un notebook Jupyter. Un dépôt contenant les données et les scripts est disponible sur GitLab.

Journal Il y a 15 ans, j'ai fondé LinuxFr

127
9
juin
2013

Note: J'ai posté hier sur mon blog un billet Anglais intitulé 15 years ago, I founded LinuxFr. Patrick Guignot a eu la gentillesse de le traduire en Français, j'y ai apporté quelques changements et en voici le résultat. Merci à lui, et merci à vous.

Il y a 15 ans, j'ai fondé LinuxFr

1998, Internet grandit plus rapidement que quiconque s'y attend. J'ai 19 ans et je vis encore chez mes parents, j'utilise IRC, FTP pour télécharger, et je (...)

LinuxFr.org, un site adulte

Posté par (page perso) . Édité par Nils Ratusznik. Modéré par Nils Ratusznik. Licence CC by-sa
113
28
juin
2016
LinuxFr.org

LinuxFr.org fête aujourd'hui 28 juin 2016 ses 18 ans : bon anniversaire LinuxFr.org ! Merci à tous ceux qui ont contribué et contribuent au succès du site : administration système, animation de l'espace de rédaction, développement, modération, dons, écriture de contenus, etc. Le meilleur moyen de nous dire merci est de proposer une dépêche ou d'en rédiger collaborativement dans l'espace de rédaction pour faire vivre le site.

Alors, ça fait quoi d'avoir 18 ans ?

Côté chiffres, le site comporte plus de 96 500 contenus publiés (environ 36 000 journaux, 34 000 entrées de forum, 24 000 dépêches, 360 sondages, 70 pages de wiki), et plus de 1,65 million de commentaires. Mais aussi plus de 200 entrées ouvertes dans le système de suivi des suggestions et des bogues, ce qui représente un gros boulot à réaliser. Bref, nous sommes preneurs de toutes les bonnes volontés pour contribuer sur les nouveaux contenus et améliorer le code du site.

LinuxFr.org fête aujourd'hui ses 17 ans

Posté par (page perso) . Édité par tankey. Modéré par Benoît Sibaud. Licence CC by-sa
113
28
juin
2015
LinuxFr.org

LinuxFr.org fête aujourd'hui 28 juin ses 17 ans : bon anniversaire LinuxFr.org ! Merci à tous ceux qui ont contribué et contribuent au succès du site : administration système, animation de l'espace de rédaction, développement, modération, dons, écriture de contenus, etc. Le meilleur moyen de nous dire merci est de proposer une dépêche ou d'en rédiger collaborativement dans l'espace de rédaction pour faire vivre le site.

Party Balloons

Et en 17 ans, ça donne quoi ?

Côté chiffres, le site comporte plus de 93 500 contenus publiés (environ 35 000 journaux, 32 000 entrées de forum, 23 000 dépêches, 340 sondages, 70 pages de wiki), et plus de 1,59 million de commentaires.

Nouvelle version de LinuxFr.org

Posté par (page perso) . Modéré par Benoît Sibaud.
110
20
fév.
2011
LinuxFr.org

Le site LinuxFr.org existe depuis juin 1998. Il est passé par différentes versions, fonctionnant avec différents moteurs : DaCode, Templeet et maintenant Ruby on Rails. Le site a donc utilisé le tout intégré DaCode, puis des modèles de page en Templeet développés par l'équipe du site, puis une version intégrée en Ruby.

Templeet avait été lancé principalement pour LinuxFr.org, il a été et est utilisé par d'autres sites comme moteur de « templates ». Il continuera sa vie de son côté, une version 4 étant attendue d'ici quelques mois.La nouvelle version propose une charte graphique refaite pour l'occasion. Un concours a été organisé dans ce but et la feuille de style (CSS) gagnante, RonRonnement, est devenue la nouvelle CSS par défaut. Si celle-ci ne vous plaît pas, vous pouvez toujours profiter des autres CSS (l'ancienne feuille de style est là sous le nom kaiska-new).Il est difficile de lister tous les changements liés à cette migration, mais voici les plus notables :

  • Les contenus et commentaires utilisent maintenant une syntaxe wiki, du Markdown en l'occurrence ;
  • L'espace de rédaction collaboratif a été refait (d'ailleurs, cette dépêche a été écrite simultanément par les 3 admins du site : lukhas, oumph et NoNo) ;
  • Le site intègre maintenant un wiki ;
  • Chaque utilisateur a maintenant un avatar : par défaut, il vient de gravatar mais il peut être changé dans les préférences ;
  • Les utilisateurs authentifiés peuvent étiqueter les contenus ;
  • Le script d'envoi de la lettre quotidienne d'annonce des dépêches est à refaire.Mais certaines fonctionnalités n'ont pas encore été portées : la messagerie interne, les statistiques et le choix des contenus sur la première page.

Après les remous de la migration vers le nouveau site, l'équipe du site est à votre écoute pour recenser tous les problèmes que vous pourriez rencontrer.

Journal Les fautes des Linuxfriens

Posté par (page perso) . Licence CC by-sa
90
4
mai
2012

Sommaire

Il est connu que chaque être humain, lors de l’écriture de sa propre langue, est enclin à faire des fautes. Certains, ici comme ailleurs, auraient eu la tête coupée par un Académicien plus d’une fois (...)

Architecture logicielle de la nouvelle version de LinuxFr.org

Posté par (page perso) . Édité par Benoît Sibaud. Modéré par tuiu pol.
90
23
fév.
2011
LinuxFr.org

La nouvelle version de LinuxFr.org est en ligne depuis quelques jours. Vous nous remontez régulièrement des bugs et des propositions d'améliorations dans le suivi. Je vous encourage à continuer et à commenter / voter sur les entrées qui vous intéressent.

Voici quelques entrées sur lesquelles j'aimerais particulièrement avoir vos retours :

Je pense que vous êtes également intéressés par l'architecture logicielle de cette nouvelle version. Vous pourrez donc trouver quelques explications à son sujet en seconde partie et n'hésitez pas à poser des questions dans les commentaires.

Migration LinuxFr.org terminée

Posté par (page perso) . Modéré par Bruno Michel. Licence CC by-sa
90
13
juil.
2011
LinuxFr.org

La migration du site LinuxFr.org vers le nouveau serveur est terminée (aux mises à jour DNS près). L'ancien serveur trogood (mis en place en 2003, et non zobe mis en place en 2007 comme précédemment annoncé) consommait trop et la fondation Free nous a proposé de le remplacer par un nouveau serveur récent moins énergivore. Le nouveau serveur est en place, reste à le baptiser (après zobe, trogood, prout, blob).

Merci à la Fondation Free pour le nouveau serveur et à son NOC pour sa réactivité. Et merci à Lucas qui a réalisé l'essentiel de la migration.

Pour l'historique des anciens serveurs, voir la présentation RMLL 2008 sur les 10 premières années du site.

Les caractéristiques du nouveau serveur :

(caractéristiques rééditées le 18/07 pour correction)

  • Dell PowerEdge R210 (comme les Dédibox, en version 1)
  • rackable 1U
  • 16 GiB de mémoire vive (DIMM 1333 MHz, 4*4)
  • 2 TiB de disque dur (ext4, RAID, Seagate Constellation ES 2To SATA II 32Mo modèle ST32000644NS)
  • 45 GiB d'espace d'échange
  • Intel Xeon L3426 1,87 GHz (4 cores * 2 via hyperthreading)
  • 2 cartes réseau Broadcom NetXtreme II BCM5716 Gigabit ethernet
  • module d'administration à distance DRAC interne
  • jantes alu et néons bleu

L'ancien serveur avait un hôte sous Debian en 32 bits et des vservers sous Debian aussi (vserver étant peu à peu déprécié). Le nouveau serveur a un hôte sous Ubuntu Server (pour la prise en charge de LXC) en 64 bits et des conteneurs sous Debian.

N.b.: le serveur a changé d'adresse IPv4, donc si vous avez mis l'IP en dur dans un /etc/hosts, vous devriez avoir des problèmes à un moment. Et par ailleurs, l'IPv6 pourrait arriver à terme.

Ça continue d'avancer LinuxFr.org en Rails

Posté par (page perso) . Édité par Benoît Sibaud. Modéré par tuiu pol. Licence CC by-sa
77
4
avr.
2011
LinuxFr.org

Quand je ne suis pas occupé à faire des poissons d'avril, il m'arrive de coder de nouvelles fonctionnalités pour LinuxFr.org. Voici quelques-unes des dernières nouveautés :

  • Les utilisateurs anonymes peuvent maintenant remonter des bugs dans le suivi, ce qui peut être pratique pour les personnes qui rencontrent justement des problèmes pour se connecter ;
  • Une nouvelle CSS a été ajoutée à la liste des CSS alternatives : cascade-alternative ;
  • Un correcteur orthographique détecte maintenant les erreurs d'orthographe et les souligne en rouge lors de la prévisualisation des contenus et commentaires ;
  • La toolbar permet maintenant de naviguer entre les contenus lus avec de nouveaux commentaires avec les touches [ et ], ou h et l ;
  • La gestion des tags a été revue et il est maintenant possible de supprimer un de vos tags en cliquant sur l'icône Supprimer de vos tags à sa gauche ou voter pour un tag en l'ajoutant aux vôtres par l'icône Ajouter à vos tags qui permettra ultérieurement de juger de sa popularité ;
  • L'anti-spam sur les dépêches a été renforcé suite à une vague de spams ;
  • Des statistiques sur le suivi sont maintenant disponibles et celles pour les autres types de contenus devraient suivre ;
  • Les dépêches écrites dans l'espace de rédaction sont automatiquement placées sous licence CC by-sa ;
  • Les GIF animés sont désormais bloqués pour les avatars ;
  • Et bien sûr de nombreuses corrections de bugs :p

J'espère que vous appréciez ces évolutions et que vous allez continuer à voter et/ou commenter les entrées du suivi qui vous intéressent, votre ressenti ou utilisation particulière de LinuxFr - lorsque précisé dans les commentaires - permettant d'orienter les développements.

LinuxFr.org fête aujourd'hui ses 14 ans

Posté par (page perso) . Édité par Florent Zara, Nÿco et Christophe Guilloux. Modéré par Christophe Guilloux. Licence CC by-sa
72
28
juin
2012
LinuxFr.org

LinuxFr.org fête aujourd'hui 28 juin ses 14 ans : bon anniversaire LinuxFr.org ! Merci à tous ceux qui ont contribué et contribuent au succès du site : administration système, développement, modération, dons, écriture de contenus, etc. Le meilleur moyen de nous dire merci est de proposer une dépêche ou d'en rédiger collaborativement dans l'espace de rédaction pour faire vivre le site.

Et en 14 ans, ça donne quoi ?

Côté chiffres, le site comporte plus de 83 000 contenus publiés (environ 32 000 journaux, 29 000 entrées de forum, 20 000 dépêches, 260 sondages, 130 pages de wiki), et plus de 1,3 million de commentaires. Pour finir, sachez que 3 419 dépêches couvrant la période de 1999 à 2000 ont été retrouvées et remises en ligne en mai dernier.

On ne présente plus LinuxFr.org… enfin, si…

Après « Dix ans » aux RMLL 2008 Mont-de-Marsan et « Retour d'expérience sécurité sur 11 ans » aux RMLL 2009 Nantes, « LinuxFr.org, un joli site Ruby on Rails » au sein du thème Internet, et « Comment bien utiliser LinuxFr.org ? » aux RMLL 2011 Strasbourg, LinuxFr.org fera une présentation cette année aux RMLL 2012 Genève au sein du thème Communautés, intitulée « LinuxFr.org : contributif, consulté, connecté, … mais aussi consternant, consensuel, conspuant ». Venez nous voir !

Journal Avoir du marbre (et des discussions techniques)

Posté par (page perso) . Licence CC by-sa
69
24
fév.
2014

Ça fait bien longtemps que ça me trotte dans la tête : les dépêches en avalanche tuent la discussion et font trop vite disparaître les contenus les plus riches.

Je m'explique :

À force de dépêches et de débats de grande qualité Linuxfr est devenu bien plus qu'un « quotidien » d'informations — c'est un site de référence (les efforts sur le code n'y étant pas non plus pour rien). Et un site très vivant. Les trolls, la Tribioune et les dérives (...)

Journal LinuxFr.org n'aime pas discuter du hors sujet [titre réécrit]

68
1
avr.
2016

Ce matin, Zeroheure et moi avons démarré une dépêche sur le traitement du hors-sujet sur notre site préféré. Une fois n'est pas coutume, non seulement la dépêche est partie (trop) vite en modération, mais en plus, la dépêche a été modérée (trop) vite, refusée en mode 49.3 par NoNo en personne.

Dans un soucis de préservation de la liberté d'expression, je vais recopier ici le texte de la dépêche. Et si jamais un modérateur ou administrateur du site venait à (...)

Actualités de l'association LinuxFr

Posté par (page perso) . Édité par BAud, M5oul et Florent Zara. Modéré par Xavier Claude. Licence CC by-sa
67
19
déc.
2015
LinuxFr.org

Quelques petites actualités concernant l'association LinuxFr : cette dépêche contiendra des problèmes logiciels, du suspens, un bilan financier, des soucis matériels, pas de neige, un rapport moral, mais aussi une visite au datacenter et une élection du bureau. Et tout cela le même jour, le 9 décembre 2015.

Un an après la mise à jour majeure du site, grand nettoyage dans les comptes utilisateur

Posté par (page perso) . Édité par Florent Zara, baud123, Bruno Michel, Malicia, Nÿco et patrick_g. Modéré par Malicia. Licence CC by-sa
Tags :
60
16
fév.
2012
LinuxFr.org

Il y a un an, le 20 février 2011 pour être précis, le site LinuxFr.org a migré vers une toute nouvelle version en Ruby On Rails (pour fuir Templeet). Les statistiques sur les utilisateurs du site nous apprennent qu'il y a environ 45 000 comptes qui ont été créés depuis la mise en place du site, qu'il en reste environ 42 000, dont 180 fermés et 3  900 valides et utilisés au cours des 3 derniers mois.

Les comptes créés avant la migration ont leur mot de passe stocké sous forme hachée DES 13 caractères (pas sous forme lisible, pas en clair pour résumer, mais un peu vieillot et peu sûr comme format). Les comptes créés ou utilisés après la migration ont leur mot de passe stocké sous forme hachée Blowfish 60 caractères (pas en clair et mieux protégé pour résumer).

35 000 comptes n'ont pas migré vers le nouveau format de stockage (et ont donc un mot de passe stocké dans l'ancien format). 600 comptes ont migré mais il existe encore une version de leur mot de passe de l'époque dans l'ancien format. Afin de supprimer de sa base de données les anciennes formes de mots de passe moins sûres, et parce qu'évidemment il ne nous est pas techniquement possible de convertir nous-même votre mot de passe vu que nous ne le connaissons pas, nous allons relancer par courriel tous les comptes ouverts et non utilisés depuis la migration :

  • pour les comptes qui n'auront pas été utilisés entre le 20 février 2011 et le 31 mars 2012, nous les fermerons et supprimerons le mot de passe et l'adresse de courriel associée (*). Leurs contenus et commentaires resteront en ligne ;
  • pour les autres comptes, l'ancienne forme du mot de passe sera supprimée de la base, tout le monde y gagnera en sécurité et cela simplifiera le schéma de notre base de données et le code de traitement des mots de passe.