Remise en ligne d'anciennes dépêches de 1999 et 2000

43
2
mai
2012
LinuxFr.org

Il y a longtemps, lors d'une mise à jour du site (le passage au CMS daCode le 9 septembre 2000), les premières dépêches ne furent pas réimportées (cas de la tâche repoussée aux calendes grecques, ad kalendas graecas).

Les archéologues numériques du futur en étaient déjà désespérés par rétro-anticipation. Fort heureusement, il y a quelques mois, nous sommes retombés par hasard sur une archive de la liste de diffusion qui annonce quotidiennement les nouvelles dépêches.

Comme c'était pénible à faire, inutile et donc totalement indispensable, nous - Bruno et moi - les avons réimportées : 3 413 dépêches couvrant la période du 20 mai 1999 au 6 septembre 2000 (mise à jour : ainsi que 6 autres du 2 mars 1999 grâce à webarchive). Leurs éventuels commentaires sont par contre perdus.

Pour les consulter, aller voir les dépêches et demander à voir les dernières (lien « Dernier » en bas pour la pagination). Quelques titres choisis assez arbitrairement pour vous remettre dans l'époque : RedHat 6.0, Mandrake 7.0 (devenue Mandriva), Carte à puce: Roland Moreno (décédé il y a quelques jours) offre un million de francs, SSF le SSH français, PHP 4.0, le bug du 29 février 2000 (ça n'arriverait plus des choses comme ça…), le noyau 2.2.14, Blender 2.0, RSA dans le domaine public, WindowMaker 0.62.1, etc.

Sur la partie pénible à faire :

  • le format des dépêches a changé (de l'HTML à convertir en markdown, sachant que l'on part d'archives de courriels au départ) ;
  • le format des liens a changé (deux fois rien que dans les dépêches importées) ;
  • le format des timestamps a changé ;
  • il faut importer dans 4 tables (nodes, news, paragraphs et links) ;
  • il faut retrouver les éventuels comptes à réassocier aux dépêches (et après coup c'est forcément partiel avec les adresses de courriel qui ont changé, les noms affichés qui ont été modifiés, etc.) ;
  • il y avait des doublons de dépêches (19) pour une raison non expliquée ;

Premiers constats :

  • le nombre de dépêches publiées est désormais de 20 500 (il a donc fait un bond de +17%) ;
  • la plus vieille dépêche du site ne parle plus de Java mais d'Echelon le système mondial d'interception des communications privées et publiques (mise à jour : la plus vieille dépêche parle désormais de DOSEMU 0.99.9);
  • le record du nombre de dépêches publiées par an est désormais en 2 000, avec 3054 (mais elles sont très courtes en général…) ;
  • l'année 1999 fait son apparition dans les statistiques de contenus ;
  • il faut bien reconnaître que la qualité des dépêches est meilleure actuellement (en forme et en fond) ;
  • Fabien Penso (fondateur du site) revient (temporairement) en seconde place du classement des plus prolifiques auteurs de dépêches publiées, et a désormais une très large avance au classement des modérateurs ayant été les plus actifs avec plus de 9 000 modérations (environ 3 000 pour le second).

Au passage, une autre modification avec des gros chiffres : suite à la dépêche Un an après la mise à jour majeure du site, grand nettoyage dans les comptes utilisateur, le traitement a été fait : 35 000 courriels de rappel ont été envoyés, un mois plus tard 33 000 comptes ont été fermés, un mois plus tard 17 550 comptes fermés sans commentaire ni contenu ont été purgés (-40% en nombre de comptes existants, il y en a actuellement ~25 000).

  • # Retour vers le futur

    Posté par . Évalué à  6 .

    Et cela permet même de faire un voyage vers le futur. Une dépêche sur le thème d'Android datant de 1999. En même temps il faut avouer que le sujet porte à confusion. Parles t-on de R2D2 ou du système de Google?

  • # DLFP is thriving

    Posté par . Évalué à  10 .

    il faut bien reconnaître que la qualité des dépêches est meilleure actuellement (en forme et en fond) ;

    Depuis des années on dit que DLFP is dying, c'est-à-dire que le nombre de dépêches publiées a constamment décru ces dernières années. Mais en prenant en compte la taille des dépêches, on arrive à la conclusion que linuxfr est en constante progression depuis 2004. Il n'y a jamais eu autant de contenu publié, et le volume publié était en 2011 2,5 fois la valeur de 2004.

    |Année|Nb dépêches|Taille moyenne|Total octets|
    +–––––+–––––––––––+––––––––––––––+––––––––––––+
    |1999 | 1384 | 709 | 981 256 |
    |2000 | 3064 | 767 | 2 350 088 |
    |2001 | 2728 | 883 | 2 408 824 |
    |2002 | 2526 | 831 | 2 099 106 |
    |2003 | 2105 | 1219 | 2 565 995 |
    |2004 | 1286 | 1505 | 1 935 430 |
    |2005 | 1004 | 1988 | 1 995 952 |
    |2006 | 941 | 2223 | 2 091 843 |
    |2007 | 970 | 2639 | 2 559 830 |
    |2008 | 924 | 3243 | 2 996 532 |
    |2009 | 1108 | 3716 | 4 117 328 |
    |2010 | 1049 | 4229 | 4 436 221 |
    |2011 | 974 | 4962 | 4 832 988 |

    (Ça, ou le markup est de plus en plus verbeux.)

    • [^] # Re: DLFP is thriving

      Posté par (page perso) . Évalué à  10 .

      |extrapolation 2012 | 1329 | 4368 | 5 805 072 |

      En tout cas le nombre de dépêches est à la hausse cette année et c'est très bien ainsi. Les efforts côté rédaction contributive et collaborative commencent à porter et ça fait plaisir.

    • [^] # Re: DLFP is thriving

      Posté par (page perso) . Évalué à  2 .

      Il faudrait aussi comparer le nombres de commentaires des news. Une grosse partie des informations intéressantes de l'époque venaient du contenu de ces commentaires. Maintenant, ils se sont déplacés dans les journaux alors que les news dépassent rarement 2 ou 3 commentaires.

      Les news sont globalement moins sujettes à discussion/correction/trolls/… Certaines sont juste des résumés d'articles de la semaine ou même des journaux intéressants, niveau intérêt, on a vu mieux…

      • [^] # Re: DLFP is thriving

        Posté par (page perso) . Évalué à  5 .

        Il faudrait aussi comparer

        Beh faisons-le :). Les chiffres sont disponibles dans les statistiques. En 2011, 26 commentaires par dépêche en moyenne et 51 par journal.

        Dans les chiffres non disponibles, on peut trouver la médiane à 10 pour les dépêches et 31 pour les journaux.

        On reste quand même loin du 2 ou 3 annoncé.

        Côté intérêt (et donc note), en 2011, moyenne de 20 et médiane de 21 pour les dépêches, et moyenne de 12 et médiane de 13 les journaux (donc les dépêches ont été jugées plus intéressantes que les journaux par les visiteurs).

        • [^] # Re: DLFP is thriving

          Posté par (page perso) . Évalué à  2 .

          Pourrait-on lier cela à une visibilité accrue des dépêches par rapport aux journaux ? Après tout, sauf dans le cas de journaux marquant faisant l'objet d'une dépêche, ils ne sont pas affichés en page d'accueil par défaut.

        • [^] # Re: DLFP is thriving

          Posté par . Évalué à  3 .

          peut on comparer la proportion de commentaire tournant autour d'un type de dépèche précise (non seulement la section -justice, kernel , .. - mais surtout tourtant autour de certains mots clés ) cela permettrait de connaitre l'intéret des visiteurs de dlfp.
          Je m'attend à un déséquilibre marqué disons pour les sujets technos et peut etre certaines dépeche juridico-politique.

          Ensuite, cela serait de trouver un moyen de mesurer la pertinence des commentaire, (bon il y a le moyen en utilisant les notes de chaque commentaire et cherchant le rapport entre les types de dépeche et le nombre de commentaire pertinenté-) mais je suis pas sur que cela montrerait la véritable pertinence (encore faudrait définir ce qu'elle est, en général certains commentaire sont pertinenté à cause de leur humour )

    • [^] # Re: DLFP is thriving

      Posté par (page perso) . Évalué à  5 .

      Shannon doit se retourner dans sa tombe… Ce qui compte c'est l'entropie. Et là j'ai l'intuition qu'on dit en 10E42 mots ce qu'on aurait dit en 42 à l'époque.

  • # WindowMaker 0.62.1

    Posté par . Évalué à  10 .

    Une nouvelle dépêche pour annoncer la sortie de WindowMaker est toujours bonne à prendre.

  • # Wow

    Posté par . Évalué à  2 .

    Certaines dépêches sont vraiment courtes, parfois la NdM est aussi longue que le contenu :-)

    Article Quarante-Deux : Toute personne dépassant un kilomètre de haut doit quitter le Tribunal. -- Le Roi de Cœur

  • # doublons

    Posté par (page perso) . Évalué à  3 .

    Plusieurs doublons périodes fin 99 : http://linuxfr.org/news?page=1279

  • # Les origines du mal

    Posté par (page perso) . Évalué à  5 .

    L'article indique que les premières dépêches ne furent pas ré-importées lors du passage à Da-Code, mais que la tâche semblait prévue, car repoussée aux calendes grecques.

    Qu'est-ce qui s'est passé entre ce moment et la perte des archives? Il y a espoir de les retrouver quelque part avec les commentaires, ou on les sait définitivement perdues?

    Parce qu'une des grandes questions de la vie, c'est bien de savoir qui le premier a écrit « lapin compris », « c'est triste ton avis », « plussoyer », « moinsser », « c'était mieux à vent », « 42 » et autres dlfpismes.

    • [^] # Re: Les origines du mal

      Posté par (page perso) . Évalué à  3 .

      Qu'est-ce qui s'est passé entre ce moment et la perte des archives? Il y a espoir de les retrouver quelque part avec les commentaires, ou on les sait définitivement perdues?

      Les serveurs de cette époque ont disparu avec leurs disques durs. Il n'y a pas à ma connaissance de copie de la base de données de l'époque. Je pencherais bien pour des commentaires définitivement perdus. Après si quelqu'un retrouve la tablette de marbre tombée derrière le buffet du salon sur laquelle avait été gravée les sauvegardes de cette époque, on pourrait peut-être y remédier. Mais ça reste peu probable.

  • # mor?no

    Posté par (page perso) . Évalué à  2 .

    Carte à puce: Roland Moreno

    A ne pas confondre avec Dario ni avec Nadine :)

Suivre le flux des commentaires

Note : les commentaires appartiennent à ceux qui les ont postés. Nous n'en sommes pas responsables.