Journal LinuxFr.org : seconde quinzaine de décembre 2020

Posté par  (site Web personnel) . Licence CC By‑SA.
Étiquettes :
11
2
jan.
2021

Cent cinquante-neuvième épisode dans la communication entre les différents intervenants autour du site LinuxFr.org : l’idée est de tenir tout le monde au courant de ce qui est fait par les rédacteurs, les admins, les modérateurs, les codeurs, les membres de l’association, etc.

Bonne année 2021 !

L’actu résumée ([*] signifie une modification du sujet du courriel) :

Statistiques

Du 16 au 31 décembre 2020

  • 1653 commentaires publiés (dont 10 masqués depuis) ;
  • 3876 tags posés ;
  • 104 comptes ouverts (dont 40 fermés depuis) ;
  • 54 entrées de forum publiées (dont 25 masquées depuis) ;
  • 75 liens publiés (dont 5 masqués depuis) ;
  • 25 dépêches publiées ;
  • 28 journaux publiés (dont 2 masqués depuis) ;
  • 4 entrées nouvelles, 1 corrigée et 1 invalide dans le système de suivi ;
  • 1 sondage publié ;
  • 0 page wiki publiée (dont 0 masquée depuis).

Listes de diffusion (hors pourriel)

Liste ca@ - [restreint]

  • R.A.S.

Liste linuxfr-membres@ - [restreint]

  • R.A.S.

Liste moderateurs@ - [restreint]

  • [Modérateurs] Se désinscrire
  • [Modérateurs] Demande de supprimer le journal

Liste prizes@ - [restreint]

  • R.A.S.

Liste redacteurs@ - [restreint]

  • R.A.S.

Liste team@ - [restreint]

  • [team linuxfr] Sympa refait des misères
  • [team linuxfr] Changement de pseudo svp

Liste webmaster@ - [restreint]

  • R.A.S.

Canal IRC adminsys (résumé)

  • on a pu croire que l’on avait encore un souci avec Sympa
  • Ruby 3 mieux que Ruby 2, yapuka
  • le tri par défaut (y compris pour les non authentifiés) est le tri par intérêt (voir l’aide pour la définition de l’intérêt)
  • code pour notifier les affichages/masquages des étiquettes et la création de nouvelles étiquettes (plus un grand nettoyage parmi les étiquettes), qui sera aussi le premier bug de l’année 2021…
  • travaux sur les notifications des événements de modération / rédaction
  • il reste peu de temps pour la version Flash du site

Tribune de rédaction (résumé)

  • du spam signalé (et aussi du spam dans la tribune de rédaction)
  • suite à divers signalements, du ménage dans les étiquettes du site pour :
    • corriger les accents : la première version saisie est celle qui reste, même si été et ete sont ensuite considérés identiques
    • avoir des soulignés pour remplacer des espaces (et garder les tirets pour les mots-composés)
    • utiliser prénom_nom pour les personnalités (plutôt qu’avoir prénom et nom comme étiquettes séparées, ou juste le nom)
    • avoir des mots au singulier pour éviter les doublons
    • réduire le nombre d’étiquettes visibles à moins de 11 700 ce qui me semble toujours énorme
  • (antistress) 12 dépêches en cours de modération : joyeux Noël à l’équipe ! ;)
  • des corrections post-publications demandées

Tribune de modération (résumé)

(sur l’historique disponible)

Commits/pushs de code https://github.com/linuxfrorg/

  • Merge pull request #287 from linuxfrorg/tag_moderation_board
  • Notify moderation board about a new tag or a tag visibility change
  • Add reattribuer_la_paternite.png picture
  • Explicit the purpose of the tracker

Divers / TODO / pense-bête

  • aide / FAQ : synthèse en cours d’écriture sur le karma ;
  • préparer une dépêche sur les mises en demeure n°4 et n°5 ;
  • interventions à faire sur les serveurs zobe et gruik ;
  • finaliser le rapport moral et préparer l’assemblée générale de LinuxFr ;
  • écrire une page statique avec l’histoire du site ;
  • finaliser un peu le code qui permet de tester actuellement 283 adresses du site
  • # De la petite étique

    Posté par  (site Web personnel) . Évalué à 4.

    réduire le nombre d’étiquettes visibles à moins de 11 700 ce qui me semble toujours énorme

    Cela a encore un peu baissé depuis. Cf les statistiques sur les étiquettes : 12802 étiquettes, dont 11484 étiquettes publiques ; mais bon 11500 mots de vocabulaire (si je puis dire, vu qu'une étiquette ça peut être des mots, des noms de personnes, de lieux, de projets, des nom+adjectif, etc.) ça me semble encore beaucoup. Après tout le but des étiquettes c'est de retrouver des contenus qui ont quelque chose en commun : si l'étiquette n'est utilisée qu'une seule fois des années après sa création, si on a des étiquettes vermillon/écarlate/garance/vermeil/etc. mais jamais la même sur des contenus qui parlent du rouge et pire que rouge n'est pas une étiquette, si l'étiquette posée comporte une typo comme dévellopeur (au lieu de développeur), etc. bref il y a plein de cas où l'étiquette publique est inutile (elle peut à la rigueur être utile à celui qui l'a posée, mais elle n'a pas besoin d'être publique). Sans parler des cas où l'étiquette est problématique en elle-même (insulte, injure, etc.).

    • [^] # Re: De la petite étique

      Posté par  (site Web personnel) . Évalué à 3.

      Faut peut être soumettre les étiquettes au pertinentage/inutilage ?

      Adhérer à l'April, ça vous tente ?

      • [^] # Re: De la petite étique

        Posté par  (site Web personnel) . Évalué à 3. Dernière modification le 02/01/21 à 17:24.

        Pour les étiquettes je ne pense pas que l'on puisse juste les soumettre à du pertinent/inutile : les étiquettes concernent globalement le site, pas juste un contenu, même si elles sont portées par un ou plusieurs contenus. Chaque contenu (enfin les gens qui lisent chaque contenu) ne devrait pas opter pour des étiquettes en ignorant tout ce qui existe par ailleurs. Ou plutôt, idéalement, ça serait mieux que les étiquettes les plus utiles soient celles qui sont visibles, qui sont suggérées et qui sont réutilisées, quitte à ce que des étiquettes masquées soient présentes aussi voire réutilisées (mais jamais suggérées).

        Exemple : dépêche sur le noyau Linux 8.42 qui vient de sortie en 2033. Il va avoir les étiquettes linux, noyau, kernel, linux_842 par exemple. OK les deux premières sont pertinentes pour être visibles (elles sont déjà utilisées une centaine de fois ou plus). kernel est un anglicisme, un doublon de noyau, elle va être masquée (on garderait kernel-package ou kernel_recipes qui sont des noms propres par exemple). Et linux_842 est, a priori, inutile, il n'y aura pas d'autres sorties de Linux 8.42 et il est peu probable que le noyau 8.42 ait beaucoup d'autres contenus directement liés à lui.

        Du coup il y a du jardinage à faire pour ajouter les étiquettes qui manquent, corriger les typos dans les étiquettes, éviter les doublons, masquer les inutiles, dégager les spammeurs, etc. Ce jardinage me semble plus compliqué que juste noter pertinent/inutile : pour aider, il faut étiqueter les contenus, signaler les doublons, etc.

        • [^] # Re: De la petite étique

          Posté par  . Évalué à 2. Dernière modification le 02/01/21 à 19:06.

          Utiliser un stemmeur puis un dico des synonymes rendrait service, je pense. Peux-tu extraire la table des étiquettes pour qu'on fasse des essais ?

          • [^] # Re: De la petite étique

            Posté par  (site Web personnel) . Évalué à 4.

            Il reste désormais 11276 étiquettes publiques (après avoir viré les étiquetages des contenus masqués et les étiquettes à décompte désormais nul).

            Deux tiers ne sont pas des mots du dictionnaire (en prenant le paquet wfrench), en raison des expressions de plusieurs mots, des chiffres et symboles, des noms propres, probablement des fôtes aussi, etc. (et en convertissant les '_' en espaces avant).

            Sur l'autre tiers, il y a probablement quelques doublons encore. Mais sortir l'artillerie lourde pour trier quelques doublons ça me semble exagéré (pour le gain espéré disons).

            Ensuite ça pose un autre souci : en l'état, on ne gère pas les synonymes ou de redirection vers une autre étiquette ou des équivalences. On a des étiquettes publiques et suggérées, et des étiquettes masquées. Admettons que l'on veuille rendre synonymes (pris au pif sur https://fr.wikipedia.org/wiki/Liste_de_synonymes_concernant_l%27informatique ) :

            explorateur web = navigateur web
            fureteur = navigateur web
            

            Si on en choisit un pour masquer les autres, ceux qui utilisent les autres ne trouveront pas vraiment, et jamais ils n'auront de suggestion pertinente en tapant fureteur ou explorateur si on n'a retenu que navigateur. Si on les laisse tous, on aura un joyeux mélange, et il faudra tri-étiqueter chaque contenu (et ça sera du taf a posteriori que personne ne veut faire). (Si on les enlève tous on aura un vrai problème aussi).

            Le même souci se pose d'ailleurs sur certaines mauvaises étiquettes : par exemple driver pour pilote. On voudrait suggérer pilote, et éviter que les gens utilisent driver, mais ça serait pas mal que driver renvoie vers pilote d'une manière ou d'une autre, idéalement pendant les suggestions. Actuellement si je commence à taper 'driv' comme étiquette on me propose mandriva, openmandriva, onedrive et soliddriver, mais jamais pilote.

            Tant que cette modification n'est pas codée, je ne crois pas très utile de pousser plus loin une optimisation de la base des étiquettes.

            Sinon côté étiquetage j'aimerais bien avoir une fonctionnalité d'étiquetage massif en modération/admin aussi : par exemple dire « Je veux tous les contenus qui parlent de Julian Assange mais qui n'ont pas l'étiquette julian_assange », et ensuite tous ou peut-être une sélection sont étiquetables.

            • [^] # Re: De la petite étique

              Posté par  . Évalué à 1.

              En effet, c'est souvent dommage de ne pas pouvoir faire de requêtes croisées sur les étiquettes. Il y a qq jours je voulais retrouver une dépêche sur un logiciel mais les étiquettes me donnaient trop de réponses.

              Pourquoi n'y a-t-il pas de page avec la liste des étiquettes et des liens ? Par volonté ou par manque de code ?

              • [^] # Re: De la petite étique

                Posté par  (site Web personnel) . Évalué à 4.

                La page existe pour la modération (enfin elle affiche les 10000 premières étiquettes parce qu'à l'époque je me suis dit 10k_is_enough_for_anyone…). Mais les spammeurs utilisent pas mal les étiquettes, du coup je voulais nettoyer un peu avant de la sortir, et puis afficher tout n'est pas très utile au final pour le visiteur (les étiquettes populaires et les suggestions sont plus utiles). Là on parle plus d'un export des étiquettes qui pourrait être complet (et qui pourrait être inutile pour spammer aussi).

            • [^] # Re: De la petite étique

              Posté par  (site Web personnel) . Évalué à 2.

              Sinon côté étiquetage j'aimerais bien avoir une fonctionnalité d'étiquetage massif en modération/admin aussi : par exemple dire « Je veux tous les contenus qui parlent de Julian Assange mais qui n'ont pas l'étiquette julian_assange », et ensuite tous ou peut-être une sélection sont étiquetables.

              Ah oui, ça, ça serait super.

              « Tak ne veut pas quʼon pense à lui, il veut quʼon pense », Terry Pratchett, Déraillé.

        • [^] # Re: De la petite étique

          Posté par  . Évalué à 1.

          Tu as passé la liste des étiquettes à travers un outil de dédoublonnage ?

      • [^] # Re: De la petite étique

        Posté par  (site Web personnel) . Évalué à 1.

        J'ai moinssé, pour la peine ;)

    • [^] # Re: De la petite étique

      Posté par  . Évalué à 2.

      Après tout le but des étiquettes c'est de retrouver des contenus qui ont quelque chose en commun

      Justement, comment fait-on pour retrouver du contenu avec des tags précis ?
      Par exemple, je suis sur la page d'accueil de linuxfr.org, où dois-je cliquer pour faire des recherches par tags ?

      J'avais vu, il y a quelques années comment faire pour rechercher un (1!) tag précis en formatant l'url suivante :
      https://linuxfr.org/tags/TAG_RECHERCHE/public
      Mais c'est hyper limité et pas intuitif (faut connaître la syntaxe).

      Bref, étiqueter c'est bien (je l'ai fait il y a quelques années) mais s'en servir c'est mieux (moi j'ai laissé tombé car je ne sais pas comment m'en servir).

      • [^] # Re: De la petite étique

        Posté par  (site Web personnel) . Évalué à 3.

        Tu cliques sur l'étiquette, par exemple SPIP et accessoirement, pour cette recherche avec Duck DUck Go, quand tu entres "SPIP" dans le module de recherche de linuxfr, "tous les contenus étiquetés avec SPIP" est le premier résultat

        « Tak ne veut pas quʼon pense à lui, il veut quʼon pense », Terry Pratchett, Déraillé.

        • [^] # Re: De la petite étique

          Posté par  . Évalué à 3.

          Merci pour l'info.

          Je n'avais pas le même résultat que toi, jusqu'à ce que j'active le javascript pour Duckduckgo.

          Mais cela reste quand même très basique, car c'est toujours un seul tag à la fois d'après les essais que j'ai fait. Donc au final, quelles sont les cas d'utilisation de ces tags ?
          Car si on met un tag "large" (genre ipv6), il va y avoir trop de réponses, impossible de retrouver quoi que ce soit.
          Ou bien un tag "précis" (genre pfsense2.4.1), mais dans ce cas, on perdra ceux qui voulait entendre parler de pfsense ou même de firewall (surtout qu'il faut savoir qu'il existe ce tag).

          Je suis donc un peu dubitatif… ou alors, quelque chose m'a échappé.

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.