(Précisions sans grande importance dans le débat en cours)
À noter qu’il existe également une distinction entre l’association LinuxFr.org et l’équipe de modération sont deux choses différente.
L'association se nomme Linuxfr, et donne une entité légale au site, pour le compte bancaire et la responsabilité.
Ni le président, ni le vice président, ni le trésorier ne sont actuellement membres de l’équipe de modération il me semble, et je n’ai pas l’impression qu’un membre de l’actuelle équipe de modération soit membre de l’association (ou s’il y en a, ils sont minoritaires).
Les admins du site font partie de l'équipe de modération. Le président de l'association et le trésorier et divers autres membres de l'association en font partie. Ils sont probablement majoritaires d'ailleurs. Et un mini effet dans la modération via la règle cas limite Si trois personnes ou plus, comprenant au moins deux membres de l’association LinuxFr, se sont toutes exprimées pour la même décision, elle est considérée comme adoptée. (source https://linuxfr.org/regles_de_moderation_du_problematique
)
Par contre le directeur de publication est actuellement président de l’association, c’est peut-être une nécessité légale d’ailleurs.
Pas une nécessité légale (c'est le choix par défaut par contre). Il n'est pas obligatoire de faire reposer la responsabilité de l'association et celle des contenus du site sur la même personne.
Chronophage de répondre aux questions ? D'une part ça montre un intérêt, sur des tâches qui pourraient être faites dans l'indifférence complète, donc on ne va pas se plaindre d'avoir des questions :). C'est même plutôt bon pour la motivation je dirais. D'autre part ça aide à préparer la suite en réfléchissant au sujet et en mettant par écrit, pédagogiquement si possible. Plus d'autres aspects comme le fait de pouvoir partager avec d'autres personnes de l'équipe qui débuteraient ou connaîtraient moins le sujet, ou bien le fait que même tout seul je peux retrouver un vieux commentaire à moi et comprendre/redécouvrir ce que j'avais fait, quels étaient les chiffres de l'époque, etc.
10 ans c'est probablement trop long vu notre nécessité/besoin et ce que demande le RGPD. On n'a certes pas de données hypersensibles, mais pas grand chose ne justifie de les garder super longtemps non plus. Six ou sept ans serait un max a priori. Mais pour LinuxFr il faudrait plutôt choisir entre 1 an ou 3 ans ou 5 ans.
Mon idée serait de lancer une dépêche sous peu indiquant les changements envisagés, et de les appliquer à partir de la date anniversaire des 25 ans du site (fin juin donc), ce qui laisserait le temps aux gens qui le souhaitent de réagir, utiliser leur compte, fermer leur compte, etc.
Chaque rétrospective de quinzaine (exemple) indique les commentaires et contenus masqués :
1472 commentaires publiés (dont 3 masqués depuis) ;
778 étiquettes posées ;
63 comptes ouverts (dont 16 fermés depuis) ;
45 entrées de forum publiées (dont 5 masquées depuis) ;
98 liens publiés (dont 2 masqués depuis) ;
19 dépêches publiées ;
17 journaux publiés (dont 1 masqué depuis) ;
1 entrée nouvelle, 1 corrigée et 0 invalide dans le système de suivi ;
1 sondage publié ;
0 page wiki publiée (dont 0 masquée depuis).
Les comptes non confirmés (validation du lien reçu par courriel) / jamais utilisés sont supprimés automatiquement.
Les comptes fermés le sont soit par les personnes ayant les comptes, soit par les admins (spam de très loin en premier, abus, illégalité manifeste, demande des personnes ayant les comptes, etc.). Ils restent en base.
Les contenus (dépêches, journaux, forums, sondages, pages wiki, suivi, liens) et les commentaires peuvent être masqués/dépubliés par les admins (spam, abus, illégalité manifeste, demande des personnes pour virer un doublon ou retirer un propos, purge de compte demandée, etc.). À part dans le cas de la purge, qui a lieu en base, les contenus et commentaires dépubliés restent en base.
Les étiquettes peuvent être masquées par les admins (mauvais nom, doublon, spam, etc.). Ces étiquettes restent en base.
L'opération de ce ticket consistait à supprimer ce qui était invisible sauf pour les admins, et qui avait plus d'un an, pour alléger la base, pour virer l'inutile. Pourquoi garder un an ? Pour avoir un peu de recul sur les spammeurs et les problèmes passés au besoin, pour republier au besoin ce qui aurait été dépublié par erreur / à tort, etc.
L'effacement automatique au bout d'un an de l'invisible serait à implémenter.
Et les questions plus compliquées/longues arrivent ensuite :
mettre en place une fermeture des comptes inactifs après une durée (règle à définir, communiquer et implémenter). Objectifs: minimisation des données personnelles conservées, alléger la base
mettre en place une suppression des comptes fermés après une durée
(règle à définir, communiquer et implémenter). Objectifs: minimisation des données personnelles conservées, alléger la base :
associés à aucun contenu/commentaire public : cas facile
associés à un ou plus contenu/commentaire public : arbitrage minimisation des données personnelles (RGPD) et droit d'auteur (conserver le pseudo ou nom de la personne)
définir pour chaque donnée personnelle ce qui arrive suivant les cas
Les titre et corps des commentaires de plus d'un an ont été purgés (ce qui ne change rien en apparence pour tous ceux qui ne sont pas dans l'administration du site, mais qui allège la base de données). 14338 commentaires concernés.
Supprimer les contenus non publics datant de plus d'un an (et les étiquetages associés s'il y en a, et les commentaires associés s'il y en a)
139 pages wiki non publiques supprimées (datant de mai 2012 à avril 2020) -> 139 tuples de wiki_pages, 139 de nodes, 139 de friendly_id_slugs, 247 de wiki_versions et 26 de comments
40 entrées de suivi non publiques (datant de juillet 2021 à octobre 2019) -> 40 tuples de trackers, 40 de nodes, 64 de friendly_id_slugs et 10 de comments
106 sondages non publics et hors modération (date d'avril 2012 à juillet 2021) -> 106 tuples de polls, 106 de nodes, 110 de friendly_id_slugs, 662 de poll_answers et 2 de comments
894 entrées de forums non publiques (jusqu'au 28 janvier 2022)-> 894 posts, 894 nodes, 933 friendly_id_slugs, 382 comments
171 journaux non publics (jusqu'au 28 janvier 2022)-> 171 diaries, 171 nodes, 172 friendly_id_slugs, 1509 comments
170 liens non publics (jusqu'au 28 janvier 2022) -> 170 bookmarks, 170 nodes, 170 friendly_id_slugs et 61 comments
1627 dépêches non publiques rejetées ou supprimées (jusqu'au 28 janvier 2022) -> 1627 news, 1627 nodes, 2250 friendly_id_slugs, 18509 news_versions, 15468 paragraphs, 1952 links
Il me paraît important de séparer la partie génération de texte, qui fait ce pour quoi elle est faite, sans surprise, générer un texte probable dans le contexte fourni, de la partie chatbot qui discute et produit le contexte à donner au générateur.
Le générateur me paraît juste impressionnant par sa "taille", il a eu un vaste corpus de textes, utilise masse de paramètres, blabla. Mais rien de révolutionnaire si j'ai bien suivi, en dehors de la volumétrie.
La partie chatbot fait la différence je trouve. Techniquement j'entends. Et elle amène plein de problèmes éthiques en cachant le fait que c'est une façade pour un générateur et pas pour un cerveau synthétique qui comprend et répond à la question posée… c'est pernicieux, et trompeur même en le sachant.
L'aviron et tous les bateaux à plusieurs ? La course/nage en relai ? Les cordées en escalade ?
Tu veux dire à 2 équipes plutôt qu'à 2, ce qui de fait veut dire opposition sinon il n'y aurait qu'une équipe.
Les cas où le sport devient une activité collective coopérative relève plutôt de l'exploit (premier en haut de tel sommet, à traverser telle mer à la voile/rame/nage, rejoindre un pôle, etc.) ou de l'exploration. (Ce qui pourrait être vu soit comme une opposition avec le reste de l'humanité qui n'a rien fait, soit comme une coopération avec le reste de l'humanité même si elle n'a toujours rien fait).
Pour les élections annulées, ça change clairement le résultat, potentiellement les candidats et le/la député.e concerné.e (et le/la suppléant.e). Et ça veut dire nouvelles élections partielles, nouveau bureau de vote électronique, nouveau scrutin, nouvelle publication des résultats sur le site des Affaires étrangères, et sur le site de l'Intérieur, et nouvelle période de contention avec potentiellement nouveaux recours.
Dans les autres cas, les ajustements sont à la marge sur le résultat, genre x voix de moins pour untel. J'imagine que c'est reporté sur le site de l'Intérieur (ça jouerait de quelques euros sur les remboursements de frais de campagne et de financement de la vie politique ?). En même temps c'est facile à vérifier.
D’autre part, si quelques fournisseurs de messagerie électronique ont, durant les premiers jours du vote par internet au titre du premier tour du scrutin, bloqué l’acheminement des courriers électroniques contenant les identifiants nécessaires à la participation au vote par internet, il résulte de l’instruction que ce blocage a pris fin le mardi 31 mai 2022 et que les électeurs touchés par ce problème ont ainsi disposé d’un temps suffisant pour prendre part au vote par voie électronique, en dépit de l’indisponibilité temporaire du portail de vote entre 2 h 20 et 7 heures du matin (heure de Paris) le mercredi 1er juin 2022.
(…)
Dans ces conditions, compte tenu de l’écart de voix entre les candidats et du caractère limité de ces dysfonctionnements, il n’est pas établi que, pour regrettables qu’ils soient, ces derniers ont empêché un nombre significatif d’électeurs de la circonscription de prendre part au vote par voie électronique et altéré la sincérité du scrutin.
3 exemples d'annulations qui n'ont pas de rapport avec le vote par ordinateurs de vote / machines à voter ou par internet, et pour trois raisons différentes :
1 recours rejeté lié au vote par ordinateurs de vote / machines à voter :
Val-de-Marne (3ème circ.) https://www.conseil-constitutionnel.fr/decision/2022/20225785AN.htm « fait valoir que des irrégularités relatives aux machines à voter utilisées dans l'une des communes de la circonscription auraient été de nature à affecter la sincérité du scrutin. Toutefois, ces allégations ne sont pas assorties des précisions et justifications permettant d'en apprécier la portée. Dès lors, sa requête doit être rejetée. »
Total sur ces législatives 2022 en l'état : 76 décisions, dont 69 rejets, 5 annulations et 2 non lieu à statuer.
[^] # Re: le petit bout de la lorgnette
Posté par Benoît Sibaud (site web personnel) . En réponse au journal si on ne fait rien, Xonotic va disparaitre de wikipedia FR. Évalué à 5.
(Précisions sans grande importance dans le débat en cours)
L'association se nomme Linuxfr, et donne une entité légale au site, pour le compte bancaire et la responsabilité.
Les admins du site font partie de l'équipe de modération. Le président de l'association et le trésorier et divers autres membres de l'association en font partie. Ils sont probablement majoritaires d'ailleurs. Et un mini effet dans la modération via la règle cas limite Si trois personnes ou plus, comprenant au moins deux membres de l’association LinuxFr, se sont toutes exprimées pour la même décision, elle est considérée comme adoptée. (source https://linuxfr.org/regles_de_moderation_du_problematique
)
Pas une nécessité légale (c'est le choix par défaut par contre). Il n'est pas obligatoire de faire reposer la responsabilité de l'association et celle des contenus du site sur la même personne.
[^] # Re: Contenus non publics
Posté par Benoît Sibaud (site web personnel) . En réponse à l’entrée du suivi Pré-nettoyage des 25 ans. Évalué à 3 (+0/-0).
Chronophage de répondre aux questions ? D'une part ça montre un intérêt, sur des tâches qui pourraient être faites dans l'indifférence complète, donc on ne va pas se plaindre d'avoir des questions :). C'est même plutôt bon pour la motivation je dirais. D'autre part ça aide à préparer la suite en réfléchissant au sujet et en mettant par écrit, pédagogiquement si possible. Plus d'autres aspects comme le fait de pouvoir partager avec d'autres personnes de l'équipe qui débuteraient ou connaîtraient moins le sujet, ou bien le fait que même tout seul je peux retrouver un vieux commentaire à moi et comprendre/redécouvrir ce que j'avais fait, quels étaient les chiffres de l'époque, etc.
[^] # Re: Contenus non publics
Posté par Benoît Sibaud (site web personnel) . En réponse à l’entrée du suivi Pré-nettoyage des 25 ans. Évalué à 4 (+0/-0).
10 ans c'est probablement trop long vu notre nécessité/besoin et ce que demande le RGPD. On n'a certes pas de données hypersensibles, mais pas grand chose ne justifie de les garder super longtemps non plus. Six ou sept ans serait un max a priori. Mais pour LinuxFr il faudrait plutôt choisir entre 1 an ou 3 ans ou 5 ans.
Mon idée serait de lancer une dépêche sous peu indiquant les changements envisagés, et de les appliquer à partir de la date anniversaire des 25 ans du site (fin juin donc), ce qui laisserait le temps aux gens qui le souhaitent de réagir, utiliser leur compte, fermer leur compte, etc.
[^] # Re: Contenus non publics
Posté par Benoît Sibaud (site web personnel) . En réponse à l’entrée du suivi Pré-nettoyage des 25 ans. Évalué à 3 (+0/-0).
C'est ce que je décris dans mon dernière paragraphe notamment. Actuellement, non, rien n'est fait automagiquement.
[^] # Re: Total ?
Posté par Benoît Sibaud (site web personnel) . En réponse à l’entrée du suivi Pré-nettoyage des 25 ans. Évalué à 5 (+0/-0).
(pour les contenus en base de données mariadb ou redis, hors fichiers d'images, caches, logs, etc)
avant le nettoyage :
après le nettoyage :
(8,9 GiB pour mariadb.dump hors compression gzip)
data_length + index_length : 12.85 GiB selon MariaDB
[^] # Re: Contenus non publics
Posté par Benoît Sibaud (site web personnel) . En réponse à l’entrée du suivi Pré-nettoyage des 25 ans. Évalué à 4 (+0/-0).
Chaque rétrospective de quinzaine (exemple) indique les commentaires et contenus masqués :
Les comptes non confirmés (validation du lien reçu par courriel) / jamais utilisés sont supprimés automatiquement.
Les comptes fermés le sont soit par les personnes ayant les comptes, soit par les admins (spam de très loin en premier, abus, illégalité manifeste, demande des personnes ayant les comptes, etc.). Ils restent en base.
Les contenus (dépêches, journaux, forums, sondages, pages wiki, suivi, liens) et les commentaires peuvent être masqués/dépubliés par les admins (spam, abus, illégalité manifeste, demande des personnes pour virer un doublon ou retirer un propos, purge de compte demandée, etc.). À part dans le cas de la purge, qui a lieu en base, les contenus et commentaires dépubliés restent en base.
Les étiquettes peuvent être masquées par les admins (mauvais nom, doublon, spam, etc.). Ces étiquettes restent en base.
L'opération de ce ticket consistait à supprimer ce qui était invisible sauf pour les admins, et qui avait plus d'un an, pour alléger la base, pour virer l'inutile. Pourquoi garder un an ? Pour avoir un peu de recul sur les spammeurs et les problèmes passés au besoin, pour republier au besoin ce qui aurait été dépublié par erreur / à tort, etc.
L'effacement automatique au bout d'un an de l'invisible serait à implémenter.
Et les questions plus compliquées/longues arrivent ensuite :
# Durée des optimisations de tables
Posté par Benoît Sibaud (site web personnel) . En réponse à l’entrée du suivi Pré-nettoyage des 25 ans. Évalué à 3 (+0/-0).
# Commentaires non publics datant de plus d'un an
Posté par Benoît Sibaud (site web personnel) . En réponse à l’entrée du suivi Pré-nettoyage des 25 ans. Évalué à 3 (+0/-0).
Les titre et corps des commentaires de plus d'un an ont été purgés (ce qui ne change rien en apparence pour tous ceux qui ne sont pas dans l'administration du site, mais qui allège la base de données). 14338 commentaires concernés.
# Contenus non publics
Posté par Benoît Sibaud (site web personnel) . En réponse à l’entrée du suivi Pré-nettoyage des 25 ans. Évalué à 3 (+0/-0). Dernière modification le 29 janvier 2023 à 20:18.
wiki_pages
, 139 denodes
, 139 defriendly_id_slugs
, 247 dewiki_versions
et 26 decomments
trackers
, 40 denodes
, 64 defriendly_id_slugs
et 10 decomments
polls
, 106 denodes
, 110 defriendly_id_slugs
, 662 depoll_answers
et 2 decomments
posts
, 894nodes
, 933friendly_id_slugs
, 382comments
diaries
, 171nodes
, 172friendly_id_slugs
, 1509comments
bookmarks
, 170nodes
, 170friendly_id_slugs
et 61comments
news
, 1627nodes
, 2250friendly_id_slugs
, 18509news_versions
, 15468paragraphs
, 1952links
[^] # Re: Texte pré-établi <> message supplémentaire
Posté par Benoît Sibaud (site web personnel) . En réponse à l’entrée du suivi Message pour relance dans l'espace de rédaction. Évalué à 3 (+0/-0).
Fusionné https://github.com/linuxfrorg/linuxfr.org/commit/80fb5c8aad994efc45b287e7717ed52e073a98fb et déployé
Merci
[^] # Re: Un peu d'histoire
Posté par Benoît Sibaud (site web personnel) . En réponse à l’entrée du suivi Licence d'une dépêche crée à partir d'un journal. Évalué à 4 (+0/-0).
Fusionné et déployé https://github.com/linuxfrorg/linuxfr.org/commit/368abcf2ab3f998ca0c13b01fc628d7cec742c52
Merci.
[^] # Re: Fusion en cours
Posté par Benoît Sibaud (site web personnel) . En réponse à l’entrée du suivi Faire valider sa page perso LinuxFr.org sur Mastodon . Évalué à 4 (+0/-0).
Fusionné et déployé, et merci à Trim.
# Shell
Posté par Benoît Sibaud (site web personnel) . En réponse au message script qdisc. Évalué à 6.
La réponse est dans ces deux lignes :
Que vaut la variable IPT et pourquoi ? Que vaut la variable IPTMO et pourquoi ?
[^] # Re: Nouvel état des lieux
Posté par Benoît Sibaud (site web personnel) . En réponse à l’entrée du suivi Gérer les vieilles dépêches en HTML et non en Markdown. Évalué à 3 (+0/-0).
Les chiffres disent :
# Fusion en cours
Posté par Benoît Sibaud (site web personnel) . En réponse à l’entrée du suivi Faire valider sa page perso LinuxFr.org sur Mastodon . Évalué à 3 (+0/-0).
Micro-correction après la fusion, concernant les cas où l'identifiant du compte est différent du slug :
https://github.com/linuxfrorg/linuxfr.org/commit/983e8b81f5717417380eeb304b01e4b1c628419b
Et les ajouts liés à la partie administration (avec un peu de rattrapage sur les autres adresses associées à un compte, au passage) :
https://github.com/linuxfrorg/linuxfr.org/pull/360
(tout est déployé sur le serveur de test actuellement)
# Évidemment
Posté par Benoît Sibaud (site web personnel) . En réponse au journal C´est pourtant simple. Évalué à 7.
Il n'y a pas de 's' en bon français à deux vingt deux, car les multiples de vingt ne prendent pas de 's' quand ils sont suivi.
[^] # Re: Nouvel état des lieux
Posté par Benoît Sibaud (site web personnel) . En réponse à l’entrée du suivi Gérer les vieilles dépêches en HTML et non en Markdown. Évalué à 3 (+0/-0).
Le temps, ie. des gens ont écrit des dépêches supplémentaires ?
# Chatbot vs générateur de texte
Posté par Benoît Sibaud (site web personnel) . En réponse au journal Mon avis sur chatGPT. Évalué à 8.
Il me paraît important de séparer la partie génération de texte, qui fait ce pour quoi elle est faite, sans surprise, générer un texte probable dans le contexte fourni, de la partie chatbot qui discute et produit le contexte à donner au générateur.
Le générateur me paraît juste impressionnant par sa "taille", il a eu un vaste corpus de textes, utilise masse de paramètres, blabla. Mais rien de révolutionnaire si j'ai bien suivi, en dehors de la volumétrie.
La partie chatbot fait la différence je trouve. Techniquement j'entends. Et elle amène plein de problèmes éthiques en cachant le fait que c'est une façade pour un générateur et pas pour un cerveau synthétique qui comprend et répond à la question posée… c'est pernicieux, et trompeur même en le sachant.
[^] # Re: Ça manque de détails tout ça
Posté par Benoît Sibaud (site web personnel) . En réponse au sondage Seriez-vous pour masquer le score des commentaires ?. Évalué à 4.
Ouf, personne n'a encore demandé la liste des personnes qui n'ont pas noté, ou pire qui n'ont pas lu.
[^] # Re: Naïf, éternellement...
Posté par Benoît Sibaud (site web personnel) . En réponse à la dépêche Concours ICRA de robot humanoïdes lutteurs. Évalué à 3.
L'aviron et tous les bateaux à plusieurs ? La course/nage en relai ? Les cordées en escalade ?
Tu veux dire à 2 équipes plutôt qu'à 2, ce qui de fait veut dire opposition sinon il n'y aurait qu'une équipe.
Les cas où le sport devient une activité collective coopérative relève plutôt de l'exploit (premier en haut de tel sommet, à traverser telle mer à la voile/rame/nage, rejoindre un pôle, etc.) ou de l'exploration. (Ce qui pourrait être vu soit comme une opposition avec le reste de l'humanité qui n'a rien fait, soit comme une coopération avec le reste de l'humanité même si elle n'a toujours rien fait).
[^] # Re: Bilan ?
Posté par Benoît Sibaud (site web personnel) . En réponse au lien Annulation des élections législatives françaises pour deux circonscriptions (vote par Internet). Évalué à 5.
Les résultats de juin 2022 :
Côté Ministère de l'Intérieur et des Outre-Mer :
https://www.interieur.gouv.fr/Elections/Les-resultats/Legislatives/elecresult__legislatives-2022/(path)/legislatives-2022/index.html
« Résultats définitifs* (…) * Sous réserve d'éventuelles corrections et de décisions du juge de l'élection. »
Côté Ministère de l'Europe et des Affaires Étrangères :
Wikipédia :
[^] # Re: Bilan ?
Posté par Benoît Sibaud (site web personnel) . En réponse au lien Annulation des élections législatives françaises pour deux circonscriptions (vote par Internet). Évalué à 4.
Pour les élections annulées, ça change clairement le résultat, potentiellement les candidats et le/la député.e concerné.e (et le/la suppléant.e). Et ça veut dire nouvelles élections partielles, nouveau bureau de vote électronique, nouveau scrutin, nouvelle publication des résultats sur le site des Affaires étrangères, et sur le site de l'Intérieur, et nouvelle période de contention avec potentiellement nouveaux recours.
Dans les autres cas, les ajustements sont à la marge sur le résultat, genre x voix de moins pour untel. J'imagine que c'est reporté sur le site de l'Intérieur (ça jouerait de quelques euros sur les remboursements de frais de campagne et de financement de la vie politique ?). En même temps c'est facile à vérifier.
# Autres cas
Posté par Benoît Sibaud (site web personnel) . En réponse au lien Annulation des élections législatives françaises pour deux circonscriptions (vote par Internet). Évalué à 8. Dernière modification le 21 janvier 2023 à 17:30.
Le Conseil constitutionnel évalue si un problème est de nature à changer le résultat du scrutin.
Un autre recours rejeté lié au vote par internet : (1ère circonscription des Français à l'étranger) https://www.conseil-constitutionnel.fr/decision/2023/20225795AN.htm
3 exemples d'annulations qui n'ont pas de rapport avec le vote par ordinateurs de vote / machines à voter ou par internet, et pour trois raisons différentes :
1 recours rejeté lié au vote par ordinateurs de vote / machines à voter :
Total sur ces législatives 2022 en l'état : 76 décisions, dont 69 rejets, 5 annulations et 2 non lieu à statuer.
[^] # Re: Expérience et postmortem
Posté par Benoît Sibaud (site web personnel) . En réponse au journal Comment j'ai foutu en l'air une partie de notre prod (et comment on l'a remise sur pieds). Évalué à 3.
Apparemment je n'apprends pas vite à me méfier du correcteur sur mobile…
[^] # Re: Savoir écrire
Posté par Benoît Sibaud (site web personnel) . En réponse au journal Comment j'ai foutu en l'air une partie de notre prod (et comment on l'a remise sur pieds). Évalué à 4.
Corrigé, merci.