Différences de genres dans la contribution au code libre

Posté par  (site web personnel) . Édité par Ysabeau 🧶. Modéré par Ysabeau 🧶. Licence CC By‑SA.
Étiquettes :
11
28
fév.
2022
Communauté

La répartition inégale des genres dans les communautés logiciels libres / Open Source est connue depuis longtemps. Pour ne citer que quelques exemples : l’étude FLOSSpols Gender de Bernhard Krieger et James Leach en 2006 (évoquée en dépêche), les dépêches LinuxFr.org Et les femmes ? en 2007, 2% de femmes dans le développement de logiciel libre - 10 propositions pour y remédier en 2008 ou Les femmes et le logiciel libre : retours d’une conférence des RMLL en 2010, l’article Gender, Diversity, and Inclusion in Open Source Communities de M. Fossatti (2020, DOI 10.1145/3398454) ou les pages Wikipédia Diversité dans le mouvement open source et Diversity in open-source software (qui traitent de toutes les diversités et pas uniquement de la répartition par genre).

Certes l’inégalité est aussi présente dans d’autres domaines voisins ou plus larges : dépêche de 2014 sur les Les femmes dans l’informatique, journal Pourquoi les femmes ont déserté l’informatique dans les années 1980 en 2019, statistiques Eurostats 2020 sur le pourcentage de femmes ingénieures ou scientifiques (merci à @RestitutorOrie) ou UNESCO 2021 Women and the digital revolution par exemple. Si cela montre que ce n’est pas uniquement une spécificité des communautés FLOSS, il est cependant difficile de se flatter de ne pas faire mieux, voire de faire pire.

D’autant que ces déséquilibres viennent avec leur lot de conséquences négatives, par exemple Petite rétrospective diversité, sexisme, harcèlement et humour vaseux, Wikipedia fait la part belle aux réalisations d’hommes blancs occidentaux, Harcèlement dans le milieu macho informatique ? vivement que ça change, Sexisme ordinaire sur Linuxfr, #salepute - un reportage / documentaire sur le harcèlement des femmes en ligne, etc.

Venons-en à une toute nouvelle étude récente et centrée sur la contribution au code libre : Worldwide Gender Differences in Public Code Contributions: and how they have been affected by the COVID-19 pandemic (DOI : 10.1145/3510458.3513011). Davide Rossi et Stefano Zacchiroli ont étudié 160 millions de projets, 43 millions de personnes, 2,2 milliards de commits, sur 50 ans. Ce dernier l’a annoncée et résumée : la diversité en termes de genre dans les communautés FOSS est faible (moins de 10% de contributions féminines), avec une amélioration sur les 12 dernières années ; c’est vrai globalement indépendamment de la géographie (ça s’améliore moins vite en Asie cependant). Par contre 2020 et sa pandémie ont eu un effet très négatif.

À propos des étiquettes sur le site LinuxFr.org

Posté par  (site web personnel) . Édité par vmagnin, Florent Zara, Ysabeau 🧶 et Julien Jorge. Modéré par Ysabeau 🧶. Licence CC By‑SA.
45
2
fév.
2022
LinuxFr.org

Il existe déjà des statistiques sur les étiquettes sur le site LinuxFr.org (commentée dans chaque rétrospective annuelle) ; à l’exception de la prochaine phrase, je vais m’efforcer de ne parler que de choses qui n’y figurent pas déjà. La base de données contient actuellement environ 13 500 étiquettes, dont environ 11 600 étiquettes publiques, pour un total d’environ 123 000 étiquetages sur des contenus publiés.

Citation sans rapport : Il a d’ailleurs écrit lui-même qu’aucune étiquette ayant cours dans le monde occidental ne saurait lui convenir. (source)

Commençons par quelques informations en vrac :

  • les étiquettes sont assez peu visibles sur le site si vous utilisez un navigateur sur mobile. Cela pourrait être un problème pour leur évolution.
  • La capacité à bloquer l’étiquetage n’est pas encore codée et c’est bien dommage vu certains comportements (injures en étiquettes, étiquettes problématiques, etc.).
  • Les étiquettes dites « sémantiques » ne sont pas encore en place.
  • Concernant l’accentuation impôts et impots sont une seule et même étiquette, et la forme affichée est celle saisie au premier étiquetage (hors intervention en base de données pour corriger donc).
  • La taille d’une étiquette est limitée à 64 caractères.
  • Les tirets sont à utiliser pour les mots composés comme auto-hébergement ou parce que cela fait partie d’un nom comme COVID-19.
  • Les soulignés sont à utiliser pour remplacer les espaces et associer des mots, par exemple les noms de personnes comme linus_torvalds ou les concepts comme réseau_social ou jeu_libre.
  • Une modération de l’étiquetage est faite par l’équipe du site, notamment pour bien choisir les étiquettes, supprimer les doublons, regrouper les concepts, etc. Citation sans rapport : Sous des étiquettes opposées, sache reconnaître la même pensée, et sous des étiquettes semblables des conduites opposées. (source). Un des premiers choix à faire est singulier ou pluriel (jeu ou jeux ?), le choix par défaut étant le singulier. Mais d’autres questions peuvent se poser : genre, traduction ou franglais, acronyme, mettre ou non le second prénom d’une personne, mot régional ou national, etc.
  • Il existe un script tag_me.sh qui permet d’étiqueter massivement (mais manuellement) en donnant une étiquette et une recherche associée (par exemple étiquette lennart_poettering et toutes les combinaisons justes ou erronées qui ont pu être saisies sur le prénom, le nom ou les deux).
  • Le recours à ce script se fait dans des situations variées : nécrologies pour retrouver les mentions de la personne disparue (ou l’événement ou le projet disparu), version majeure d’un logiciel, recherche sur un projet qui donne de maigres résultats alors que l’on sait qu’il existe plein de contenus sur le sujet, modération suite à un signalement de doublon ou de faute, constat qu’un événement a été étiqueté en 2020 et en 2022 mais pas en 2021, etc.
  • En bas de page, on trouve un affichage des « étiquettes (tags) populaires » (en ce moment libreoffice, fosdem, lennart_poettering, onlyoffice, wallabag, police_de_caractères, académie_française, police_institution, ada, complotisme, agenda_du_libre, rust), influencé un peu par les étiquetages des visiteurs et beaucoup par les étiquetages massifs.

Statistiques 2021 du site LinuxFr.org

Posté par  (site web personnel) . Édité par vmagnin et Florent Zara. Modéré par Florent Zara. Licence CC By‑SA.
Étiquettes :
30
3
jan.
2022
LinuxFr.org

C’est peu dire que l’année 2020 a été particulière : pour nos visiteurs venus en violation de la directive temporelle première, avec un remonteur de temps ou en chronoscaphe, rappelons la pandémie de Covid-19, les restrictions sanitaires, beaucoup moins d’occasions de voir les contributeurs du site vu le manque d’événements, etc. Quel effet sur l’activité du site LinuxFr.org en 2021 ? Quelles évolutions en termes de trafic Web, de contenus créés, de commentaires déposés, de navigateurs utilisés, d’utilisation des fonctionnalités du site, de contribution au code, etc. Bref, qu’est‐ce qui a changé et de quelle manière durant 2021 ?

Le site rend accessible un grand nombre de statistiques (faites‑vous plaisir si vous souhaitez vous plonger dedans, c’est fait pour) ; cette dépêche résume les variations constatées en 2021.

Validité HTML des pages sur LinuxFr.org

Posté par  (site web personnel) . Édité par Anonyme, BAud, pulkomandy, Nils Ratusznik, Yves Bourguignon, Ysabeau 🧶, bobble bubble, tisaac et NeoX. Modéré par Ysabeau 🧶. Licence CC By‑SA.
Étiquettes :
53
31
déc.
2021
LinuxFr.org

Un matin (le 6 octobre 2018), une question existentielle a fait jour dans mon esprit, comme ça, venue d’on ne sait où. Et dont on voit le caractère urgent et prioritaire quelques années plus tard.

Une idée probablement dans le même genre que l’envie pas gagnée de Sir Tim Berners-Lee de rendre à l’utilisateur le contrôle via le projet Solid, ou les râleries sur la dérive obésitaire du logiciel (évoquée en journal) ou la quête graalesque du poétique oxymore de la DRM ouverte interopérable standard accessible.

Bref, je me demandais « les pages produites par LinuxFr.org sont-elles valides niveau HTML, et est‐ce que (plutôt comment) ça a changé au fil des années ? ».

Évidemment, ça ne donnera un état et une évolution que sur les contenus/commentaires du site, et pas sur Internet en général (même si certains ne connaissent d’Internet que leur réseau social préféré, mais ceux‐là ne nous intéressent pas ici, car soit ils ne viennent donc pas sur LinuxFr.org, soit ils y sont en permanence mais ne mettent pas de liens pour en sortir vu qu’ils n’en sortent pas).

Dons aux associations, épisode 10

Posté par  (site web personnel) . Édité par Ysabeau 🧶. Modéré par patrick_g. Licence CC By‑SA.
22
20
déc.
2021
Communauté

Cette dépêche est la dixième de sa série, après celles de 2011, 2013, 2014, 2015, 2016, 2017, 2018, 2019 et 2020.

Montre ton amour au Libre

Comme l’année précédente, cette année reste particulière, avec d’un côté une pandémie et ses conséquences dans le domaine de la santé (une partie des dons va aller vers la recherche médicale, les fonds de soutien aux urgentistes, etc.), et d’autre part les conséquences sociales de la crise sanitaire comme le chômage et la pauvreté (une autre partie des dons va se réorienter vers les soupes populaires, l’hébergement d’urgence, etc.). On pourrait ajouter les tensions dans la société qui pourraient orienter des dons vers les journalistes (suivi des violences et vérification des faits), les observateurs des prisons, etc. Les informations sur ce sujet me semblent facilement accessibles par ailleurs, je ne les détaillerai pas plus (et je ne suis pas forcément le mieux à même de parler de tous ces sujets non plus, d’autres le font bien mieux).

Non, cette année encore, je m’adresse à toi libriste, qui a procrastiné jusqu’aux dernières heures pour faire des dons, déductibles des impôts ou non. Toute l’année (et celle d’avant) on se promet de soutenir telle ou telle action sur tel ou tel sujet qui nous semblait extrêmement important. Citons par exemple quelques associations de promotion et défense du Libre, des droits dans l’espace numérique ou de la liberté d’expression, dont les dons sont déductibles en France : Amnesty France, Debian France, Framasoft, Fédération internationale pour les droits humains (FIDH), Libre à Toi / Radio Cause Commune, Ligue des Droits de l’Homme (LDH), Open Food Facts, OpenStreetMap France, Reporters Sans Frontières (RSF), Wikimédia France, etc.

Les évolutions récentes ou à venir de la législation française autour du numérique et d'Internet

Posté par  (site web personnel) . Édité par Julien Jorge et Ysabeau 🧶. Modéré par Ysabeau 🧶. Licence CC By‑SA.
57
26
oct.
2021
Justice

La législation française évolue plus ou moins fréquemment autour du numérique et d’Internet. Parmi les derniers changements (effectifs, proposés ou en discussion) :

Disparition de Philippe Aigrain

Posté par  (site web personnel) . Édité par Ysabeau 🧶. Modéré par claudex. Licence CC By‑SA.
65
13
juil.
2021
Communauté

Philippe Aigrain était multiple : docteur en informatique, ancien chef du secteur technique du logiciel à la Commission européenne, contributeur dans des revues, auteur de livres, entrepreneur avec Sopinspace dans le développement de logiciels libres et de services basés sur ces derniers ; il a lutté contre les brevets logiciels et contre DADVSI, a été administrateur du Software Freedom Law Center, a cofondé La Quadrature du Net, ainsi que le webmedia Nonfiction et il a présidé la maison d’édition Publie.net. Il a été tout ça et bien plus.

Il était un militant en faveur des communs, défenseur du logiciel libre, luttant contre les abus de la propriété intellectuelle et l’appropriation de l’information par quelques-uns. Les dizaines d’articles étiquetés philippe_aigrain ici sur LinuxFr.org illustrent son implication et son importance dans les communautés et dans les débats sur ces thématiques.

Quelle chance de l’avoir connu, et quelle profonde tristesse suite à cette nouvelle.

Photo prise lors de la Journée du domaine public 2012 à Paris, par Marie-Lan Nguyen - CC By 2.5 (Photo prise lors de la Journée du domaine public 2012 à Paris, par Marie-Lan Nguyen - CC By 2.5)

Nos pensées vont à sa famille et ses proches.

Pierre Laffitte (1925-2021)

35
10
juil.
2021
Justice

Le nom de Pierre Laffitte est probablement connu de celles et ceux qui fréquentent le site (ou le Libre) depuis longtemps. Par connu, j’entends déjà lu, probablement souvent dans le triptyque Laffitte Trégouet Cabanel par exemple. Cet ancien sénateur français est décédé le 7 juillet 2021. L’objectif n’est pas ici d’avoir une nécrologie complète (autant aller voir sa page Wikipédia ou la presse généraliste 1 ou 2 par exemple), mais plutôt de parcourir les évocations de son nom sur le site au cours des années (donc de suivre son étiquette pierre_laffitte sur LinuxFr.org).

Pierre Laffitte - CC BY-SA 3.0 par David Monniaux (Pierre Laffitte - CC BY-SA 3.0 par David Monniaux)

Vingt-trois ans de LinuxFr.org

Posté par  (site web personnel) . Modéré par Ysabeau 🧶. Licence CC By‑SA.
Étiquettes :
139
28
juin
2021
LinuxFr.org

Ce 28 juin 2021, le site LinuxFr.org fête ses vingt‑trois ans. Depuis 1998, une équipe de bénévoles code et gère ce site, permettant à ses visiteurs de publier contenus et commentaires sur le logiciel libre, sur les nombreux autres domaines du Libre comme la culture, la cartographie, le matériel ou les manuels scolaires ; mais aussi bien d’autres thématiques comme la robotique, la cuisine, la typographie ou TapTempo.

Party Balloons

Statistiques sur la vulgarisation scientifique en français sur Youtube

Posté par  (site web personnel) . Édité par Ysabeau 🧶 et Pierre Jarillon. Modéré par Pierre Jarillon. Licence CC By‑SA.
Étiquettes :
26
24
mai
2021
Science

Quatre chercheurs ont co-écrit un article analysant la vulgarisation scientifique en français sur Youtube, publié dans Frontiers in Communication en avril 2021.

Tania Louis (« médiatrice scientifique et conceptrice de contenus pédagogiques », docteure en biologie), Pierre Masselot (« BSc MSc PhD Research Fellow in Environmental Epidemiology and Statistics »), Tobias Füchslin (« Senior Researcher and Coordinator at the Swiss Academies of Arts and Sciences ») et Stéphane Debove (« docteur en biologie/psychologie de l’évolution » ou Homo Fabulus) ont « analysé plus de 600 chaînes et 70 000 vidéos de vulgarisation scientifique en français, et complété cette analyse par un sondage auprès de 180 youtubeurs. »

Du tracteur logiciel non réparable au risque pour la sécurité alimentaire américaine ?

63
27
avr.
2021
Sécurité

Le blogueur, journaliste et auteur de science-fiction canado-britannique Cory Doctorow revient sur le cas du fabricant états-unien de matériel agricole John Deere qui interdit depuis au moins 2015 aux fermiers de réparer leurs propres tracteurs, via la législation sur le copyright (le tracteur est considéré comme un logiciel, loué, avec des parties matérielles, et le DMCA s’appliquerait).

Cette histoire avait été évoquée dans un journal de 2017 sur les « fermiers américains sont obligés de pirater leurs propres tracteurs pour pouvoir les réparer » et dans une dépêche de 2019 sur « L’enjeu de la bataille du Libre : la réappropriation des savoir‐faire », film documentaire qui aborde aussi le sujet.

Dan Kaminsky (1979-2021)

Posté par  (site web personnel) . Édité par Ysabeau 🧶 et volts. Modéré par Julien Jorge. Licence CC By‑SA.
Étiquettes :
76
27
avr.
2021
Sécurité

Dan Kaminsky était un chercheur en sécurité informatique, qui a travaillé pour Avaya, Cisco et IOActive (sa biographie sur son blog). Il est décédé le 23 avril 2021.

Wikipédia rappelle ses travaux comme le snooping du cache DNS, qui lui a permis de démontrer que le Sony Rootkit avait infecté au moins 568 200 ordinateurs (…) Il a participé à l’élaboration du standard du W3C, Do Not Track. Des contenus précédents sur LinuxFr.org évoquent ses travaux sur la corruption/pollution de cache DNS. Et pour celles et ceux qui auraient oublié / découvriraient le Sony BMG Rootkit voir 1, 2, 3, 4 ou 5.

Dan Kaminsky - par Dave Bullock & Emdee, CC By 2.0
(source par Dave Bullock & Emdee, CC By 2.0)

Ses travaux sur les DNS ont permis d’améliorer les logiciels libres gérant le DNS (à noter que le sujet de l’empoisonnement DNS est revenu en novembre 2020 sur la table). Il a aussi permis d’ajouter une détection du ver Conficker dans le logiciel Nmap. Il a présenté le logiciel libre n00ter (voir son article de blog de 2011 pour la présentation du logiciel, ou la vidéo de sa présentation à BruCon2011) pour détecter des atteintes à la neutralité du net.

Une nouvelle image de la cybersécurité ?

Posté par  (site web personnel) . Édité par Xavier Teyssier et Julien Jorge. Modéré par Julien Jorge. Licence CC By‑SA.
10
27
avr.
2021
Sécurité

En 2019, désœuvré dans un train (c’était une autre époque où l’on pouvait se déplacer de plus de dix kilomètres), j’avais écrit une dépêche sur un concours visant à montrer que la cybersécurité n’était pas un monde parallèle, peuplé de cybermagiciens tapant avec des gants ou des moufles, dans le noir, avec un sweat‐shirt à capuche baissée jusqu’aux yeux, ayant parfois un masque de Guy Fawkes ou des lunettes de soleil, et tapant au mieux des 0 et des 1, au pire du texte vert tendance Matrix. Et pour une raison qui sera évoquée plus loin, je me suis rappelé de cette dépêche et je me suis dit qu’un suivi des résultats deux ans plus tard pourrait être intéressant.

La société OpenIDEO et la Hewlett Foundation avaient lancé un concours des images (potentiellement sous licence libre). Deux ans après, la page du concours existe encore, celle de la sélection chez eux n’existe plus (mais archive.org s’en rappelle), ainsi que du PDF de présentation des résultats. De son côté la Hewlett Foundation a toujours en ligne son challenge et l'annonce des résultats. On peut aussi citer cet article techspot qui couvre les résultats. Et surtout au final les résultats sont publiés sur cybervisuals.org/, sous licence CC By 4.0.

Et la raison qui m’a rappelé cette dépêche : le concours #DoWeLookLikeHackers vu sur certains réseaux, et la vidéo montrant toutes les photos envoyées et agrégées en une vidéo. Cf Twitter et Youtube, ou Nitter et Invidious pour admirer le résultat (vidéo par Rhiz Guendouz d’Aresaphrodite pour NorthSec et GoSecure pour le concours #DoWeLookLikeHackers​). Ni la vidéo ni la musique ne semblent sous une licence libre (il aurait fallu les autorisations d’un paquet de gens).

Association LinuxFr et site LinuxFr.org en 2019/2020/2021

Posté par  (site web personnel) . Édité par Xavier Teyssier et Ysabeau 🧶. Modéré par Ysabeau 🧶. Licence CC By‑SA.
Étiquettes :
37
22
avr.
2021
LinuxFr.org

Le 9 avril 2021 a eu lieu l’assemblée générale de l’association LinuxFr (couvrant statutairement la période du 1ᵉʳ octobre 2019 au 30 septembre 2020). C’était aussi l’occasion de discuter des activités ne relevant pas directement de l’association, mais de la vie du site LinuxFr.org : c’est‑à‑dire y compris de bénévoles ou contributeurs non membres de l’association, sur une période comprise entre l’assemblée précédente et le jour de l’assemblée.

Les membres de l’association étaient statutairement convoqués, et les membres de l’équipe de modération, d’animation de l’espace de rédaction et les contributeurs importants en termes de code étaient invités à y assister. Six invités se sont joints à nous.

Le compte‑rendu complet est fourni en lien. Voici un résumé des thèmes abordés :

  • dans la partie bilan moral de l’association LinuxFr pour la période du 1ᵉʳ octobre 2019 au 30 septembre 2020 : assemblée générale, prix mensuels, relations avec les autres associations, communication interne et externe, risques juridiques, nouveaux membres, remerciements ;
  • dans la partie activités autour du site LinuxFr.org entre le 18 février 2020 au 28 février 2021 : administration système, développement, administration du site, modération du site, contenus réguliers ou particulièrement notables, rencontres physiques, statistiques du site en 2020, évolutions de l’équipe, visibilité externe (positive ou non), informations régulières des membres, potentiels risques juridiques pour l’association.

Virevoltantes valses de licences libres et non libres dans les bases de données

Posté par  (site web personnel) . Édité par bubar🦥, patrick_g et Ysabeau 🧶. Modéré par claudex. Licence CC By‑SA.
54
3
fév.
2021
Justice

Sur les cinq dernières années, nous avons assisté un ballet impressionnant de changements de licences dans les « bases de données » (au sens large ici) libres (SQL ou NoSQL) : on parle ici de MariaDB (base relationnelle), Elasticsearch (moteur de recherche)/Kibana (visualisation de données), MongoDB (base orientée documents), Redis (base clé valeur), Confluent (gestion d’événements), CockroachDB (SQL distribué), Graylog (gestion de journaux système), et j’en oublie peut-être.

La trame

Les entreprises qui éditent ces bases se voient attaquées dans leur modèle (double licence libre et payante, open core, service, etc.). Selon ces entreprises, d’autres acteurs leur taillent des croupières, leur piquent leur chiffre d’affaires, se placent en intermédiaires captant la valeur, souvent avec une approche « base de données à la demande » de type opérateur d’infrastructure de cloud (mais ça pourrait aussi être un simple intégrateur de solution), et le tout sans contribuer.

Et souvent la solution retenue pour stopper ce qui est perçu comme une dérive est un changement de licence, vers une licence non-libre, respectant généralement les critères suivant :

  • le code est visible / disponible (on part quand même d’une solution libre/open source, si le code n’était pas visible le changement serait brutal)
  • « ça change rien pour toi utilisateur final » (soit tu ne payais pas et c’est encore le cas, soit tu payais déjà (pour le service, le support, etc.) et ça va continuer identiquement)
  • il est interdit de faire du « à la demande » sans publier le code qui te permet de le faire.