L'article nous gratifie d'un tableau fort intéressant qui nous dit quels projets acceptent ou non les contributions générées par LLM, et pour quelles raisons. Il mentionne aussi cette liste plus exhaustive que je vous invite à consulter (on y retrouve postmarketOS par exemple).
Voir aussi : Claude qui pointe le bout de son nez sur le dépôt de CPython (la réaction de Xandra Granade a le mérite de mettre la situation en perspective avec l'épisode OpenSlopware, une tentative précédente de lister les projets qui acceptent le code généré, mais qui a mal tourné)
Je trouve la classification intéressante, mais c'est superficielle et ça juge quand même un peu. Le manque de lien vers les documents en question, la non prise en compte des discussions, et aucune analyse temporel ou d'héritage entre les documents fait qu'on va astreindre des valeurs à un groupe de gens la ou il y a sans doute autre chose.
Par exemple, si la communauté A reprends le document de la communauté B tel quel par facilité, par manque de familiarité, ou à cause d'une perception erroné des impacts légaux, le document peut mettre en avant des choses à un niveau qui ne corresponds pas à ce que la communauté pense.
De la même façon, une communauté peut avoir un document qui indique que les raisons éthiques sont hautes sans que ça soit vraiment partagé, parce que la majorité s'en fout.
Je pense qu'au mieux, ça donne juste une idée de ce qu'une partie de la communauté pense être l'argument qui va convaincre les autres, ou les arguments qui ont le plus été mis en avant à un moment donnée, voir simplement les plus facile à démontrer. C'est pas comme si les questions d'éthiques étaient trivial, tout comme les questions de copyright (alors que l'idée d'avoir du code de qualité reste quelque chose de consensuel dans le milieu du libre).
Au passage, une autre liste sur les IA génératives se trouvent dans ce dépôt, je vais ouvrir un bug pour dire de mettre en lien vers celui que tu as donné.
Bon, y a la liste des documents sur le tableau à la fin (et je l'avais vu), mais du coup, on voit que ça mélange quand même pas mal de type de document différents. Pour musl, il y a un debut de discussion sur une mailling list, pour l'Open Source Foundation, c'est une page web dans le contexte de la création d'une définition d'une "IA opensource".
Et pour certains, je pense en effet que le classement est discutable. De plus, grouper "ethique" sous une seule étiquette (badumtss) ne précise pas spécialement ce qu'on mets dedans.
Par exemple, la question de l'annotation des données est noté dans le document de Gotosocial, mais pas les questions environnementales.
À contrario, les questions d'éthiques dans la discussion pour le projet Gnome Loupe ne parle pas de ces questions d'exploitations, et d'ailleurs n'indique pas ça dans le document qui sert de reférence. Malgré ça, c'est listé comme "high".
Donc bon, y a clairement une bonne part de pifomètre à ce niveau, et on peut quand même classifier ça en 3 groupes parmi les groupes listant l'éthique en "High":
les groupes qui sont pas la pour produire du code avant tout (EFF, OSI, SFC), ou qui produisent du code, mais qui font pas mal de plaidoyer (FSF, Wikimedia, Mozilla Foundation)
les groupes qui produisent du code, mais en petit groupe, et qui pour divers raisons, veulent apparaître vertueux (Gotosocial, Loupe)
# Qui veut de l'IA, qui n'en veut pas
Posté par Laurent Pointecouteau (site web personnel, Mastodon) . Évalué à 2 (+0/-0).
L'article nous gratifie d'un tableau fort intéressant qui nous dit quels projets acceptent ou non les contributions générées par LLM, et pour quelles raisons. Il mentionne aussi cette liste plus exhaustive que je vous invite à consulter (on y retrouve postmarketOS par exemple).
Voir aussi : Claude qui pointe le bout de son nez sur le dépôt de CPython (la réaction de Xandra Granade a le mérite de mettre la situation en perspective avec l'épisode OpenSlopware, une tentative précédente de lister les projets qui acceptent le code généré, mais qui a mal tourné)
[^] # Re: Qui veut de l'IA, qui n'en veut pas
Posté par Misc (site web personnel) . Évalué à 4 (+1/-0).
Je trouve la classification intéressante, mais c'est superficielle et ça juge quand même un peu. Le manque de lien vers les documents en question, la non prise en compte des discussions, et aucune analyse temporel ou d'héritage entre les documents fait qu'on va astreindre des valeurs à un groupe de gens la ou il y a sans doute autre chose.
Par exemple, si la communauté A reprends le document de la communauté B tel quel par facilité, par manque de familiarité, ou à cause d'une perception erroné des impacts légaux, le document peut mettre en avant des choses à un niveau qui ne corresponds pas à ce que la communauté pense.
De la même façon, une communauté peut avoir un document qui indique que les raisons éthiques sont hautes sans que ça soit vraiment partagé, parce que la majorité s'en fout.
Je pense qu'au mieux, ça donne juste une idée de ce qu'une partie de la communauté pense être l'argument qui va convaincre les autres, ou les arguments qui ont le plus été mis en avant à un moment donnée, voir simplement les plus facile à démontrer. C'est pas comme si les questions d'éthiques étaient trivial, tout comme les questions de copyright (alors que l'idée d'avoir du code de qualité reste quelque chose de consensuel dans le milieu du libre).
Au passage, une autre liste sur les IA génératives se trouvent dans ce dépôt, je vais ouvrir un bug pour dire de mettre en lien vers celui que tu as donné.
[^] # Re: Qui veut de l'IA, qui n'en veut pas
Posté par Misc (site web personnel) . Évalué à 4 (+1/-0).
Bon, y a la liste des documents sur le tableau à la fin (et je l'avais vu), mais du coup, on voit que ça mélange quand même pas mal de type de document différents. Pour musl, il y a un debut de discussion sur une mailling list, pour l'Open Source Foundation, c'est une page web dans le contexte de la création d'une définition d'une "IA opensource".
Et pour certains, je pense en effet que le classement est discutable. De plus, grouper "ethique" sous une seule étiquette (badum tss) ne précise pas spécialement ce qu'on mets dedans.
Par exemple, la question de l'annotation des données est noté dans le document de Gotosocial, mais pas les questions environnementales.
À contrario, les questions d'éthiques dans la discussion pour le projet Gnome Loupe ne parle pas de ces questions d'exploitations, et d'ailleurs n'indique pas ça dans le document qui sert de reférence. Malgré ça, c'est listé comme "high".
Donc bon, y a clairement une bonne part de pifomètre à ce niveau, et on peut quand même classifier ça en 3 groupes parmi les groupes listant l'éthique en "High":
les groupes qui sont pas la pour produire du code avant tout (EFF, OSI, SFC), ou qui produisent du code, mais qui font pas mal de plaidoyer (FSF, Wikimedia, Mozilla Foundation)
les groupes qui produisent du code, mais en petit groupe, et qui pour divers raisons, veulent apparaître vertueux (Gotosocial, Loupe)
Et Gentoo.
Du coup, j'ai été voir la discussion, et sans surprise, la partie sur l'éthique fait un peu polémique, comme on le voit ici sur le manque de condamnation de la Russie en 2022, ici sur le coté épineux du sujet, ici sur la question des ressources dans le contexte de Gentoo. Mais clairement, ça semble rentrer dans la catégorie "les gens ont un avis, mais pas assez d'avis pour le retirer", vu que la majeur partie de la discussion, c'est surtout sur "ça va donner du taf pour revoir le travail, et pis, y a des questions de copyright".
Donc dire que c'est "high" me semble pas dire grand chose sur la communauté à part "quelqu'un l'a mis dans le document et basta".
Envoyer un commentaire
Suivre le flux des commentaires
Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.