C'est une des raisons pour laquelle j'aime le libre, les personnes qui veulent dire faire du libre sont obligées de m'autoriser entre autre à mettre leur code sur GitHub malgré leurs idées (qui ne sont pas des faits).
Rappelons que :
This is totally legal. But then, Copilot will be able to analyze the code and violates the license terms, which isn’t.
N'est pas si évident que ça, qu'il y a un gros débat dessus qui ne part pas en faveur de ceux qui disent ça, et que balancer ça de manière aussi affirmative est trompeur.
Bon, à leur décharge ils disent bien que c'est une demande ("please") et non une interdiction. Mais leur façon de me culpabiliser à coup de "ce ne serait pas éthique" qui n'est que leur morale aurait quand même plutôt tendance à me faire faire l'inverse de ce qu'il me demande, pour que le code libre soit le plus diffusé possible, car le sujet n'est pas du tout de l'éthique mais un désaccord sur des limites.
Sinon, un petit truc rigolo : comme la liste des sites de contrefaçon, ça va permettre de facilement cataloguer le code libre pas sur Github (mais pour le moment ça n'a pas l'air d'attirer foule).
Plus le temps passe qui me montre comment le libre me protège de la non envie de laisser leur code vivre leur vie, plus j'aime le libre (même GPL, tout aussi libre que le copyfree).
Bref, tu es libertarien et pas libriste. Si on te dit que cramer du charbon c’est mauvais pour la planète tu vas faire du coal burning. Respecter les autres c’est pisser sur leur avis.
Il ne faut pas comparer ce qui n'est pas comparable. On fait du logiciel libre - donc a priori conforme aux 4 libertés fondamentales et en même temps on voudrait que le logiciel soit utilisé uniquement "de la bonne manière". Dans ce cas, le mieux est de ne pas faire du logiciel libre puisqu'il est déjà établi ce qui est bien et ce qui ne l'est pas.
#tracim pour la collaboration d'équipe __ #galae pour la messagerie email __ dirigeant @ algoo
Dans ce cas, le mieux est de ne pas faire du logiciel libre puisqu'il est déjà établi ce qui est bien et ce qui ne l'est pas.
Je suis bien d'accord avec cette phrase et c'est bien pour ça que je ne considère plus le libre comme un objectif absolu à atteindre et que ce n'est plus un dogme qui me paraît toujours intéressant.
Il y a des sujets qui me sont apparu ces 10 dernières années qui me paraissent au moins voir plus important que ce à quoi s’intéresse le libre. La victoire culturelle écrasante du libre pousse beaucoup de gens à penser que ce qui est libre est "bien" (selon leur convention) et que tout ce qui est "bien" (toujours selon leur opinion) est libre.
Il y a des sujets qui me sont apparu ces 10 dernières années qui me paraissent au moins voir plus important que ce à quoi s’intéresse le libre.
Le bon vielle argument du "y a pire ailleurs, donc laisse tomber ce que tu fais".
C'est assez nul cet argument.
La victoire culturelle écrasante du libre…
Non, culturellement, c'est l'Open Source qui l'a emporté. Et pas d'une façon aussi écrasante que tu l'imagine. La culture libre, qui fait suite à la culture hacker, est loin d'être dominante ou même acceptée partout.
…pousse beaucoup de gens à penser que ce qui est libre est "bien" (selon leur convention) et que tout ce qui est "bien" (toujours selon leur opinion) est libre.
Tu fais un procès d'intention.
Le logiciel libre est une des pratiques du mouvement hacker. Je parle du mouvement original, pas des fans de sécurité informatique ou des techno-bourgeois de la silicone vallée. Mouvement hacker qui considère que si on se sert de la technologie ça doit être pour émanciper les gens, pas pour les contrôler. Le logiciel libre étant issue du mouvement hacker, il en a hérité la culture et l'ambition. C'est le mouvement Open Source qui, pour les citer, "Veut les avantages techniques et financier du libre pour les entreprises, sans la politique". Et je pense que tu confonds le Logiciel Libre et l'Open Source.
Le bon vielle argument du "y a pire ailleurs, donc laisse tomber ce que tu fais".
Je ne dis à personne ce qu'il doit faire, je dis que de mon point de vu les objectifs du libre ne sont plus ce qu'il y a de plus important pour moi. Ce n'est pas un argument c'est mon avis.
Non, culturellement, c'est l'Open Source qui l'a emporté. Et pas d'une façon aussi écrasante que tu l'imagine. La culture libre, qui fait suite à la culture hacker, est loin d'être dominante ou même acceptée partout.
Libre ou open source je m'en fou (et oui je me doute que ça va pas te plaire), mais je vois très souvent des gens chercher à se raccrocher à libre ou à "open" sans que ça en soit voir quand ça n'a pas le moindre sens.
C'est le mouvement Open Source qui, pour les citer, "Veut les avantages techniques et financier du libre pour les entreprises, sans la politique".
Je veux bien une source de ta citation.
Pour le reste ça ne tiens pas beaucoup, je me fous royalement de cette divergence que je connais très bien (puisque que tu remet en question mes connaissances). Ta vision manichéenne libre/open source me semble vraiment caricaturale. Amalgamer des gens comme Linus Torvald1, Theo de Raadt ou ESR (et globalement toutes les communautés autour des BSD) aux entrepreneurs libertariens qu'on trouvent aujourd'hui dans la vallée du silicium, c'est, à minima, osé.
je met un lien qui référence du linuxfr parce que c'est cool, mais tu en a pleins d'autres sur les points de vu de Linus Torvald qui ne cadrent pas du tout avec la vision éthique de la FSF et du mouvement du libre ↩
Posté par raphj .
Évalué à 10.
Dernière modification le 08 mai 2023 à 16:19.
De mon côté je comprends et partage le sentiment des auteurs du poste de ne pas vouloir que son code soit publié sur GitHub pour un peu les mêmes raisons.
Et je comprends vouloir exprimer ce souhait.
Mais je ne voudrais pas imposer ça non plus. Je ne voudrais pas que ces restrictions apparaissent dans les licences libres. Pour des raisons philosophiques, et aussi pour des raisons bassement stratégiques aussi : ça risquerait de fragmenter l'écosystème beaucoup trop.
Dans ce cas, le mieux est de ne pas faire du logiciel libre puisqu'il est déjà établi ce qui est bien et ce qui ne l'est pas.
Pas d'accord avec ça. Ce n'est pas du tout établi. Il y a plein de manière de faire des choses pas éthiques en faisant du libre. Pour caricaturer, c'est nécessaire mais pas suffisant (bon, c'est beaucoup plus nuancé que ça en vrai), et à mon avis on a tout intérêt à bien séparer les choses.
On peut vouloir faire bouger son monde sans imposer strictement des règles, mais en suggérant, exprimant des souhaits, en faisant du lobby, de la comm., en s'exprimant, en diffusant des idées, etc. Se limiter au système légal, des contrats et des droits me parait simpliste, réducteur et parfois contre-productif.
Il y a des moyens de rester subtils. Ce groupe de personnes exprime un souhait sans l'imposer en faisant une campagne de communication / sensibilisation, de quoi se plaint-on ?
File moi 100 € s'il-te-plait.
C'est mon avis, de l'éthique suivant ma définition, tu peux le faire, si tu ne le fais pas c'est pisser sur mon avis.
Bizarre? Ben c'est ce que tu viens de me dire.
Je respecte à 100% ce qu'il me dit : il me dit explicitement (licence libre) que je peux le faire mais que ça serait bien que je ne le fasse pas, je respecte la volonté de l'auteur qui est de me laisser libre de le faire, en déclinant la partie optionnelle comme toi tu déclines de me filer 100 €.
Respecter les autres, c'est aussi respecter que je décline une partie optionnelle et respecter quelque chose qu'on m'a explicitement autorisé à faire. Rappel : par défaut (sans texte signé par l'auteur du code), je n'ai pas le droit d'uploader sur GitHub, il faut qu'il m'autorise explicitement de le faire pour que je puisse le faire, et si vraiment on ne souhaite pas que je le fasse le plus simple est d'éviter de m'autoriser explicitement à le faire plutôt que de mettre un truc à côté qui contredit le texte précédement fourni.
RMS n'a pas souhaiter éviter que je mette sur des endroits "pas bien", quel libertaire il est.
(ha oui, les libertaires m'accusent de communisme, hein, mais c'est un détail pour qui veut cataloguer en méchant ceux qui ne sont pas complètement comme ils voudraient)
Tu négliges un peu complètement les problématiques émergentes. Ces gens ont placé ces logiciels sous licences libres avant qu’on parle d’utilisation massive par des IAs, et c’est des trucs que probablement ni la législation ni vraiment les licences ne peuvent prendre en compte au moins à l’heure actuelle.
Donc si il y a vide juridique, on a tout simplement pas eu le temps de digérer tout ça, donc interpréter le placement sous licence comme "tu m’as autorisé, t’aurais dû réfléchir avant" comme réponse … "ah bah non, cette problématique n’existait pas quand j’ai réfléchi".
"ah bah non, cette problématique n’existait pas quand j’ai réfléchi".
RMS va lancer l'écriture d'une GPLv4 pour combler?
ça sera compatible avec les 4 libertés définies par RMS?
ça sera accepté par les autres acteurs du libre?
Peut-être, peut-être pas, la ce qui me fait réagir c'est cette réaction immédiate de certains à considérer que ce n'est pas éthique, pas dans "l'esprit du libre", et l'affirmer comme si c'était évident et partagé par tous.
Alors que non, c'est même très loin d'être évident que l'automatisation de ce qu'on aimait qu'une être humain fasse soit si opposé à "l'esprit du libre" déjà assez imaginaire. Et ça ne sera pas la première fois que les plus ardents défenseurs du libre râlent que le libre file trop de liberté (le "libre mais non commercial" commençait à se tasser, fallait bien trouver autre chose pour s'opposer aux libertés que confèrent le libre, le libre c'était sympa du moment où les gens n'utilisaient les libertés).
Rappelons aussi que le sujet n'a rien à voir avec le libre, car il est commun au non libre (il suffit que le code, ou image etc, soit accessible), mélanger le sujet avec du libre est déjà assez se tromper sur la problématique.
Posté par Thomas Douillard .
Évalué à 1.
Dernière modification le 08 mai 2023 à 15:05.
Ça n’a pas "rien à voir", même s’il est commun au non libre, vu qu’il s’agit de droit d’auteur et que le libre est une vision du droit d’auteur. Il se pourrait simplement que la législation du droit d’auteur décide de ne pas vraiment laisser de prise au libre ou à une vision alternative du droit d’auteur pour se prononcer sur la question.
Pour le reste, je te laisse à tes opinions. Je ne te suis pas vraiment.
bin, Zenitram a raison pour le coup : tu parles des IA qui ne respectent pas les licences octroyées (demander aux journaux New Yorkais ou des universités américaines, qui proposent leurs contenus sur Internet sans conférer de droit de reproduction pour autant…).
idem, pour les contenus sous licences libres en "share-alike" (CC-by-SA, GPL…) non respectées par les IA (actuellement)
le vide juridique est du côté des IA, pas du côté des licences libre pour le coup (et même souci avec licences proprios interdisant la reproduction voire ont des clauses léonines en Europe en interdisant la rétro-ingénierie).
Il y a certes un petit vide juridique, mais pour le développeur, c'est prendre le risque de réutiliser du code dont il ne connaît pas la licence, et ça, c'est problématique (sauf pour ceux qui n'en ont rien à faire des licences).
Le risque, c'est qu'il y ait des procès sur l'incohérence de la licence des logiciels produits avec ces bouts de codes, si c'est détectable une fois le code compilé… puisque les sources sont rarement disponibles dans les logiciels propriétaires. Encore faut-il pouvoir remonter aux sources.
Chacun se souvient de Microsoft qui clame que Linux utilise du code de Microsoft, mais Microsoft refuse de préciser quelles sont les parties du code concernées. (de ce que j'ai compris).
S'il était facile de déterminer le code source utilisé pour générer le code binaire compilé, ça se saurait. Et il y a sûrement déjà eu beaucoup d'articles sur ce sujet, n'est ce pas?
Pourquoi bloquer la publicité et les traqueurs : https://greboca.com/Pourquoi-bloquer-la-publicite-et-les-traqueurs.html
Rappelons aussi que le sujet n'a rien à voir avec le libre, car il est commun au non libre (il suffit que le code, ou image etc, soit accessible), mélanger le sujet avec du libre est déjà assez se tromper sur la problématique.
Is this a legal document?
No, it isn’t. If the project is under an open source license, it means that everyone can share a copy – even on GitHub – of the licensed material under certain conditions. A license restricting this right wouldn’t be open source anymore.
Accessoirement, si je devais forker un outil qui a ce genre de requête dans le readme du repo, je me tournerais quand même vers le service légal de mon entreprise ainsi que celui sur les relations publiques. Le premier pour m'assurer que cette requête ne puisse pas être considérée comme un addendum à une licence dans quelconque juridictions dans laquelle notre le logiciel est vendu/distribué/fourni un service, le second pour savoir si l'entreprise accepte ou se contrecarre des possibles effets médiatiques la chose devait être publique.
Le mec, il ne fait juste que proposer et demander.
Bien sûr que les sociopathes dans ton genre vont faire ce que ça leur chante de toute manière. Moi je pars du principe que si on me demande gentillement et que ça ne me provoque aucune contrainte particulière personnelle, je ne vois pas de raison particulière de m'y opposer.
Et de toute manière si son repo est publiquement récupérable, ça ne changera rien si les sources de copilot ou autres système similaires décident de s'entrainer sur les repos de codeberg.
Question naïve, je ne sais pas si elle a déjà été abordée.
Il est pas possible d'interdire le machine learning sur le code que l'on produit via la licence ? Existe il des licences qui restreignent ce genre de libertes ?
Toutes les licences ne sont pas libres. De la même manière qu'on voit apparaitre des licence contre Amazon, je ne serais pas surpris qu'on voit apparaitre des licences contre l'apprentissage automatisé (ce qui est une vague question car distinguer l'ajout dans un index de moteur de recherche et l'ajout dans les entrées d'un réseau de neurones doit être un peu complexe).
Par contre pour la liberté d'étudier, je ne vois pas en quoi ce serait un frein. A moins de considérer les IA comme des personnes morales ayant des droits, je ne vois pas en quoi interdire l'utilisation comme entrée d'un réseau de neurones enfreins ce droit.
la liberté d'exécuter le programme, pour tous les usages ;
ChatGPT fait tout sauf exécuter le programme.
la liberté d'étudier le fonctionnement du programme et de l'adapter à ses besoins ;
A condition de considérer que ChatGPT "étudie" le fonctionnement du programme. Mais chatGPT n’est pas un utilisateur, ni un développeur, ni une personne.
Pour les logiciels sous copyleft, à prendre en compte le fait que le résultat des modifications doit être sous la même licence.
Oui. On ne peut clairement pas interdire de faire du machine learning avec une licence libre. Sinon, ce n'est pas libre.
Bon par contre, pour un travail dérivé, on est tenu de respecter l'attribution demandée par la plupart des licences libres, et toutes les autres clauses
Est-ce qu'un code généré par un modèle "entrainé" est un travail dérivé ? C'est toute la question sur laquelle il n'y a pas de consensus. Et c'est ce point que certain·e·s d'entre nous cherchent à résister.
Sous-texte: It also works for anything you teach someone else to do. "Oh yeah, I trained a pair of neural nets, Emily and Kevin, to respond to support tickets."
C'est une grande partie du problème / de l'enjeu. Est-ce que la situation d'une personne qui a appris en lisant du code est comparable à la situation d'un modèle entraîné sur ce code ?
C'est un des points majeurs sur lesquels les avis divergent. Je n'ai vu pas vu d'argument convainquant à 100% dans un sens comme dans l'autre, donc on sort du domaine de la logique et on entre dans le domaine des opinions.
On pourrait voir la transformation comme une fonction : f(travail original 1, …, travail original n, autres entrées) = travail généré.
Que demande-t-on à f ou à "travail généré" pour considérer "travail généré" comme un travail dérivé de certains des travaux originaux en entrée et lesquels ?
Qu'est-ce qui fait qu'un humain est un f spécial qui fait que son fonctionnement ne produit pas nécessairement un travail dérivé de toutes ses sources d'apprentissage ?
Ou qu'est-ce qui fait d'un modèle entrainé un f spécial tel que travail généré n'est pas un travail dérivé de ses travaux originaux en entrée ?
Posté par gUI (Mastodon) .
Évalué à 9.
Dernière modification le 09 mai 2023 à 11:14.
Est-ce que la situation d'une personne qui a appris en lisant du code est comparable à la situation d'un modèle entraîné sur ce code ?
Pour moi non, et c'est tout simplement le soucis qu'on a déjà avec n'importe quelle automatisation à grande échelle : prendre quelques photos par-ci par-là de la rue, avec éventuellement des gens dessus, tout le monde le fait et ça ne pose pas de problème. Mais mettre en place des appareils photos automatiques à tous les coins de rue qui prennent une photo toutes les 5 secondes, là ça ferait peur. Pourtant c'est presque pareil… presque. La différence c'est l'échelle.
De la même manière je ne peux pas lire et analyser tout le code du monde, donc en gros "on me laisse faire" de lire ce que je peux pour apprendre, tant mieux pour moi. Je reste à l'échelle humaine, je n'ai pas d'avance sur les autres, la "compétition" est loyale. Là au contraire on parle d'un système automatisé qui serait théoriquement capable de lire et d'analyser tout le code du monde (ou disons une bonne partie), c'est très différent, entre autre parce que c'est bien le seul qui en serait capable (vu qu'il a accès à la plus grand base de code du monde).
<mode gauchiste>
Si c'était une machine open source, ou un travail universitaire bref un truc qui à la fin est à la disposition de l'humanité, on réfléchirait peut-être différemment à cette question.
</mode gauchiste>
En théorie, la théorie et la pratique c'est pareil. En pratique c'est pas vrai.
Est-ce qu'un code généré par un modèle "entrainé" est un travail dérivé ? C'est toute la question sur laquelle il n'y a pas de consensus.
Mouais, à mon avis, c'est la question sur laquelle on aimerait bien croire qu'il n'y a pas de consensus. Le code produit par un modèle de langage ne correspond en rien à ce que la jurisprudence considère comme du travail dérivé. Si quelqu'un publie un logiciel qui contient des bouts de code issus d'une "IA", et que tu considères qu'il enfreint la licence de ton logiciel, il va falloir l'attaquer pour contrefaçon. Et il va falloir évidemment que le code produit ressemble au tien au point où il puisse être qualifié de travail dérivé (c'est à dire que ton code doit être original—il ne doit pas être possible de trouver du code ressemblant dans la base de données—et il faut que le logiciel que tu attaques ressemble plus à ton code qu'à n'importe quel autre code dans la base de données). Moi j'achète des pop-corns et je regarde ça de loin, en me demandant bien comment tu vas faire pour le prouver, parce que c'est presque par construction qu'un bon modèle de langage (qui n'est pas sur-ajusté) ne peut pas dériver un travail d'une unique source.
Il est pas possible d'interdire le machine learning sur le code que l'on produit via la licence ?
En fait le sujet n'est pas la, le sujet est sur le copyright en général, pour l'instant le machine learning n'ai pas vu comme œuvre dérivée et donc libre ou pas, licence ou pas, il n'y a pour le moment pas de lien, donc tu ne peux l'interdire car pas interdisable (rappel : par défaut, tout est interdit sauf si pas de lien, et de ce que je comprend pour le moment on est dans le "pas de lien" assez direct, plutôt considéré comme si tu lisais un cours pas libre de C++ et que l'auteur du bouquin aurait des droits sur ce que tu produits, ce n'est pas le cas).
Je trouve ça tout à fait problématique personnellement et suffisant pour utiliser des moyens proactifs d'entraves à ces pratiques donc ne plus rendre le code publique si aucune licence, droit d'auteur ou copyright ne permet de protéger.
Mais contre quoi souhaites-tu "protéger" ton code?
Ce n'est pas contre l'indexation dans une base de données géante, puisque de nombreux robots et analyseurs de code indexent déja le code disponible (à commencer par les moteurs de recherche).
Ce n'est pas contre le travail dérivé, puisque le code produit par les modèles de langage ne correspondent pas du tout à ce qui est habituellement considéré comme du travail dérivé (en particulier, le propre d'un travail dérivé est de ressembler à quelque chose d'existant).
Ce n'est pas contre la réutilisation du code par une entreprise qui se fait du pognon dessus, puisque c'est normalement possible avec une licence libre.
Qu'y a-t'il de si particulier pour qu'une utilisation compatible avec l'esprit et la lettre des licences libres semble poser un tel problème qu'on puisse envisager de ne plus publier du tout son code?
Qu'y a-t'il de si particulier pour qu'une utilisation compatible avec l'esprit et la lettre des licences libres semble poser un tel problème qu'on puisse envisager de ne plus publier du tout son code?
Dans l'état actuel des choses, il s'agit de grands groupes qui s'autorisent à piocher dans l'ensemble des connaissances partagées par l'humanité pour n'en redistribuer que ce qui est monnayable. Je ne doute pas que ça plait à des gens et que d'autres s'en foutent mais moi ça me pose problème.
Eh oui ça existait déjà avant, ça posait problème avant, mais le faire à une échelle infiniment plus grande et de manière aussi systématisée ne va pas dans le bon sens de mon point de vu.
L'énorme majorité des arguments que j'entends aller dans l'autre sens me semble recourir à des idéologies qui ne me plaisent pas comme la fatalité, l'impuissance de l'État sur la technologie, etc et ça en soit ça me pose de gros problèmes.
Posté par arnaudus .
Évalué à 4.
Dernière modification le 09 mai 2023 à 22:37.
Je me contrefiche que ça soit « compatible avec l'esprit et la lettre des licences libres
Bah c'est pourtant ça qui est important, non? C'est bien pour ça que c'est OK qu'un logiciel libre peut être réutilisé par des pédo-néo-nazis, par des gouvernements autoritaires, ou par des multinationales.
Je ne doute pas que ça plait à des gens et que d'autres s'en foutent mais moi ça me pose problème.
Mais c'est le genre de problème sur lequel tu as forcément réfléchi en faisant du logiciel libre. Quand tu contribues au noyau Linux, ton code se retrouve dans les Freebox, dans 60% des téléphones portables, dans les logiciels embarqués sur les missiles nucléaires, et dans les appareils qui pilotent l'extraction des gaz de schiste. Les grands groupes réutilisent les logiciels libres pour faire du business, et c'est complètement OK. Évidemment, la plupart des gens ne font pas du libre pour que les grands groupes fassent du business, mais c'est possible, et ça n'est pas problématique.
Honnêtement, ça me gênerait beaucoup plus que mon code serve à faire fonctionner des armes russes par exemple, plutôt que de contribuer à une base de connaissances d'une IA. C'est même quelque chose qui m'a beaucoup perturbé pendant longtemps, pourquoi ne doit-on pas inclure une notice "Il est interdit d'utiliser ce logiciel pour tuer des gens" dans un logiciel libre, par exemple.
L'énorme majorité des arguments que j'entends aller dans l'autre sens me semble recourir à des idéologies qui ne me plaisent pas comme la fatalité, l'impuissance de l'État sur la technologie, etc et ça en soit ça me pose de gros problèmes.
Mais la fatalité contre quoi? Contre une utilisation qui me semble complètement légitime du logiciel libre? En quoi est-ce différent de la réutilisation du contenu de Wikipédia par Google, par Amazon, etc? Il est évident que les technologies "intelligentes" ont besoin de contenu, et je préfère largement qu'elles utilisent du contenu libre plutôt qu'un truc qu'elles achèteraient à un acteur privé. Les contributeurs de Wikipédia le font pour que le contenu produit soit réutilisé, et c'est exactement ce qu'OpenAI fait, non? Pense au retour possible, à la manière dont ChatGPT pourrait améliorer les articles de Wikipédia, leur syntaxe, leur cohérence?
Ce que j'essaye de dire, c'est qu'il n'y a pas que deux options, "s'en foutre" ou "ça pose un problème". Mon point de vue, c'est qu'au contraire, c'est super. C'est super que du code libre et du contenu libre comme Wikipédia servent à entrainer les AI, ça démontre la puissance et l'importance du libre dans le monde du XXI siècle. C'est pour ça qu'on fait du libre, pour que le contenu soit réutilisé. Bien sûr, cette réutilisation n'était pas vraiment envisageable il y a 15 ou 20 ans, mais pourquoi est-ce un problème? On n'est pas obligés de devenir des grand-mères à moustaches et d'avoir peur de tout ce qui peut arriver. Personne ne sait ce que va être le monde dans 5 ans. Peut-être que les AI vont s'avérer décevantes et que l'engouement initial va disparaitre. Pëut-être au contraire les progrès vont être fulgurants et que le monde va profondément changer. Peut-être qu'OpenAI va devenir la plus grosse entreprise du monde (après tout, ce n'est pas si anormal si son IA révolutionne le monde, non?). Mais qu'y a-t-il d'anormal à ça? A priori, le retour sur le libre pourra même se faire, vu que ces technologies pourront être utilisées pour générer la doc d'un LL, produire du code, améliorer Wikipédia…
Comment je peux être plus clair que le logiciel libre n'est pas "ce qui est important pour moi" ? J'ai plusieurs critères qui sont en différents voir qui peuvent entrer en contradiction avec le libre.
Ce que j'essaye de dire, c'est qu'il n'y a pas que deux options, "s'en foutre" ou "ça pose un problème".
Je me cite :
Je ne doute pas que ça plait à des gens et que d'autres s'en foutent mais moi ça me pose problème.
Si on lis bien on remarque qu'il y a 3 cas :
les gens à qui ça plait
les gens qui s'en foutent
moi (et apparemment d'autres, mais c'est implicite)
Si ça te plait c'est cool. Je ne te dis pas ce que tu devrais faire ou non.
C'est super que du code libre et du contenu libre comme Wikipédia servent à entrainer les AI, ça démontre la puissance et l'importance du libre dans le monde du XXI siècle. C'est pour ça qu'on fait du libre, pour que le contenu soit réutilisé.
Ce n'est pas du partage mais de la captation. Des entreprises qui flurtent avec des situations de monopoles peuvent devenir la porte d'entrée vers toute ce travail et vont à minima le présenter avec leur biais.
Bien sûr, cette réutilisation n'était pas vraiment envisageable il y a 15 ou 20 ans, mais pourquoi est-ce un problème?
Laisser ces multinationales les mains libres n'a jamais donné quelque chose de bon ou pas longtemps. C'est pas vraiment de leur faute, c'est la logique d'une entreprise qui est aussi grosse.
Personne ne sait ce que va être le monde dans 5 ans.
Et c'est une raison pour laisser faire ?
Peut-être que les AI vont s'avérer décevantes et que l'engouement initial va disparaitre.
Je n'ai aucun doute que les IA actuelles vont perdre rapidement leur hype, mais ça n'aura pas empêché ces entreprises de modéler leur marchés et les habitudes des utilisateurs.
Pëut-être au contraire les progrès vont être fulgurants et que le monde va profondément changer.
Très peu probable avec les technologies actuelles, elles ne font pas des miracles, elles surprennent à faire ressemblantes.
Peut-être qu'OpenAI va devenir la plus grosse entreprise du monde (après tout, ce n'est pas si anormal si son IA révolutionne le monde, non?). Mais qu'y a-t-il d'anormal à ça?
Tu as 70 ans de littérature sur l'antitrust américain sur le sujet.
A priori, le retour sur le libre pourra même se faire, vu que ces technologies pourront être utilisées pour générer la doc d'un LL, produire du code, améliorer Wikipédia…
Ça c'est de l'espoir. Moi ça ne me parait pas crédible. La manière dont l'avancée dans le domaine pousse à fermer de plus en plus (l'objectif c'est de monétiser ça coûte un max à créer et à opérer) ne me semble pas aller dans ce sens.
GitHub Copilot is powered by Codex, a generative pretrained AI model created by OpenAI. It has been trained on natural language text and source code from publicly available sources, including code in public repositories on GitHub.
Je comprends tout à fait l'objectif de faire champagne contre copilot et/ ou github, mais ne pas être sur github ne va pas être suffisant. Je ne serais pas surpris qu'ils sont allé cherché des dépôts de manière automatisé via des distributions linux.
En fait, la seule possibilité pour que ce ne soit pas lu par d'autres, y compris les trucs pseudo intelligents, c'est de rendre le code non lisible en public. C'est possible, même en libre (le libre n'oblige pas à mettre le code en public, le code ne doit être livré qu'à ceux qui reçoivent un produit libre, et personne d'autre, puis il suffit que les gens à qui tu as livré soient d'accord avec ta façon de voir).
Posté par Psychofox (Mastodon) .
Évalué à 6.
Dernière modification le 08 mai 2023 à 22:53.
Et tu n'es pas obligé de le fournir par voie electronique en fait, ni même en ligne.
En théorie tu dois pouvoir livrer des tablettes de pierres, de bois gravées ou graver un menhir et le faire livrer au destinataire, la licence est respectée.
Ça doit dépendre des licences. Pour la GPLv2 c'est précisé que le format doit être "lisible par une machine", sur un média "habituellement utilisé pour l'échange de logiciel". Ça exclue malheureusement le menhir.
D'aucuns pourraient dire qu'avec les systèmes d'OCR modernes c'est parfaitement lisible par une machine.
Pour le havituellement utilisé pour échange de logiciel c'est plus compliqué.
Cela-dit tu peux le fournir sur une clé usb intégrée à un bloc de béton de plusieurs tonnes et de la taille du même menhir, ça reste valide si le port usb de celui-ci est accessible.
Une autre manière de passer outre est d'utiliser des langages peu connu. Il est peu probable que Microsoft ai quelque chose à faire de code en malbolge pour citer le cas le plus tordu. Même sans aller jusqu'à ce genre d’extrémité (je pense sincèrement qu'il est discutable de considérer que du code malbolge peut être libre, il est à mon avis obfusqué par nature) écrire du code en nim par exemple va mécaniquement faire passer sous les radars.
oui c'est ce que me disait également. Ça sera probablement plus simple pour eux d'ausculter du code sur github, mais rien ne les empêche d'aller récupérer les projets sur gitlab, sourcehut etc, rajoutant une charge sur la bande passante de ces concurrents…
une solution serait d'utiliser une sorte de fédération de forge, sur le modèle de fediverse, et de généraliser cela, pour limiter les passages IA (en les ralentissant peut-être ?) tout en permettant de faire des recherches pour le reste du monde. Mais dans un sens comme dans l'autre, les besoins de partages vont se chevaucher avec les besoins de IA donc aucune solution n'est vraiment optimale.
« Le pouvoir des Tripodes dépendait de la résignation des hommes à l'esclavage. » -- John Christopher
Vous n'avez jamais pensé à juste laisser le code vivre sa vie sans vous soucier de limiter à X ou Y mais pas Z?
Perso, ça a été mon évolution il y a 10 ans et je ne regrette pas de ne plus me prendre la tête avec les trucs "entre les 2, pas clair, et en plus ce manque de clarté ne vient pas de moi vu que j'ai pris une licence qu'on m'a dit de prendre et que pas foule peut ou veut répondre à si légal ou pas ce truc", et avec le recul ça me semble être le plus optimal, plus de temps pour faire du code qui sert que de chercher à limiter le passé à chaque évolution des technologies ou des moeurs, se focaliser sur l'avenir plutôt que le passé.
vu que j'ai pris une licence qu'on m'a dit de prendre et que pas foule peut ou veut répondre à si légal ou pas ce truc
Et même si tu sais qu'une réutilisation est illicite, combien parmi les auteurs de logiciels libres iraient jusqu'à un procès coûteux pour faire respecter la licence? Une entreprise qui défend un marché pourrait faire ça, mais un particulier? Qu'est-ce que ça peut t'apporter de dépenser des dizaines de milliers d'euros en expertise et frais d'avocats pour forcer une boîte que tu ne connais pas à publier leur code? Les licences libres dissuades probablement les réutilisateurs malhonnêtes, mais c'est une barrière psychologique, rien n'empêche que du code libre soit réutilisé pour tout un tas de trucs (sur des serveurs, sur de l'embarqué…) sans que personne n'en sache rien. Tout le blabla juridique des licences ne peut pas empêcher ce genre de choses.
# Une des raisons pour laquelle j'aime le libre
Posté par Zenitram (site web personnel) . Évalué à -6.
C'est une des raisons pour laquelle j'aime le libre, les personnes qui veulent dire faire du libre sont obligées de m'autoriser entre autre à mettre leur code sur GitHub malgré leurs idées (qui ne sont pas des faits).
Rappelons que :
N'est pas si évident que ça, qu'il y a un gros débat dessus qui ne part pas en faveur de ceux qui disent ça, et que balancer ça de manière aussi affirmative est trompeur.
Bon, à leur décharge ils disent bien que c'est une demande ("please") et non une interdiction. Mais leur façon de me culpabiliser à coup de "ce ne serait pas éthique" qui n'est que leur morale aurait quand même plutôt tendance à me faire faire l'inverse de ce qu'il me demande, pour que le code libre soit le plus diffusé possible, car le sujet n'est pas du tout de l'éthique mais un désaccord sur des limites.
Sinon, un petit truc rigolo : comme la liste des sites de contrefaçon, ça va permettre de facilement cataloguer le code libre pas sur Github (mais pour le moment ça n'a pas l'air d'attirer foule).
Plus le temps passe qui me montre comment le libre me protège de la non envie de laisser leur code vivre leur vie, plus j'aime le libre (même GPL, tout aussi libre que le copyfree).
[^] # Re: Une des raisons pour laquelle j'aime le libre
Posté par Thomas Douillard . Évalué à 10.
Bref, tu es libertarien et pas libriste. Si on te dit que cramer du charbon c’est mauvais pour la planète tu vas faire du coal burning. Respecter les autres c’est pisser sur leur avis.
[^] # Re: Une des raisons pour laquelle j'aime le libre
Posté par LeBouquetin (site web personnel, Mastodon) . Évalué à 7.
Il ne faut pas comparer ce qui n'est pas comparable. On fait du logiciel libre - donc a priori conforme aux 4 libertés fondamentales et en même temps on voudrait que le logiciel soit utilisé uniquement "de la bonne manière". Dans ce cas, le mieux est de ne pas faire du logiciel libre puisqu'il est déjà établi ce qui est bien et ce qui ne l'est pas.
#tracim pour la collaboration d'équipe __ #galae pour la messagerie email __ dirigeant @ algoo
[^] # Re: Une des raisons pour laquelle j'aime le libre
Posté par barmic 🦦 . Évalué à 6.
Je suis bien d'accord avec cette phrase et c'est bien pour ça que je ne considère plus le libre comme un objectif absolu à atteindre et que ce n'est plus un dogme qui me paraît toujours intéressant.
Il y a des sujets qui me sont apparu ces 10 dernières années qui me paraissent au moins voir plus important que ce à quoi s’intéresse le libre. La victoire culturelle écrasante du libre pousse beaucoup de gens à penser que ce qui est libre est "bien" (selon leur convention) et que tout ce qui est "bien" (toujours selon leur opinion) est libre.
https://linuxfr.org/users/barmic/journaux/y-en-a-marre-de-ce-gros-troll
[^] # Re: Une des raisons pour laquelle j'aime le libre
Posté par Yuul B. Alwright . Évalué à 7.
Le bon vielle argument du "y a pire ailleurs, donc laisse tomber ce que tu fais".
C'est assez nul cet argument.
Non, culturellement, c'est l'Open Source qui l'a emporté. Et pas d'une façon aussi écrasante que tu l'imagine. La culture libre, qui fait suite à la culture hacker, est loin d'être dominante ou même acceptée partout.
Tu fais un procès d'intention.
Le logiciel libre est une des pratiques du mouvement hacker. Je parle du mouvement original, pas des fans de sécurité informatique ou des techno-bourgeois de la silicone vallée. Mouvement hacker qui considère que si on se sert de la technologie ça doit être pour émanciper les gens, pas pour les contrôler. Le logiciel libre étant issue du mouvement hacker, il en a hérité la culture et l'ambition. C'est le mouvement Open Source qui, pour les citer, "Veut les avantages techniques et financier du libre pour les entreprises, sans la politique". Et je pense que tu confonds le Logiciel Libre et l'Open Source.
[^] # Re: Une des raisons pour laquelle j'aime le libre
Posté par barmic 🦦 . Évalué à 6.
Je ne dis à personne ce qu'il doit faire, je dis que de mon point de vu les objectifs du libre ne sont plus ce qu'il y a de plus important pour moi. Ce n'est pas un argument c'est mon avis.
Libre ou open source je m'en fou (et oui je me doute que ça va pas te plaire), mais je vois très souvent des gens chercher à se raccrocher à libre ou à "open" sans que ça en soit voir quand ça n'a pas le moindre sens.
Je veux bien une source de ta citation.
Pour le reste ça ne tiens pas beaucoup, je me fous royalement de cette divergence que je connais très bien (puisque que tu remet en question mes connaissances). Ta vision manichéenne libre/open source me semble vraiment caricaturale. Amalgamer des gens comme Linus Torvald1, Theo de Raadt ou ESR (et globalement toutes les communautés autour des BSD) aux entrepreneurs libertariens qu'on trouvent aujourd'hui dans la vallée du silicium, c'est, à minima, osé.
je met un lien qui référence du linuxfr parce que c'est cool, mais tu en a pleins d'autres sur les points de vu de Linus Torvald qui ne cadrent pas du tout avec la vision éthique de la FSF et du mouvement du libre ↩
https://linuxfr.org/users/barmic/journaux/y-en-a-marre-de-ce-gros-troll
[^] # Re: Une des raisons pour laquelle j'aime le libre
Posté par raphj . Évalué à 10. Dernière modification le 08 mai 2023 à 16:19.
De mon côté je comprends et partage le sentiment des auteurs du poste de ne pas vouloir que son code soit publié sur GitHub pour un peu les mêmes raisons.
Et je comprends vouloir exprimer ce souhait.
Mais je ne voudrais pas imposer ça non plus. Je ne voudrais pas que ces restrictions apparaissent dans les licences libres. Pour des raisons philosophiques, et aussi pour des raisons bassement stratégiques aussi : ça risquerait de fragmenter l'écosystème beaucoup trop.
Pas d'accord avec ça. Ce n'est pas du tout établi. Il y a plein de manière de faire des choses pas éthiques en faisant du libre. Pour caricaturer, c'est nécessaire mais pas suffisant (bon, c'est beaucoup plus nuancé que ça en vrai), et à mon avis on a tout intérêt à bien séparer les choses.
On peut vouloir faire bouger son monde sans imposer strictement des règles, mais en suggérant, exprimant des souhaits, en faisant du lobby, de la comm., en s'exprimant, en diffusant des idées, etc. Se limiter au système légal, des contrats et des droits me parait simpliste, réducteur et parfois contre-productif.
Il y a des moyens de rester subtils. Ce groupe de personnes exprime un souhait sans l'imposer en faisant une campagne de communication / sensibilisation, de quoi se plaint-on ?
[^] # Re: Une des raisons pour laquelle j'aime le libre
Posté par Zenitram (site web personnel) . Évalué à -8. Dernière modification le 08 mai 2023 à 14:33.
File moi 100 € s'il-te-plait.
C'est mon avis, de l'éthique suivant ma définition, tu peux le faire, si tu ne le fais pas c'est pisser sur mon avis.
Bizarre? Ben c'est ce que tu viens de me dire.
Je respecte à 100% ce qu'il me dit : il me dit explicitement (licence libre) que je peux le faire mais que ça serait bien que je ne le fasse pas, je respecte la volonté de l'auteur qui est de me laisser libre de le faire, en déclinant la partie optionnelle comme toi tu déclines de me filer 100 €.
Respecter les autres, c'est aussi respecter que je décline une partie optionnelle et respecter quelque chose qu'on m'a explicitement autorisé à faire. Rappel : par défaut (sans texte signé par l'auteur du code), je n'ai pas le droit d'uploader sur GitHub, il faut qu'il m'autorise explicitement de le faire pour que je puisse le faire, et si vraiment on ne souhaite pas que je le fasse le plus simple est d'éviter de m'autoriser explicitement à le faire plutôt que de mettre un truc à côté qui contredit le texte précédement fourni.
RMS n'a pas souhaiter éviter que je mette sur des endroits "pas bien", quel libertaire il est.
(ha oui, les libertaires m'accusent de communisme, hein, mais c'est un détail pour qui veut cataloguer en méchant ceux qui ne sont pas complètement comme ils voudraient)
[^] # Re: Une des raisons pour laquelle j'aime le libre
Posté par Thomas Douillard . Évalué à 5.
Tu négliges un peu complètement les problématiques émergentes. Ces gens ont placé ces logiciels sous licences libres avant qu’on parle d’utilisation massive par des IAs, et c’est des trucs que probablement ni la législation ni vraiment les licences ne peuvent prendre en compte au moins à l’heure actuelle.
Donc si il y a vide juridique, on a tout simplement pas eu le temps de digérer tout ça, donc interpréter le placement sous licence comme "tu m’as autorisé, t’aurais dû réfléchir avant" comme réponse … "ah bah non, cette problématique n’existait pas quand j’ai réfléchi".
[^] # Re: Une des raisons pour laquelle j'aime le libre
Posté par Zenitram (site web personnel) . Évalué à -4. Dernière modification le 08 mai 2023 à 14:57.
RMS va lancer l'écriture d'une GPLv4 pour combler?
ça sera compatible avec les 4 libertés définies par RMS?
ça sera accepté par les autres acteurs du libre?
Peut-être, peut-être pas, la ce qui me fait réagir c'est cette réaction immédiate de certains à considérer que ce n'est pas éthique, pas dans "l'esprit du libre", et l'affirmer comme si c'était évident et partagé par tous.
Alors que non, c'est même très loin d'être évident que l'automatisation de ce qu'on aimait qu'une être humain fasse soit si opposé à "l'esprit du libre" déjà assez imaginaire. Et ça ne sera pas la première fois que les plus ardents défenseurs du libre râlent que le libre file trop de liberté (le "libre mais non commercial" commençait à se tasser, fallait bien trouver autre chose pour s'opposer aux libertés que confèrent le libre, le libre c'était sympa du moment où les gens n'utilisaient les libertés).
Rappelons aussi que le sujet n'a rien à voir avec le libre, car il est commun au non libre (il suffit que le code, ou image etc, soit accessible), mélanger le sujet avec du libre est déjà assez se tromper sur la problématique.
[^] # Re: Une des raisons pour laquelle j'aime le libre
Posté par Thomas Douillard . Évalué à 1. Dernière modification le 08 mai 2023 à 15:05.
Ça n’a pas "rien à voir", même s’il est commun au non libre, vu qu’il s’agit de droit d’auteur et que le libre est une vision du droit d’auteur. Il se pourrait simplement que la législation du droit d’auteur décide de ne pas vraiment laisser de prise au libre ou à une vision alternative du droit d’auteur pour se prononcer sur la question.
Pour le reste, je te laisse à tes opinions. Je ne te suis pas vraiment.
[^] # Re: Une des raisons pour laquelle j'aime le libre
Posté par BAud (site web personnel) . Évalué à 7.
bin, Zenitram a raison pour le coup : tu parles des IA qui ne respectent pas les licences octroyées (demander aux journaux New Yorkais ou des universités américaines, qui proposent leurs contenus sur Internet sans conférer de droit de reproduction pour autant…).
idem, pour les contenus sous licences libres en "share-alike" (CC-by-SA, GPL…) non respectées par les IA (actuellement)
le vide juridique est du côté des IA, pas du côté des licences libre pour le coup (et même souci avec licences proprios interdisant la reproduction voire ont des clauses léonines en Europe en interdisant la rétro-ingénierie).
[^] # Re: Une des raisons pour laquelle j'aime le libre
Posté par GG (site web personnel) . Évalué à 5.
Il y a certes un petit vide juridique, mais pour le développeur, c'est prendre le risque de réutiliser du code dont il ne connaît pas la licence, et ça, c'est problématique (sauf pour ceux qui n'en ont rien à faire des licences).
Le risque, c'est qu'il y ait des procès sur l'incohérence de la licence des logiciels produits avec ces bouts de codes, si c'est détectable une fois le code compilé… puisque les sources sont rarement disponibles dans les logiciels propriétaires. Encore faut-il pouvoir remonter aux sources.
Chacun se souvient de Microsoft qui clame que Linux utilise du code de Microsoft, mais Microsoft refuse de préciser quelles sont les parties du code concernées. (de ce que j'ai compris).
S'il était facile de déterminer le code source utilisé pour générer le code binaire compilé, ça se saurait. Et il y a sûrement déjà eu beaucoup d'articles sur ce sujet, n'est ce pas?
Pourquoi bloquer la publicité et les traqueurs : https://greboca.com/Pourquoi-bloquer-la-publicite-et-les-traqueurs.html
[^] # Re: Une des raisons pour laquelle j'aime le libre
Posté par Wrap . Évalué à 3.
Je plussoie pour cette partie du commentaire
[^] # Re: Une des raisons pour laquelle j'aime le libre
Posté par Lutin . Évalué à 8.
Tu râles pour le plaisir de râler.
[^] # Re: Une des raisons pour laquelle j'aime le libre
Posté par Psychofox (Mastodon) . Évalué à 5.
Accessoirement, si je devais forker un outil qui a ce genre de requête dans le readme du repo, je me tournerais quand même vers le service légal de mon entreprise ainsi que celui sur les relations publiques. Le premier pour m'assurer que cette requête ne puisse pas être considérée comme un addendum à une licence dans quelconque juridictions dans laquelle notre le logiciel est vendu/distribué/fourni un service, le second pour savoir si l'entreprise accepte ou se contrecarre des possibles effets médiatiques la chose devait être publique.
[^] # Re: Une des raisons pour laquelle j'aime le libre
Posté par Psychofox (Mastodon) . Évalué à 8.
Le mec, il ne fait juste que proposer et demander.
Bien sûr que les sociopathes dans ton genre vont faire ce que ça leur chante de toute manière. Moi je pars du principe que si on me demande gentillement et que ça ne me provoque aucune contrainte particulière personnelle, je ne vois pas de raison particulière de m'y opposer.
Et de toute manière si son repo est publiquement récupérable, ça ne changera rien si les sources de copilot ou autres système similaires décident de s'entrainer sur les repos de codeberg.
# Licence
Posté par flagos . Évalué à 6.
Question naïve, je ne sais pas si elle a déjà été abordée.
Il est pas possible d'interdire le machine learning sur le code que l'on produit via la licence ? Existe il des licences qui restreignent ce genre de libertes ?
[^] # Re: Licence
Posté par LeBouquetin (site web personnel, Mastodon) . Évalué à 8.
Parmi les 4 libertés fondamentales du logiciel libre, il y a la liberté d'utiliser et la liberté d'étudier.
Interdire d'utiliser le code pour faire du machine learning me semble en désaccord avec ces 2 libertés…
#tracim pour la collaboration d'équipe __ #galae pour la messagerie email __ dirigeant @ algoo
[^] # Re: Licence
Posté par barmic 🦦 . Évalué à 3.
Toutes les licences ne sont pas libres. De la même manière qu'on voit apparaitre des licence contre Amazon, je ne serais pas surpris qu'on voit apparaitre des licences contre l'apprentissage automatisé (ce qui est une vague question car distinguer l'ajout dans un index de moteur de recherche et l'ajout dans les entrées d'un réseau de neurones doit être un peu complexe).
Par contre pour la liberté d'étudier, je ne vois pas en quoi ce serait un frein. A moins de considérer les IA comme des personnes morales ayant des droits, je ne vois pas en quoi interdire l'utilisation comme entrée d'un réseau de neurones enfreins ce droit.
https://linuxfr.org/users/barmic/journaux/y-en-a-marre-de-ce-gros-troll
[^] # Re: Licence
Posté par Thomas Douillard . Évalué à 6.
cf. Logiciel libre.
ChatGPT fait tout sauf exécuter le programme.
A condition de considérer que ChatGPT "étudie" le fonctionnement du programme. Mais chatGPT n’est pas un utilisateur, ni un développeur, ni une personne.
Pour les logiciels sous copyleft, à prendre en compte le fait que le résultat des modifications doit être sous la même licence.
[^] # Re: Licence
Posté par raphj . Évalué à 5.
Oui. On ne peut clairement pas interdire de faire du machine learning avec une licence libre. Sinon, ce n'est pas libre.
Bon par contre, pour un travail dérivé, on est tenu de respecter l'attribution demandée par la plupart des licences libres, et toutes les autres clauses
Est-ce qu'un code généré par un modèle "entrainé" est un travail dérivé ? C'est toute la question sur laquelle il n'y a pas de consensus. Et c'est ce point que certain·e·s d'entre nous cherchent à résister.
[^] # Re: Licence
Posté par gUI (Mastodon) . Évalué à 8.
On peut même passer sur une autre question : est-ce que le code que je ponds chaque jour est un travail dérivé de tout ce que j'ai vu/lu ?
En théorie, la théorie et la pratique c'est pareil. En pratique c'est pas vrai.
[^] # Re: Licence
Posté par jnanar (site web personnel) . Évalué à 4.
Ne serais-je pas un réseau de neurones entraînés?
Sous-texte: It also works for anything you teach someone else to do. "Oh yeah, I trained a pair of neural nets, Emily and Kevin, to respond to support tickets."
[^] # Re: Licence
Posté par raphj . Évalué à 3.
C'est une grande partie du problème / de l'enjeu. Est-ce que la situation d'une personne qui a appris en lisant du code est comparable à la situation d'un modèle entraîné sur ce code ?
C'est un des points majeurs sur lesquels les avis divergent. Je n'ai vu pas vu d'argument convainquant à 100% dans un sens comme dans l'autre, donc on sort du domaine de la logique et on entre dans le domaine des opinions.
On pourrait voir la transformation comme une fonction : f(travail original 1, …, travail original n, autres entrées) = travail généré.
[^] # Re: Licence
Posté par gUI (Mastodon) . Évalué à 9. Dernière modification le 09 mai 2023 à 11:14.
Pour moi non, et c'est tout simplement le soucis qu'on a déjà avec n'importe quelle automatisation à grande échelle : prendre quelques photos par-ci par-là de la rue, avec éventuellement des gens dessus, tout le monde le fait et ça ne pose pas de problème. Mais mettre en place des appareils photos automatiques à tous les coins de rue qui prennent une photo toutes les 5 secondes, là ça ferait peur. Pourtant c'est presque pareil… presque. La différence c'est l'échelle.
De la même manière je ne peux pas lire et analyser tout le code du monde, donc en gros "on me laisse faire" de lire ce que je peux pour apprendre, tant mieux pour moi. Je reste à l'échelle humaine, je n'ai pas d'avance sur les autres, la "compétition" est loyale. Là au contraire on parle d'un système automatisé qui serait théoriquement capable de lire et d'analyser tout le code du monde (ou disons une bonne partie), c'est très différent, entre autre parce que c'est bien le seul qui en serait capable (vu qu'il a accès à la plus grand base de code du monde).
<mode gauchiste>
Si c'était une machine open source, ou un travail universitaire bref un truc qui à la fin est à la disposition de l'humanité, on réfléchirait peut-être différemment à cette question.
</mode gauchiste>
En théorie, la théorie et la pratique c'est pareil. En pratique c'est pas vrai.
[^] # Re: Licence
Posté par arnaudus . Évalué à 4.
Mouais, à mon avis, c'est la question sur laquelle on aimerait bien croire qu'il n'y a pas de consensus. Le code produit par un modèle de langage ne correspond en rien à ce que la jurisprudence considère comme du travail dérivé. Si quelqu'un publie un logiciel qui contient des bouts de code issus d'une "IA", et que tu considères qu'il enfreint la licence de ton logiciel, il va falloir l'attaquer pour contrefaçon. Et il va falloir évidemment que le code produit ressemble au tien au point où il puisse être qualifié de travail dérivé (c'est à dire que ton code doit être original—il ne doit pas être possible de trouver du code ressemblant dans la base de données—et il faut que le logiciel que tu attaques ressemble plus à ton code qu'à n'importe quel autre code dans la base de données). Moi j'achète des pop-corns et je regarde ça de loin, en me demandant bien comment tu vas faire pour le prouver, parce que c'est presque par construction qu'un bon modèle de langage (qui n'est pas sur-ajusté) ne peut pas dériver un travail d'une unique source.
[^] # Re: Licence
Posté par Zenitram (site web personnel) . Évalué à -3.
En fait le sujet n'est pas la, le sujet est sur le copyright en général, pour l'instant le machine learning n'ai pas vu comme œuvre dérivée et donc libre ou pas, licence ou pas, il n'y a pour le moment pas de lien, donc tu ne peux l'interdire car pas interdisable (rappel : par défaut, tout est interdit sauf si pas de lien, et de ce que je comprend pour le moment on est dans le "pas de lien" assez direct, plutôt considéré comme si tu lisais un cours pas libre de C++ et que l'auteur du bouquin aurait des droits sur ce que tu produits, ce n'est pas le cas).
[^] # Re: Licence
Posté par barmic 🦦 . Évalué à 2.
Je trouve ça tout à fait problématique personnellement et suffisant pour utiliser des moyens proactifs d'entraves à ces pratiques donc ne plus rendre le code publique si aucune licence, droit d'auteur ou copyright ne permet de protéger.
https://linuxfr.org/users/barmic/journaux/y-en-a-marre-de-ce-gros-troll
[^] # Re: Licence
Posté par arnaudus . Évalué à 3.
Mais contre quoi souhaites-tu "protéger" ton code?
Ce n'est pas contre l'indexation dans une base de données géante, puisque de nombreux robots et analyseurs de code indexent déja le code disponible (à commencer par les moteurs de recherche).
Ce n'est pas contre le travail dérivé, puisque le code produit par les modèles de langage ne correspondent pas du tout à ce qui est habituellement considéré comme du travail dérivé (en particulier, le propre d'un travail dérivé est de ressembler à quelque chose d'existant).
Ce n'est pas contre la réutilisation du code par une entreprise qui se fait du pognon dessus, puisque c'est normalement possible avec une licence libre.
Qu'y a-t'il de si particulier pour qu'une utilisation compatible avec l'esprit et la lettre des licences libres semble poser un tel problème qu'on puisse envisager de ne plus publier du tout son code?
[^] # Re: Licence
Posté par barmic 🦦 . Évalué à 5.
Je me contrefiche que ça soit « compatible avec l'esprit et la lettre des licences libres ». Bon sachant que c'est un fait que tu avance qui ne semble pas faire l'unanimité à minima ici, c'est d'ailleurs le sujet du lien sous le quel nous commentons.
Dans l'état actuel des choses, il s'agit de grands groupes qui s'autorisent à piocher dans l'ensemble des connaissances partagées par l'humanité pour n'en redistribuer que ce qui est monnayable. Je ne doute pas que ça plait à des gens et que d'autres s'en foutent mais moi ça me pose problème.
Eh oui ça existait déjà avant, ça posait problème avant, mais le faire à une échelle infiniment plus grande et de manière aussi systématisée ne va pas dans le bon sens de mon point de vu.
L'énorme majorité des arguments que j'entends aller dans l'autre sens me semble recourir à des idéologies qui ne me plaisent pas comme la fatalité, l'impuissance de l'État sur la technologie, etc et ça en soit ça me pose de gros problèmes.
https://linuxfr.org/users/barmic/journaux/y-en-a-marre-de-ce-gros-troll
[^] # Re: Licence
Posté par arnaudus . Évalué à 4. Dernière modification le 09 mai 2023 à 22:37.
Bah c'est pourtant ça qui est important, non? C'est bien pour ça que c'est OK qu'un logiciel libre peut être réutilisé par des pédo-néo-nazis, par des gouvernements autoritaires, ou par des multinationales.
Mais c'est le genre de problème sur lequel tu as forcément réfléchi en faisant du logiciel libre. Quand tu contribues au noyau Linux, ton code se retrouve dans les Freebox, dans 60% des téléphones portables, dans les logiciels embarqués sur les missiles nucléaires, et dans les appareils qui pilotent l'extraction des gaz de schiste. Les grands groupes réutilisent les logiciels libres pour faire du business, et c'est complètement OK. Évidemment, la plupart des gens ne font pas du libre pour que les grands groupes fassent du business, mais c'est possible, et ça n'est pas problématique.
Honnêtement, ça me gênerait beaucoup plus que mon code serve à faire fonctionner des armes russes par exemple, plutôt que de contribuer à une base de connaissances d'une IA. C'est même quelque chose qui m'a beaucoup perturbé pendant longtemps, pourquoi ne doit-on pas inclure une notice "Il est interdit d'utiliser ce logiciel pour tuer des gens" dans un logiciel libre, par exemple.
Mais la fatalité contre quoi? Contre une utilisation qui me semble complètement légitime du logiciel libre? En quoi est-ce différent de la réutilisation du contenu de Wikipédia par Google, par Amazon, etc? Il est évident que les technologies "intelligentes" ont besoin de contenu, et je préfère largement qu'elles utilisent du contenu libre plutôt qu'un truc qu'elles achèteraient à un acteur privé. Les contributeurs de Wikipédia le font pour que le contenu produit soit réutilisé, et c'est exactement ce qu'OpenAI fait, non? Pense au retour possible, à la manière dont ChatGPT pourrait améliorer les articles de Wikipédia, leur syntaxe, leur cohérence?
Ce que j'essaye de dire, c'est qu'il n'y a pas que deux options, "s'en foutre" ou "ça pose un problème". Mon point de vue, c'est qu'au contraire, c'est super. C'est super que du code libre et du contenu libre comme Wikipédia servent à entrainer les AI, ça démontre la puissance et l'importance du libre dans le monde du XXI siècle. C'est pour ça qu'on fait du libre, pour que le contenu soit réutilisé. Bien sûr, cette réutilisation n'était pas vraiment envisageable il y a 15 ou 20 ans, mais pourquoi est-ce un problème? On n'est pas obligés de devenir des grand-mères à moustaches et d'avoir peur de tout ce qui peut arriver. Personne ne sait ce que va être le monde dans 5 ans. Peut-être que les AI vont s'avérer décevantes et que l'engouement initial va disparaitre. Pëut-être au contraire les progrès vont être fulgurants et que le monde va profondément changer. Peut-être qu'OpenAI va devenir la plus grosse entreprise du monde (après tout, ce n'est pas si anormal si son IA révolutionne le monde, non?). Mais qu'y a-t-il d'anormal à ça? A priori, le retour sur le libre pourra même se faire, vu que ces technologies pourront être utilisées pour générer la doc d'un LL, produire du code, améliorer Wikipédia…
[^] # Re: Licence
Posté par barmic 🦦 . Évalué à 3.
Comment je peux être plus clair que le logiciel libre n'est pas "ce qui est important pour moi" ? J'ai plusieurs critères qui sont en différents voir qui peuvent entrer en contradiction avec le libre.
Je me cite :
Si on lis bien on remarque qu'il y a 3 cas :
Si ça te plait c'est cool. Je ne te dis pas ce que tu devrais faire ou non.
https://linuxfr.org/users/barmic/journaux/y-en-a-marre-de-ce-gros-troll
[^] # Re: Licence
Posté par barmic 🦦 . Évalué à 5.
Ce n'est pas du partage mais de la captation. Des entreprises qui flurtent avec des situations de monopoles peuvent devenir la porte d'entrée vers toute ce travail et vont à minima le présenter avec leur biais.
Laisser ces multinationales les mains libres n'a jamais donné quelque chose de bon ou pas longtemps. C'est pas vraiment de leur faute, c'est la logique d'une entreprise qui est aussi grosse.
Et c'est une raison pour laisser faire ?
Je n'ai aucun doute que les IA actuelles vont perdre rapidement leur hype, mais ça n'aura pas empêché ces entreprises de modéler leur marchés et les habitudes des utilisateurs.
Très peu probable avec les technologies actuelles, elles ne font pas des miracles, elles surprennent à faire ressemblantes.
Tu as 70 ans de littérature sur l'antitrust américain sur le sujet.
Ça c'est de l'espoir. Moi ça ne me parait pas crédible. La manière dont l'avancée dans le domaine pousse à fermer de plus en plus (l'objectif c'est de monétiser ça coûte un max à créer et à opérer) ne me semble pas aller dans ce sens.
https://linuxfr.org/users/barmic/journaux/y-en-a-marre-de-ce-gros-troll
# FAQ github copilot
Posté par barmic 🦦 . Évalué à 8.
Source: FAQ de Github copilot
Je comprends tout à fait l'objectif de faire champagne contre copilot et/ ou github, mais ne pas être sur github ne va pas être suffisant. Je ne serais pas surpris qu'ils sont allé cherché des dépôts de manière automatisé via des distributions linux.
https://linuxfr.org/users/barmic/journaux/y-en-a-marre-de-ce-gros-troll
[^] # Re: FAQ github copilot
Posté par Zenitram (site web personnel) . Évalué à 1.
En fait, la seule possibilité pour que ce ne soit pas lu par d'autres, y compris les trucs pseudo intelligents, c'est de rendre le code non lisible en public. C'est possible, même en libre (le libre n'oblige pas à mettre le code en public, le code ne doit être livré qu'à ceux qui reçoivent un produit libre, et personne d'autre, puis il suffit que les gens à qui tu as livré soient d'accord avec ta façon de voir).
[^] # Re: FAQ github copilot
Posté par barmic 🦦 . Évalué à 3.
Je dirais même accessible au sens où tu peut aussi leur fournir le code sur demande et pas par défaut.
https://linuxfr.org/users/barmic/journaux/y-en-a-marre-de-ce-gros-troll
[^] # Re: FAQ github copilot
Posté par Psychofox (Mastodon) . Évalué à 6. Dernière modification le 08 mai 2023 à 22:53.
Et tu n'es pas obligé de le fournir par voie electronique en fait, ni même en ligne.
En théorie tu dois pouvoir livrer des tablettes de pierres, de bois gravées ou graver un menhir et le faire livrer au destinataire, la licence est respectée.
[^] # Re: FAQ github copilot
Posté par ted (site web personnel) . Évalué à 6.
Ça doit dépendre des licences. Pour la GPLv2 c'est précisé que le format doit être "lisible par une machine", sur un média "habituellement utilisé pour l'échange de logiciel". Ça exclue malheureusement le menhir.
Un LUG en Lorraine : https://enunclic-cappel.fr
[^] # Re: FAQ github copilot
Posté par Ysabeau 🧶 (site web personnel, Mastodon) . Évalué à 4.
Mais pas le code sous de forme de pdf.
« Tak ne veut pas quʼon pense à lui, il veut quʼon pense », Terry Pratchett, Déraillé.
[^] # Re: FAQ github copilot
Posté par Psychofox (Mastodon) . Évalué à 4.
D'aucuns pourraient dire qu'avec les systèmes d'OCR modernes c'est parfaitement lisible par une machine.
Pour le havituellement utilisé pour échange de logiciel c'est plus compliqué.
Cela-dit tu peux le fournir sur une clé usb intégrée à un bloc de béton de plusieurs tonnes et de la taille du même menhir, ça reste valide si le port usb de celui-ci est accessible.
[^] # Re: FAQ github copilot
Posté par barmic 🦦 . Évalué à 4.
Une autre manière de passer outre est d'utiliser des langages peu connu. Il est peu probable que Microsoft ai quelque chose à faire de code en malbolge pour citer le cas le plus tordu. Même sans aller jusqu'à ce genre d’extrémité (je pense sincèrement qu'il est discutable de considérer que du code malbolge peut être libre, il est à mon avis obfusqué par nature) écrire du code en nim par exemple va mécaniquement faire passer sous les radars.
https://linuxfr.org/users/barmic/journaux/y-en-a-marre-de-ce-gros-troll
[^] # Re: FAQ github copilot
Posté par zurvan . Évalué à 2.
oui c'est ce que me disait également. Ça sera probablement plus simple pour eux d'ausculter du code sur github, mais rien ne les empêche d'aller récupérer les projets sur gitlab, sourcehut etc, rajoutant une charge sur la bande passante de ces concurrents…
une solution serait d'utiliser une sorte de fédération de forge, sur le modèle de fediverse, et de généraliser cela, pour limiter les passages IA (en les ralentissant peut-être ?) tout en permettant de faire des recherches pour le reste du monde. Mais dans un sens comme dans l'autre, les besoins de partages vont se chevaucher avec les besoins de IA donc aucune solution n'est vraiment optimale.
« Le pouvoir des Tripodes dépendait de la résignation des hommes à l'esclavage. » -- John Christopher
[^] # Re: FAQ github copilot
Posté par Zenitram (site web personnel) . Évalué à 0. Dernière modification le 08 mai 2023 à 23:18.
Vous n'avez jamais pensé à juste laisser le code vivre sa vie sans vous soucier de limiter à X ou Y mais pas Z?
Perso, ça a été mon évolution il y a 10 ans et je ne regrette pas de ne plus me prendre la tête avec les trucs "entre les 2, pas clair, et en plus ce manque de clarté ne vient pas de moi vu que j'ai pris une licence qu'on m'a dit de prendre et que pas foule peut ou veut répondre à si légal ou pas ce truc", et avec le recul ça me semble être le plus optimal, plus de temps pour faire du code qui sert que de chercher à limiter le passé à chaque évolution des technologies ou des moeurs, se focaliser sur l'avenir plutôt que le passé.
[^] # Re: FAQ github copilot
Posté par arnaudus . Évalué à 2.
Et même si tu sais qu'une réutilisation est illicite, combien parmi les auteurs de logiciels libres iraient jusqu'à un procès coûteux pour faire respecter la licence? Une entreprise qui défend un marché pourrait faire ça, mais un particulier? Qu'est-ce que ça peut t'apporter de dépenser des dizaines de milliers d'euros en expertise et frais d'avocats pour forcer une boîte que tu ne connais pas à publier leur code? Les licences libres dissuades probablement les réutilisateurs malhonnêtes, mais c'est une barrière psychologique, rien n'empêche que du code libre soit réutilisé pour tout un tas de trucs (sur des serveurs, sur de l'embarqué…) sans que personne n'en sache rien. Tout le blabla juridique des licences ne peut pas empêcher ce genre de choses.
Suivre le flux des commentaires
Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.