J'ai l'impression qu'ils vivent dans un monde merveilleux où leur AI n'est pas toute pétée et ressort du code original et différent à chaque requête. Or, il semble au contraire que leur AI est toute pourrie, qu'elle est overfittée et ressort verbatim du code de sa base, et qu'elle est déterministe, ce qui fait qu'il est tout à fait possible de lui faire sortir deux fois le même code.
Ouais, bienvenue dans le monde de l’AI, c’est comme ça partout.
Mais bon, ça permet de génèrer de la croissance en cramant l’équivalent du Bangladesh en électricité sur des GPU hors de prix.
Puisque mon ego se voit gonfler par cette citation et que le sujet s'y prête, autopromo: DLFPlonk !
De manière générale les personnes qui se voient l'objet de ce traitement le sont en partie du fait de leur propension à augmenter drastiquement le rapport bruit/signal et en partie du fait de mon humeur du moment.
Au final, en ce qui me concerne, ils n'y restent pas plus que quelques semaines, le temps de voir mon humeur changer.
Conclusion: mes cons ne restent cons que tant que je suis mal embouché.
C’est toujours le truc qui ressort quand t’écoutes les parents « ils a été horrible toute la journée, mais à la fin j’ai eu le droit à un câlin ». Super, ça donne envie.
GitHub peut très bien se défendre en disant "on a mis un outil à disposition, charge à vous de vérifier que vous l'utiliser correctement (d'ailleurs, Github a aussi un outil qui permet de vérifier si on a du code public dans son code source).
Ils disent plus que ça, ils disent que le code appartient à celui qui le fait générer.
Do I need to credit GitHub Copilot for helping me write code?
No, the code you create with GitHub Copilot’s help belongs to you. While every friendly robot likes the occasional word of thanks, you are in no way obligated to credit GitHub Copilot. Just like with a compiler, the output of your use of GitHub Copilot belongs to you.
Après ils disent aussi des trucs complètement faux comme :
Does GitHub Copilot recite code from the training set?
GitHub Copilot is a code synthesizer, not a search engine: the vast majority of the code that it suggests is uniquely generated and has never been seen before
Démonté par le fait que des gens aient réussis à sortir des clefs d’API privées :
Si on se place au niveau de la fonction, si on a la même interface il n'y a pas une infinité de façon de coder le contenu, et il est aisé de faire un code fonctionnellement et algorithmiquement identique à celui d'un autre sans même l'avoir lu.
Y a quantité d’exemple qui démonte cette affirmation, au hasard regarde l’implémentation de strcpy (mais ça vaut pour tout le reste) dans musl et dans la glibc, c’est un truc qui est super simple et pourtant les deux n’ont aucune ressemblance.
Même si tous ces bugs ne sont pas critiques pour PVE, il y en a quand même quelques uns que j’ai pas envie de voir arriver, au hasard : « openssh-server: Unable to restart sshd restart after upgrade to version 8.1p1-2 » (#948318) 1.
Personnellement je vais attendre la sortie officielle voir la version 11.1 avant de mettre à jour PVE.
J’ai pas lu les message, seulement le titre, c’est peut être déjà corrigé et il reste peut-être seulement du triage/labelisation à faire, mais ça n’empêche que ça donne pas confiance à première vue. ↩
Posté par Anonyme .
En réponse au lien Audacity se Freenodise .
Évalué à 0.
Dernière modification le 06 juillet 2021 à 14:09.
Ouais pis franchement « se FreeNodise » parce qu'ils ont ajouté une privacy policy ?
On rappelle que FreeNode a été pris de force par un Trumpiste et que c'est devenu une plateforme de « liberté d'expression » (comprendre ou les fascistes peuvent s'exprimer en toute liberté).
Ça n'a non seulement rien a voir, mais aussi pas du tout le même impact.
Franchement, l'ajout CLA c'est autrement plus scandaleux que l'ajout de télémétrie non activé par defaut et la réécriture d'une politique de confidentialité.
The founder of SQLite and all current developers have pledged to follow the spirit of The Rule to the best of their ability.
Si tu ajoutes à ça qu'ils n'acceptent pas les contributions externes, je maintiens que pour être développeur sur SQLite (ou pour espérer le devenir) il faut être chrétien.
Posté par Anonyme .
En réponse au journal Ma cl@sse virtuelle.
Évalué à 5.
Dernière modification le 06 juillet 2021 à 08:37.
Lorsque tu écris un journal ne contenant pas de lien, la page de prévisualisation appose un bandeau rouge t'avertissant et te demandant de confirmer que ton journal ne contient pas de lien: c'est la première fois que je le voyais, et vu l'historique des journaux bookmark qui a donné naissance à une section spécifique, je l'ai trouvé ironique. Mais j'imagine qu'il peut avoir son utilité.
Une nouvelle discussion a été créé sur GitHub où ils tentent d’expliquer leur nouvelle politique de confidentialité : Clarification of Privacy Policy.
De la lecture du commentaire original et des commentaires en dessous, je comprends que :
Audacity a une fonctionnalité (activé par défaut) de vérification de mise à jour, qui envoie l’adresse IP et un User-Agent qui contient la version de l’OS de l’utilisateur.
Audacity a de la télémétrie (désactivé par défaut) qui envoie pas mal d’autre métadonnées (voir les commentaires/discussions/PR précédentes).
Ils ont modifié leur « privacy policy » pour couvrir ces fonctionnalités et se prennent un retour de flamme, mais franchement c’est loin d’être un scandale.
Voici le code de quake recraché par Copilot (via HN), commentaires insultants inclus :)
Code sous licence GPL-2 à laquelle une licence MIT semble être substituée dans la video.
Mais comme l’a dit raphj (et comme le dit eevee sur Twitter), il ne s’agit pas que des licences copyleft :
Les licences comme la (A)GPL, certes, et c'est ma licence de choix, mais aussi des licences permissives qui requièrent quand-même de mentionner les auteurs.
Je n'ai pas l'impression d'avoir dit que tu critiquais le libre, mais que tu voulais le restreindre pour empêcher son exploitation dans un contexte particulier (ici le capitalisme), ce qui, de fait, dénature le terme au sens des 4 libertés qui lui sont communément associées.
Co-pilot ne fait pas un copier coller, il a apprit et produit du nouveau code.
Copilot n'a rien appris: il fait des inférences complexes sur des proximités de morceaux de textes dont il ne comprend pas la signification. En cela il copie du code sans le comprendre en tentant de valider ces inférences par comparaison avec du code réel.
Si je fais un tutoriel sous licence GPL (ou équivalent), est-ce que le code produit par les lecteurs doit être sous licence GPL ?
Sans aucun doute oui :)
Après est-ce qu'ils sont obligés de le distribuer sous licence GPL, non.
Mais le code produit par tes lecteurs est une œuvre issue de l'intégration de la manière de faire présentée dans ton tutoriel dans le cadre d'un objectif global différent et, dans un monde idéal, compris par tes lecteurs. Copilot ne comprend pas ce qu'il propose, il copie/colle/assemble en fonction du contexte en puisant sa capacité à faire cela dans les contenus qui ont servi à l’entraîner. Sans l'accumulation de ces contenus il ne sait rien faire.
Github non plus ne doit rien à ces projets (si on exclus la reconnaissance).
Je suis d'accord que GitHub ne doit rien à ces projets, tant qu'il est vérifié que tous ceux dont le code a été utilisé sont réellement libres, mais Github trompe les utilisateurs de Copilot en affirmant que le code généré leur appartient. A l'heure actuelle, Github n'en a pas la moindre idée: cette question doit être débattue devant une les instances juridiques compétentes avant d'être considérée comme tranchée.
Lorsqu'un projet propriétaire a le moindre soupçon d'une rumeur impliquant qu'un projet libre aurait jeté un coup d'œil à son code propriétaire, il considère que ce projet libre porte atteinte à ses droits de propriété et déclenche les hostilités juridiques.
Je reste convaincu que tant que le monde propriétaire joue ce jeu là, le libre doit jouer avec les mêmes armes et refuser de se laisser écraser dans un cas comme celui-là: ce que propose Copilot est exclusivement conditionné à la consultation de code libre, pas de tutoriels ou d'exemples très simplifiés d'algorithmes résolvant des problèmes génériques, mais de codes ayant une finalité spécifique et proposés sous licence libre. Toutes propositions de sa part doivent donc être considérées comme mises à disposition sous licence libre.
Je souhaite ardemment voir les organisations conséquentes qui défendent le libre au niveau juridique profiter de cette occasion pour planter un drapeau dans le camp propriétaire et marquer leur territoire.
Du coup c'est comme si moi demain j'écris un bout de code mais que je suis obligé de mettre sous licence GPL car lors de mon apprentissage j'ai appris comment fonctionne une boucle for à partir d'un bout de code GPL.
J’ai exprès posté un lien à la fin de mon journal, ça aurait été intéressant d’y jeter un œil, ce message notamment :
"but eevee, humans also learn by reading open source code, so isn't that the same thing"
- no
- humans are capable of abstract understanding and have a breadth of other knowledge to draw from
- statistical models do not
- you have fallen for marketing
Co-pilot ne fait pas un copier coller, il a apprit et produit du nouveau code.
La GPL ne s’intéresse pas au copier/coller mais au travail dérivé. Est-ce que la sortie de Copilot est dérivé de code sous GPL ?
La réponse est bien évidemment à mon sens, oui
Au passage, si Copilot n’avait été entraîné que sur du code GPL, ta réponse serait toujours la même ? Et si il avait été entraîné sur un unique projet ?
Si je fais un tutoriel sous licence GPL (ou équivalent), est-ce que le code produit par les lecteurs doit être sous licence GPL ?
Copilot n’a pas appris les règles de base de la programmations puis écris du code de zéro, il a pris du code déjà écrit et ressort ce code quand on lui demande.
Une « IA » ne fait de toutes façons rien par elle même, elle ne fait que ce qu’elle est programmée pour faire.
# sans OVH ?
Posté par Anonyme . En réponse à la dépêche Création d'Euclidia, l'Alliance industrielle européenne du cloud. Évalué à 9.
OVH ne semble pas faire partie de cette alliance.
Quelqu’un aurait des informations sur le pourquoi de cette absence ?
les membres actuels :
[^] # Re: Clair depuis le début ?
Posté par Anonyme . En réponse au lien Github a utilisé tout le contenu public de github pour entrainer Copilot. Évalué à 4. Dernière modification le 09 juillet 2021 à 18:21.
Non.
Déjà, il y a énormément de problèmes liés aux biais des développeurs et des bases de données utilisées pour l’entraînement.
Et puis il y aussi des trucs rigolo comme écrire iPod sur une pomme pour que l’IA la détecte comme un iPod.
[^] # Re: Clair depuis le début ?
Posté par Anonyme . En réponse au lien Github a utilisé tout le contenu public de github pour entrainer Copilot. Évalué à 3.
Stockfish n’a pas besoin d’IA pour battre n’importe quel GM ou super GM en activité (l’IA dans Stockfish est un truc super récent).
[^] # Re: Clair depuis le début ?
Posté par Anonyme . En réponse au lien Github a utilisé tout le contenu public de github pour entrainer Copilot. Évalué à 6.
Ouais, bienvenue dans le monde de l’AI, c’est comme ça partout.
Mais bon, ça permet de génèrer de la croissance en cramant l’équivalent du Bangladesh en électricité sur des GPU hors de prix.
[^] # Re: Plonk !
Posté par Anonyme . En réponse au journal Les cons sur LinuxFR. Évalué à 7. Dernière modification le 09 juillet 2021 à 10:56.
évidemment ! je ne sais pas comment cet espace s'est retrouvé là… il y a certainement une cabale là-dessous !
merci de l'avoir déjouée
# Plonk !
Posté par Anonyme . En réponse au journal Les cons sur LinuxFR. Évalué à 9.
Puisque mon ego se voit gonfler par cette citation et que le sujet s'y prête, autopromo: DLFPlonk !
De manière générale les personnes qui se voient l'objet de ce traitement le sont en partie du fait de leur propension à augmenter drastiquement le rapport bruit/signal et en partie du fait de mon humeur du moment.
Au final, en ce qui me concerne, ils n'y restent pas plus que quelques semaines, le temps de voir mon humeur changer.
Conclusion: mes cons ne restent cons que tant que je suis mal embouché.
[^] # Re: Pas que ça...
Posté par Anonyme . En réponse au journal Une famille, c'est un papa + une maman 🙈 🙉 🙊. Évalué à 4.
C’est toujours le truc qui ressort quand t’écoutes les parents « ils a été horrible toute la journée, mais à la fin j’ai eu le droit à un câlin ». Super, ça donne envie.
Perso j’ai mes chats, ça ira, merci.
[^] # Re: Clair depuis le début ?
Posté par Anonyme . En réponse au lien Github a utilisé tout le contenu public de github pour entrainer Copilot. Évalué à 7.
Ils disent plus que ça, ils disent que le code appartient à celui qui le fait générer.
Après ils disent aussi des trucs complètement faux comme :
Démonté par le fait que des gens aient réussis à sortir des clefs d’API privées :
Copilot reproduit aussi à l’identique une fonction très particulière de Quake 3 (indiqué dans l’article sus mentionné).
[^] # Re: Une réaction rigolote
Posté par Anonyme . En réponse au lien Github a utilisé tout le contenu public de github pour entrainer Copilot. Évalué à 3.
Y a quantité d’exemple qui démonte cette affirmation, au hasard regarde l’implémentation de strcpy (mais ça vaut pour tout le reste) dans musl et dans la glibc, c’est un truc qui est super simple et pourtant les deux n’ont aucune ressemblance.
# à ce détail près:
Posté par Anonyme . En réponse au lien Github a utilisé tout le contenu public de github pour entrainer Copilot. Évalué à 4. Dernière modification le 08 juillet 2021 à 11:26.
Sans tenir compte des licences sous couvert de fair use
[^] # Re: les snapshot !
Posté par Anonyme . En réponse au message Sauvegarde de subvolume btrfs vers ext4. Évalué à 2.
ça me convient, merci :)
[^] # Re: Pas que ça...
Posté par Anonyme . En réponse au journal Une famille, c'est un papa + une maman 🙈 🙉 🙊. Évalué à 5.
Ah bon ?
[^] # Re: debian 11 ?
Posté par Anonyme . En réponse à la dépêche Sortie de Proxmox Virtual Environment 7.0. Évalué à 3.
Il reste quand même environ 140 bugs critiques (au moment où j’écris).
Même si tous ces bugs ne sont pas critiques pour PVE, il y en a quand même quelques uns que j’ai pas envie de voir arriver, au hasard : « openssh-server: Unable to restart sshd restart after upgrade to version 8.1p1-2 » (#948318) 1.
Personnellement je vais attendre la sortie officielle voir la version 11.1 avant de mettre à jour PVE.
J’ai pas lu les message, seulement le titre, c’est peut être déjà corrigé et il reste peut-être seulement du triage/labelisation à faire, mais ça n’empêche que ça donne pas confiance à première vue. ↩
[^] # Re: désolé déja signalé ici
Posté par Anonyme . En réponse au lien Audacity se Freenodise . Évalué à 0. Dernière modification le 06 juillet 2021 à 14:09.
Ouais pis franchement « se FreeNodise » parce qu'ils ont ajouté une privacy policy ?
On rappelle que FreeNode a été pris de force par un Trumpiste et que c'est devenu une plateforme de « liberté d'expression » (comprendre ou les fascistes peuvent s'exprimer en toute liberté).
Ça n'a non seulement rien a voir, mais aussi pas du tout le même impact.
Franchement, l'ajout CLA c'est autrement plus scandaleux que l'ajout de télémétrie non activé par defaut et la réécriture d'une politique de confidentialité.
[^] # Re: SQLite Code of Ethics
Posté par Anonyme . En réponse au journal Le petite histoire derrière SQLite (une interview de Richard Hipp). Évalué à -1. Dernière modification le 06 juillet 2021 à 14:01.
Faut lire jusqu'au bout :
Si tu ajoutes à ça qu'ils n'acceptent pas les contributions externes, je maintiens que pour être développeur sur SQLite (ou pour espérer le devenir) il faut être chrétien.
[^] # Re: Pas compris
Posté par Anonyme . En réponse au journal Ma cl@sse virtuelle. Évalué à 5. Dernière modification le 06 juillet 2021 à 08:37.
Lorsque tu écris un journal ne contenant pas de lien, la page de prévisualisation appose un bandeau rouge t'avertissant et te demandant de confirmer que ton journal ne contient pas de lien: c'est la première fois que je le voyais, et vu l'historique des journaux bookmark qui a donné naissance à une section spécifique, je l'ai trouvé ironique. Mais j'imagine qu'il peut avoir son utilité.
# Clarification of Privacy Policy
Posté par Anonyme . En réponse au lien Télémétrie (?) Audacity. Évalué à 6.
Une nouvelle discussion a été créé sur GitHub où ils tentent d’expliquer leur nouvelle politique de confidentialité : Clarification of Privacy Policy.
De la lecture du commentaire original et des commentaires en dessous, je comprends que :
Ils ont modifié leur « privacy policy » pour couvrir ces fonctionnalités et se prennent un retour de flamme, mais franchement c’est loin d’être un scandale.
[^] # Re: SQLite Code of Ethics
Posté par Anonyme . En réponse au journal Le petite histoire derrière SQLite (une interview de Richard Hipp). Évalué à -5.
Exactement. C’est ce que j’allais répondre aux commentaires qui me disent que mon affirmation est fausse/du FUD.
# SQLite Code of Ethics
Posté par Anonyme . En réponse au journal Le petite histoire derrière SQLite (une interview de Richard Hipp). Évalué à -10.
(Not so) fun fact : si vous êtes athée, vous ne pouvez pas être développeur SQLite.
[^] # Re: Droit d'auteur fantasmé?
Posté par Anonyme . En réponse au journal GitHub lance copilot, un générateur de code entraîné sur du code GPL. Évalué à 10. Dernière modification le 02 juillet 2021 à 14:55.
Voici le code de quake recraché par Copilot (via HN), commentaires insultants inclus :)
Code sous licence GPL-2 à laquelle une licence MIT semble être substituée dans la video.
[^] # Re: je marche dedans ! Zenitram impersonation time !
Posté par Anonyme . En réponse au journal GitHub lance copilot, un générateur de code entraîné sur du code GPL. Évalué à 5.
Mais comme l’a dit raphj (et comme le dit eevee sur Twitter), il ne s’agit pas que des licences copyleft :
[^] # Re: je marche dedans ! Zenitram impersonation time !
Posté par Anonyme . En réponse au journal GitHub lance copilot, un générateur de code entraîné sur du code GPL. Évalué à 3.
Je n'ai pas l'impression d'avoir dit que tu critiquais le libre, mais que tu voulais le restreindre pour empêcher son exploitation dans un contexte particulier (ici le capitalisme), ce qui, de fait, dénature le terme au sens des 4 libertés qui lui sont communément associées.
[^] # Re: je marche dedans ! Zenitram impersonation time !
Posté par Anonyme . En réponse au journal GitHub lance copilot, un générateur de code entraîné sur du code GPL. Évalué à 10.
Copilot n'a rien appris: il fait des inférences complexes sur des proximités de morceaux de textes dont il ne comprend pas la signification. En cela il copie du code sans le comprendre en tentant de valider ces inférences par comparaison avec du code réel.
Sans aucun doute oui :)
Après est-ce qu'ils sont obligés de le distribuer sous licence GPL, non.
Mais le code produit par tes lecteurs est une œuvre issue de l'intégration de la manière de faire présentée dans ton tutoriel dans le cadre d'un objectif global différent et, dans un monde idéal, compris par tes lecteurs. Copilot ne comprend pas ce qu'il propose, il copie/colle/assemble en fonction du contexte en puisant sa capacité à faire cela dans les contenus qui ont servi à l’entraîner. Sans l'accumulation de ces contenus il ne sait rien faire.
Je suis d'accord que GitHub ne doit rien à ces projets, tant qu'il est vérifié que tous ceux dont le code a été utilisé sont réellement libres, mais Github trompe les utilisateurs de Copilot en affirmant que le code généré leur appartient. A l'heure actuelle, Github n'en a pas la moindre idée: cette question doit être débattue devant une les instances juridiques compétentes avant d'être considérée comme tranchée.
Lorsqu'un projet propriétaire a le moindre soupçon d'une rumeur impliquant qu'un projet libre aurait jeté un coup d'œil à son code propriétaire, il considère que ce projet libre porte atteinte à ses droits de propriété et déclenche les hostilités juridiques.
Je reste convaincu que tant que le monde propriétaire joue ce jeu là, le libre doit jouer avec les mêmes armes et refuser de se laisser écraser dans un cas comme celui-là: ce que propose Copilot est exclusivement conditionné à la consultation de code libre, pas de tutoriels ou d'exemples très simplifiés d'algorithmes résolvant des problèmes génériques, mais de codes ayant une finalité spécifique et proposés sous licence libre. Toutes propositions de sa part doivent donc être considérées comme mises à disposition sous licence libre.
Je souhaite ardemment voir les organisations conséquentes qui défendent le libre au niveau juridique profiter de cette occasion pour planter un drapeau dans le camp propriétaire et marquer leur territoire.
[^] # Re: Pas de réutilisation
Posté par Anonyme . En réponse au journal GitHub lance copilot, un générateur de code entraîné sur du code GPL. Évalué à 8.
J’ai exprès posté un lien à la fin de mon journal, ça aurait été intéressant d’y jeter un œil, ce message notamment :
[^] # Re: je marche dedans ! Zenitram impersonation time !
Posté par Anonyme . En réponse au journal GitHub lance copilot, un générateur de code entraîné sur du code GPL. Évalué à 9.
La GPL ne s’intéresse pas au copier/coller mais au travail dérivé. Est-ce que la sortie de Copilot est dérivé de code sous GPL ?
La réponse est
bien évidemmentà mon sens, ouiAu passage, si Copilot n’avait été entraîné que sur du code GPL, ta réponse serait toujours la même ? Et si il avait été entraîné sur un unique projet ?
Copilot n’a pas appris les règles de base de la programmations puis écris du code de zéro, il a pris du code déjà écrit et ressort ce code quand on lui demande.
Une « IA » ne fait de toutes façons rien par elle même, elle ne fait que ce qu’elle est programmée pour faire.