en réalité, personne ne mange de "tout". On mange ce que nos cultures, éducations… ont étiqueté comme étant mangeable
Il n'y a pas des fois où tu te dis, en prenant une direction, que tu devrais éviter parce que tu vas rapidement sortir les rames et pagayer longtemps, longtemps à contre-courant?
Il y a peut-être besoin d'expliciter les sous-entendus, mais quand les gens disent qu'ils mangent "de tout", ils ne veulent pas dire en fait qu'ils mangent "de tout". Ils ne mangent ni les cailloux, ni les crottes de chiens, ni les amanites phalloïdes. Quand on dit qu'on mange "de tout", on s'arrête aux aliments comestibles, nutritifs, et communs. Ça veut dire par exemple qu'on ne mange pas forcément:
1) des trucs que culturellement on n'identifie pas comme comestible (parce que ça ne pousse pas en Europe, parce que quelque chose qui ressemble n'est pas comestible, etc)
2) les trucs qui ne sont pas bons (trop amers, trop salés, trop piquants, trop fades)
3) les trucs qui rendent malades ou qui provoquent le décès rapidement
4) les trucs qui provoquent le dégôut (les vers de terre, les couilles d'agneaux)
5) les trucs qui n'ont pas d'intérêt nutritif, ou qui nécessitent des efforts de récolte et de préparation disproportionnés (ça inclut les machins qu'on ne trouve pas en supermarché et qu'il faut aller chercher soi-même dans les bois)
Donc si tu veux dire que certains végétaliens mangent des pétales de fleur rares, du tofu préparé selon une cette Tibétaine, ou des bourgeons de sapins des Alpes, oui, c'est certainement vrai, mais je ne pense pas que c'est de ça qu'on parle quand on diversifie son alimentation. Du point de vue nutritif, tu peux manger 40 variétés de légumes secs, ça reste des légumes secs, ils ont grosso-modo le même rôle dans ton alimentation. Et les condiments n'ont pas de valeur nutritive, c'est pour la diversité des goûts.
Heu là c'est plus du flexitarisme, c'est du carnisme qui essaie juste de se donner bonne conscience
Parce qu'il mange un yaourt, du jambon et du poisson une fois par semaine? Bah dis donc, c'est du flexitarisme qui a oublié de faire des étirements…
Il n'y a aucun risque de manquer de protéine, au contraire, on en consomme beaucoup trop !
Pas si tu es végétalien. C'est un peu bizarre ton raisonnement; si tu as une alimentation variée ton apport de protéines est en effet suffisant, mais dès que tu retires la viande, les œufs, et le poisson, tout de suite c'est plus compliqué, et il faut faire attention (ajouter des légumes avec beaucoup de protéines, etc). Donc la phrase exacte, ça devrait être "si tu manges de la viande, il n'y a aucun disque de manquer de protéines parce que tu en consommes trop, mais si tu ne manges pas de viande il faudra faire un peu attention parce que tu vas te rapprocher de la limite basse."
Et si tu fais du sport ou une activité quotidienne physique qui demande un peu de force, la récupération et la prise de masse musculaire demande bien plus de protéines que ça (ça passe souvent par des compléments alimentaires pour ceux qui ne veulent pas manger du poulet à chaque repas).
On peut se faire plaisir en étant végétalien, je te le garantis!
Mais je suis sûr qu'avec une poupée gonflable aussi :-) Quand on dit que la viande c'est bon, on ne dit pas que les légumes c'est pas bon, c'est juste que spontanément, la plupart des gens préfèrent la viande (en général, ça n'est pas très dur de faire manger de la viande aux enfants, alors que les légumes verts, c'est moins spontané). C'est pareil chez tous les animaux omnivores (les cochons, les ours, les poules…), tu leurs balances des restes de repas et ils commencent toujours par la viande. Du coup, il y a forcément quelque chose d'artificiel dans le discours "moi je n'aime plus la viande". Évidemment, la puissance de l'esprit humain est telle qu'il est tout à fait possible de se conditionner pour arriver à avoir un comportement socialement acceptable sans trop de frustrations (payer ses impôts, se tenir à la monogamie, respecter les limitations de vitesse, utiliser des logiciels libres même quand ils sont un peu buggués, etc), mais évidemment, cet auto-conditionnement ne fonctionne pas forcément sur les autres!
j'ai l'impression que le GPS n'est utile que quand on s'en sert comme une carte lors des sorties, et pas vraiment pour la trace en elle-même. Pour la trace, une montre connectée fonctionne très bien; elle sert à commander le GPS du smartphone planqué quelque part au chaud (sac à dos, sacoche sur le vélo…). Par contre, la question se pose si on veut extraire la trace pour la mettre sur un ordinateur et l'analyser avec autre chose que l'application dédiée du téléphone; j'ai l'impression que ça va être spécifique de l'application, et donc de la marque de la montre.
Et donc œuvre de l'esprit ou pas dépendrait autant de l'objet lui même que du statut qu'il acquiert après sa publication ?
Normalement non, je ne crois pas. Ce qui compte, c'est la démarche : création intellectuelle ou artistique. En droit, il me semble aussi qu'on retient le critère de la personnalité de l'auteur pour déterminer l'originalité (en gros, est-ce que quelqu'un d'autre dans ce domaine aurait fait la même chose ou pas, est-ce qu'on peut reconnaitre l'auteur à l'aveugle par exemple). Une photo toute floue parce que tu as fais une fausse manip n'est pas une œuvre de l'esprit, la même photo faite exprès l'est. Définition assez bizarre et peu opérationnelle, je trouve…
Dans les faits, le code de la propriété intellectuelle donne depuis 1994 une liste non exhaustive (https://www.legifrance.gouv.fr/codes/article_lc/LEGIARTI000006278875): les livres, les films, les dessins, les photos, le code informatique, les créations de mode… Du coup, quand tu es là-dedans, tu n'as pas à t'embêter avec ces histoires d’œuvres de l'esprit. C'est bien pratique pour les logiciels, parce que c'est un domaine où ça n'est carrément pas évident que le code porte en lui la personnalité de son auteur…
De toutes manières, le droit n'est pas une science exacte. On avait déja discuté ici de plusieurs cas où la justice avait reconnu des droits pour les photographies de tableaux dans le domaine public, en prétextant du fait que le photographe devait faire des réglages et choisir l'éclairage, ce qui semble profondément contraire à l'esprit de la loi (quand ton but est de fournir une copie conforme, tous les réglages n'ont pour unique but de ne pas modifier l'oeuvre originale; quelle que soit la difficulté de la tâche il n'y a aucune démarche artistique). L'argument des musée est l'équilibre financier (dur dur d'être un musée, les reproductions papier sont une source de revenus, si on nous retire ça on va fermer et les conséquences pour la société sont terribles, etc), et la justice interprète la loi comme il faut pour éviter les conséquences néfastes d'une éventuelle application à la lettre. C'est quelque chose que je n'ai jamais compris, mais je n'y connais rien en droit, et c'est pour ça qu'il est toujours difficile d'être trop affirmatif : ça n'est pas parce que quelque chose découle logiquement d'une lecture naïve d'un texte de loi qu'on peut prédire une décision de justice.
Bah tu peux lire l'arrêt du conseil d'État si tu veux… L'idée, si j'ai bien compris, c'est que si tu rentres dans un magasin et que c'est trop cher ou que les conditions générales de vente ne te plaisent pas, tu vas ressortir sans rien acheter, et ça, ça n'est pas un préjudice. Donc l'interprétation que le conseil d'État fait de la RGPD, c'est qu'il n'y a préjudice que quand tu est obligé de te soumettre aux cookies. Si le site te propose une alternative (payer un abonnement, aller voir chez un concurrent, etc), alors il n'y a pas de préjudice.
Ce n'est pas ce que la CNIL avait compris, d'où la situation instable.
Moi je vois bien les dangers quand même de trop élargir la notion de préjudice. Tu te pointes à la boulangerie à 20h05 alors qu'ils ferment, tu ne peux pas dire que de ne pas avoir de pain pour manger ton saucisson est un préjudice. Mais au final, ça rend la RGPD assez caduque, puisque ça permet un web inutilisable. Si au moins les aggrégateurs de news et moteurs de recherche étaient paramétrables pour n'afficher que des résultats accessibles sans paywalls ou cookiewalls…
Oui, tu as raison. En fait, la chronologie est bizarre. La CNIL avait fait une lecture restrictive de la RGPD, c'est à dire qu'elle avait clairement interdit les cookie walls, pour la raison (qui me semble assez évidente) que de devoir donner de l'argent est un préjudice matériel. Les éditeurs ont porté l'affaire au conseil d'État, qui n'a pas encore tranché sur le fond, mais qui a considéré qu'il existait possiblement une lecture alternative et qu'on pouvait oublier l'histoire du préjudice tant qu'une alternative était possible (payer, aller sur un autre site, etc). Il faudra attendre le jugement sur le fond pour en savoir plus; en attendant la CNIL a saisi les instances européennes pour avoir une clarification.
De toutes manières, pour moi, ça reste de l'escroquerie : quand tu payes, tu n'arrives pas sur un site paradisiaque qui te renvoie du HTML propre en 0.1s. Tu restes sur leur site merdissimal bourré de JS qui interprète tous tes faits et gestes avec les traceurs dans tous les coins, des pop-ups, des pubs "raisonnables", etc. Bref, tu payes, mais tu n'as pas mieux, tu as juste ce que tu avais quand tu cliquais sur "ne pas accepter" quand l'option était disponible.
Ces gens ne savent juste plus faire un site web qui fournit un service à leurs clients. Ils sont tellement shootés à la maximisation de leurs profits qu'ils ne savent même pas respecter leurs clients, si tu es assez bête pour payer, alors tu es assez bête pour qu'on exploite quand même jusqu'au moindre centime sur la moindre donnée que tu peux leur laisser. C'est là à quel point il est important de militer pour avoir les lois les plus protectrices possibles, les services qui s'occupent des sites commerciaux ont perdu toute forme de rationalité et s'il existait un moyen légal de récupérer ton numéro de carte bancaire, ils le feraient.
En tout cas il y a un cookie wall, qui viole allègrement l'article 4 de la RGPD ("le consentement ne devrait pas être considéré comme ayant été donné librement si la personne concernée ne dispose pas d'une véritable liberté de choix ou n'est pas en mesure de refuser ou de retirer son consentement sans subir de préjudice").
Le fait que la déontologie n'est pas censée être partisane?
Ce qui est assez frappant, c'est qu'il semble impossible pour une chaine d'extrême droite de respecter les principes de base de la déontologie journalistique. Si on demande à ces chaines de faire un travail de journalisme dans les règles de l'art, elles crient à la censure. C'est quand même étrange, non?
Non, je pense que tu te trompes. L'État a son mot à dire parce que les fréquences sont un bien public (le nombre de chaines est contraint par une limite physique, et l'État doit arbitrer pour attribuer les canaux de diffusion), mais les chaines payent un loyer pour diffuser (compenser les coûts de diffusion).
Tu as parfaitement raison. Ça marche avec les deux bouts de phrases indépendamment, mais personne ne les avait jamais mis ensemble! :-)
Ceci dit, l'originalité de la citation ne permet pas forcément de prouver la contrefaçon, puisqu'il reste possible d'assembler ces deux bouts de phrase par hasard. Et par dessus tout, il est peu probable qu'une phrase aussi triviale puisse être qualifiée d’œuvre de l'esprit. Ça n'est pas une question de longueur, puisque "Les sanglots longs des violons de l'automne" est clairement une œuvre de l'esprit, alors que "J'ai vachement mal au bide ce matin", probablement pas :-)
Si je te comprends bien, tu es un libriste qui critique les licences copyleft.
Bah c'est assez fréquent en fait, donc tu ne devrais pas être surpris. Sur un répertoire OpenSource par exemple https://www.mend.io/blog/open-source-licenses-trends-and-predictions, les licences les plus populaires sont Apache (30%), suivi par MIT (26%), puis GPL v2 et v3 (à peu près 10% chacune). Donc le "copyleft" n'est souvent pas majoritaire parmi les licences libres; ça dépend évidemment du type de répertoire et de la manière dont on compte.
Mais de toutes manières, l'argument n'est pas que le jugement viole les licences copyleft. Le jugement me semble tout à fait compatible avec l'esprit et la lettre des licences libres copyleft! C'est juste que des gens n'ont pas compris le droit d'auteur et/ou les licences libres et/ou le fonctionnement des LLM. Moi j'utilise les licences copyleft et je ne me suis jamais attendu à ce que la sortie d'un LLM puisse être sous une quelconque licence, pour toutes les raisons que j'ai évoquées au dessus. Donc tu n'arrêtes pas de dire qu'on te prête des idées que tu n'as pas, mais tu n'arrêtes pas de répéter que les libristes devraient s'opposer à ce jugement. Or, ce jugement me semble parfaitement logique, sur la forme et sur le fond, et parfaitement en accord avec le droit d'auteur et les licences logicielles libres et copyleft. Es-tu certain d'avoir bien compris comment fonctionne le droit d'auteur, les logiciels libres, et les LLM? Si oui, alors ça serait pas mal de présenter clairement ton raisonnement, plutôt que de partir dans tous les sens avec des analogies sur les armes à feu que personne ne comprend.
Si tu veux dire que tu croyais avoir compris que les licences libres te protégeaient de l'analyse du code par des grandes entreprises, et qu'elles interdiraient la diffusion du produit de cette analyse, alors 1) je te crois, mais 2) le problème vient de toi, parce que rien dans le texte de la licence ne permettait de te faire croire ça. Tu t'étais donc fourvoyé et tu peux être légitimement dégoûté, mais ça ne sert à rien de t'en prendre à tout le monde, aux libristes qui ne sont pas d'accord avec toi, aux juges, aux grandes entreprises, ou aux LLM.
Au passage, je comprend donc que tu adorerais interdire les couteaux de cuisine (on condamne une mauvaise utilisation de la chose mais pas une autre utilisation). Non merci.
Je viens de réaliser que l'analogie de l'interdiction des armes à feu venait en réponse à mon argument "seules les œuvres de l'esprit sont soumises au droit d'auteur, or les sorties des LLM ne sont pas des œuvres de l'esprit parce que la jurisprudence n'accorde ce titre qu'aux œuvres créees par les humains". Avec toute la meilleure volonté du monde, je ne vois vraiment pas le rapport.
À part de conclure que l'état de droit est frustrant parce que la loi n'interdit pas ce qu'on voudrait bien interdire une fois que c'est arrivé mais qu'on ne peut pas le savoir avant que quelqu'un le fasse, je ne sais pas où tout ça nous amène.
La première étape serait peut-être de proposer une GPL v4 qui interdit d'utiliser le code pour entrainer un algorithme. Ceci dit, cette clause n'est certainement pas compatible avec les libertés fondamentales 2 et 3 des logiciels libres (copier et étudier), ce qui risque de rendre les logiciels sous une telle licence non-acceptable pour plusieurs projets.
Les lois ont été écrites pour les humains, selon ce qu'ils sont capables de faire, alors que les LLM ont la capacité d'ingérer des quantités de données sans commune mesure
Je ne vois pas le rapport. La loi définit la contrefaçon et les peines encourures pour contrefaçon. Or, la sortie des LLM ne correspond pas à la définition de la contrefaçon (ce n'est pas une copie ou un travail dérivé). Tout ce qui n'est pas interdit par la loi est légal, et les LLM sont donc légaux.
Bien sûr, il est possible de changer les lois, et ça sera peut-être fait. Mais ça ne change rien au fait que le fonctionnement des LLM qui mangent des bases de code libre en entrée et qui recrachent du code sans auteur et sans copyright semble légal.
S'il existe déjà un bout code de taille significative qui fait grosso modo ce que le développeur souhaite, je m'attend à ce qu'il soit repompé d'une manière qui ne serait pas autorisé normalement sans LLM.
Tu t'attends mal. Tu ne sais pas comment fonctionnent les LLMs, ce qui n'est pas très grave en soi, mais tu te trompes sur la manière dont ces algorithmes fonctionnent. Ils ne recopient pas des morceaux de code, ils intègrent la logique des données sur lesquelles ils s'entrainent dans un réseau de neurones. Du coup, les bouts de code que tu lui as donnés ne sont pas stockés par le LLM, il n'en extrait qu'une sorte de logique générale. Il fait ensuite passer les requêtes à travers son modèle, et te revoit la sortie.
Ce que tu mentionnes existe (le modèle recrache les données d'entrainement verbatim, comme un moteur de recherche), mais c'est un comportement pathologique (non-souhaité et non-souhaitable): le modèle a été sur-paramétré, le réseau n'a pas été entrainé avec assez de données, et il "colle" trop aux données d'entrainement. Tu peux aussi "provoquer" ce comportement avec des requêtes trop spécifiques (par exemple, au lieu de "tri à bulle", tu demandes "tri à bulle en 5 lignes avec des variables qui s'appellent Titeuf et Koko, et avec une erreur de logique à la ligne 3"). Mais ça reste un comportement buggué, auquel justement tu ne devrais pas t'attendre.
Ouais, ça c'est l'argument pour déréguler la possession une arme à feu en prétendant qu'un outil est innocent et qu'il faut se contenter de condamner une mauvaise utilisation.
On ne parle pas de déréguler les armes à feu, on parle de savoir si la sortie des LLMs peut être considérée comme de la contrefaçon. La loi n'est pas magique, elle interdit certaines choses, et ce qui n'est pas interdit est autorisé. Les licences copyleft sont explicitement publiées pour autoriser l'étude du code, ce que font les LLMs. Elles n'autorisent la publication de versions modifiées que si la même licence est appliquée. Or, les LLMs ne modifient pas le code, elles l'étudient et intègrent leur logique dans un réseau de neurones, qui peut être par la suite utilisé pour générer du code qui diffère du jeu de données d'entrainement (si c'était le même, ça ne serait qu'un moteur de recherche).
Mais LLM ne sont rien d'autre qu'un outil de copiage sophistiqué dont on ignore la source.
Si tu crois qu'un LLM est un moteur de recherche sophistiqué, tu ne peux pas comprendre pourquoi la licence n'est pas conservée en sortie. Mais je ne peux pas l'écrire différemment : un LLM n'est pas un moteur de recherche. C'est un algorithme qui génère quelque chose à partir de patterns qu'il a appris d'un jeu de données. Il ne ressort pas les données, il crée des données nouvelles qui correspondent à une structure qu'il a induite de ses données d'entrainement.
Même si l'utilisateur souhaite respecter les licences, il ne peut pas le faire.
Ça tombe bien : il n'y a aucune licence à respecter, puisque la sortie du modèle n'est pas un travail dérivé ou une contrefaçon. J'ai l'impression que ce qui n'est peut-être pas clair, c'est que tu peux mettre du 100% GPL en entrée, et que la sortie n'a pas de licence. Pourtant, c'est comme ça que fonctionne la propriété intellectuelle. Quand tu apprends à lire, tu mets du 100% copyright en entrée, et ce que tu écris t'appartient à 100% (sauf si tu as copié). Quand tu es musicien, tu mets du 100% de copyright en entrée, et ce qui sort t'appartient à 100% (sauf si tu as copié). Le fait de combiner de multiples sources d'influence ne crée pas quelque chose qui appartient à quelques % à ces sources, ça crée quelque chose qui ne leur appartient plus. C'est comme ça que ça marche avec les humains, et c'est comme ça que ça marche avec les LLM, qui fonctionnent selon le même principe.
Tu peux penser que ça devrait fonctionner autrement, et on pourrait avoir une discussion sur ce sujet. Mais actuellement, à mon avis, la seule interprétation possible de la propriété intellectuelle est que la sortie des LLM n'est ni de la contrefaçon, ni une œuvre originale (puisque pas créé par un humain), et que sa publication ne peut pas être illégale (puisque pas interdite par la loi).
Je ne supporte pas le fait que du code publié en GPL finisse aussi facilement dans des projets non-GPL. Et je suis d'autant plus mécontent que je maudis les LLM.
J'ai bien compris ton opinion, mais je pense (c'est mon avis) que c'est ton incompréhension de ce qu'est la propriété intellectuelle, de ce qu'est la GPL, et de la manière dont les LLM fonctionnent qui te porte à croire ça.
Pour ma part, j'ai du code GPL dans Github et il est donc probable qu'il a été utilisé pour entrainer de nombreux modèles de langage, et ça ne me dérange pas, parce que 1) la possibilité d'étudier et d'apprendre à partir du code est explicitement autorisé et encouragé par la GPL, 2) que la très grande majorité du code que j'ai écrit est trivial et qu'il ne pourrait pas raisonnablement être considéré comme une œuvre de l'esprit devant un tribunal (et donc que la licence que j'ai attribuée au code n'a probablement pas de substance légale), 3) que je n'ai aucun moyen de savoir si une sortie des modèles de langage a été influencée par un bout de réseau pour lequel mon code a affecté les paramètres (en gros, un bout de code qui ressemble au mien a peut-être 9 chances sur 10 de n'avoir aucun lien causal avec mon code, que mon code n'a peut-être pas été inclus dans la base pour une raison ou pour une autre), ce qui prouve bien que ça n'est pas de la contrefaçon (si même moi je ne peux pas savoir, alors comment quelqu'un d'autre le pourrait?).
je maudis les LLM.
Je serais intéressé de savoir si c'est parce que tu penses que leurs résultats sont médiocres ou inutiles, ou inversement parce que tu te sens humilié en tant qu'être humain par l'existence d'algorithmes capables de faire mieux que toi ce que tu pensais maitriser. Étrangement, j'ai l'impression que beaucoup de gens sont sur les deux options en même temps, ce qui me semble assez instable comme point de vue.
L'idée de détester les trucs nouveaux qu'on a du mal à comprendre et qui peuvent modifier l'équilibre de notre vie n'est pas nouvelle, elle est probablement aussi vieille que l'humanité. Mais j'imagine que tu es déja au courant que cette idée n'a jamais gagné; que les nouvelles générations vont s'approprier cet outil et réussir à faire des choses avec, et que tu finiras tes jours malheureux en ronchonnant que c'était mieux avant?
On voit d'ailleurs que la révolution IA n'a pas encore eu lieu. Les LLM servent beaucoup à générer du bullshit publicitaire, des articles de faux journaux, ils servent aux étudiants à tricher, et à tout un tas de gens incompétents de faire croire qu'ils savent faire des choses dont ils sont incapables (écrire du code, écrire une lettre sans faire de faute, ou dans une langue qu'ils ne connaissent pas, etc). Nul doute qu'il existe une utilité marginale à de tels outils (pour remplacer la doc des logiciels, typiquement), mais à ma connaissance, la productivité du secteur tertiaire n'a pas pris 75% en un an. Aucune raison de paniquer, aucune raison de détester un nouvel outil, aucune raison de croire que le monde va changer.
TL/DR: c'est juste l'application des lois existantes à une situation que les législateurs n'avaient pas prévu.
Il va falloir un certain nombre de décisions de justice similaires pour "stabiliser" la situation.
Dans tous les cas, j'ai toujours pensé que c'était la seule issue possible sans modification des lois existantes, pour plusieurs raisons:
1) À ma connaissance, dans la plupart (toutes) les législations qui implémentent la convention de Berne (le socle commun à la propriété intellectuelle dans le monde), la notion de travail dérivé n'est définie que par la similarité d'une oeuvre par rapport à l'original, et pas par le processus qui a permis de créer cette oeuvre (du coup, c'est peut-être le terme de "dérivé" en français qui est trompeur). Un modèle de langage bien paramétré ne ressort pas de morceaux identifiables, et ses sorties ne peuvent donc pas être des oeuvres dérivées. C'est d'ailleurs l'argument qui justifie le jugement dont il est question: les plaignants n'ont pas fourni la preuve que les sorties du modèles étaient dérivées de leur travail.
La propriété intellectuelle ne peut pas être diluée. Elle n'est pas quantitative, soit une oeuvre est protégée, soit elle ne l'est pas. Ça veut dire qu'il est tout à fait possible par exemple d'écrire un texte qui ne contient que des phrases tirées de livres déja publiés, sans que ça soit une contrefaçon. Et c'est probablement déja arrivé, puisqu'une phrase triviale ("Il prit son chapeau et ferma la porte derrière lui") a toutes les chances d'avoir déja été écrite. Du coup, un code composé de lignes qui sont toutes tirées de sources sous GPL n'est pas nécessairement sous GPL. C'est une profonde incompréhension de la nature de la propriété intellectuelle que d'imaginer que c'est nécessairement le cas.
2) Il ne faut pas oublier que seules les oeuvres de l'esprit originales sont protégées par le droit d'auteur. Parfois on oublie ça, parce qu'on applique une licence à un ensemble de fichiers, mais il est très peu probable que vos .h qui contient des constructeurs, des destructeurs, et des méthodes triviales, soient en fait protégés par le droit d'auteur. Seuls les algorithmes un peu élaborés, les designs spécifiques à un problème donné, les optimisations un peu chiadées, etc. sont susceptibles d'ouvrir des droits d'auteur. Même si vous pouviez prouver qu'un LLM ressort une de vos fonctions telles quelles, il faudrait en plus démontrer que cette fonction est originale (par exemple, qu'elle est unique dans la base de données). Si la base de données de code contient 57 implémentations du tri à bulle et que l'IA a sorti celles avec vos noms de variables, ça ne veut pas dire qu'il y a eu contrefaçon.
3) L'aspiration de bases de données de code libre, qui est souvent reprochée à ces modèles, est tout à fait compatible avec la très grande majorité des licences libres. "Je ne voulait pas que mon code sous GPL serve à entrainer les modèles de langage" n'est pas un argument. Une modification des licences libres est peut-être envisageable, mais en tout cas l'argument n'est pas opposable.
Bref, je pense que la jurisprudence qui va s'établir va être assez claire : 1) l'inclusion de code dans une base de données destinée à l'entrainement de LLM ne constitue pas une violation de la propriété intellectuelle des auteurs du code (la question reste ouverte pour la base de données aspirée, mais on passe aux droits voisins, et en tout cas ça ne concerne pas les auteurs du code). 2) Sauf similarité dûment démontrée dans les sorties d'un modèle mal paramétré (comme l'étaient les premières versions de Copilot, si je me souviens bien), le code produit par une IA n'est pas soumis au code de la propriété intellectuelle (parce que ça n'est pas une oeuvre de l'esprit).
Ça me semble assez évident quand on lit le code de la propriété intellectuelle par exemple, mais je ne suis pas juriste et bien sûr les juges considèrent aussi autre chose que la loi. Mais en tout cas, j'ai l'impression que la plupart des arguments de ceux qui pensent que "ça devrait être interdit" n'ont pas de base légale, et qu'ils s'exposent à de grosses désillusions s'ils pensent que quelque chose comme "Je ne voulais pas que mon code soit réutilisé par des grosses boîtes pour faire du pognon" est un argument recevable.
Il y a d'ailleurs un point "philosophique" qui me semble intéressant : prétendre que la sortie d'un LLM peut violer sa propriété intellectuelle me semble quasiment auto-contradictoire. Par définition, la propriété intellectuelle ne s'applique qu'aux oeuvres de l'esprit (que la jurisprudence considère comme uniquement humain, pas de copyright sur les dessins de chimpanzés etc). Or, les sorties d'une IA ne peuvent pas être protégées par le droit d'auteur, parce que justement elles ne sont pas des oeuvres de l'esprit (sortir une sorte de code consensus ne peut produire qu'un code trivial qui ne reflète pas la personnalité de son auteur). Comment peut-on donc prétendre qu'un code suffisamment original pour être protégé par le droit d'auteur peut ressortir d'une IA d'une manière suffisamment similaire pour être une contrefaçon? (encore une fois, sauf si l'IA n'a pas été surparamétrée, ce qui est un problème technique qui peut en effet s'apparenter à de la contrefaçon)? À mon avis, il faut un raisonnement particulièrement précis pour s'en sortir. Par exemple, les "artistes numériques" prétendent que c'est le texte d'invocation de l'IA qui est l'oeuvre de leur esprit, et qui justifieraient la protection de la sortie de l'IA. Mais ça, ça permet d'attribuer une propriété à l'utilisateur de l'IA, ce qui est assez différent de la question du droit sur le bout de code qui sort d'une requête triviale.
L'empathie […] est la reconnaissance et la compréhension des sentiments et des émotions d'un autre individu.
Le Robert:
Capacité de s'identifier à autrui dans ce qu'il ressent.
Wiktionnaire:
Capacité de comprendre, de ressentir les sentiments ou de se mettre à la place d’une autre personne.
Larousse:
Faculté intuitive de se mettre à la place d'autrui, de percevoir ce qu'il ressent.
Du coup, oui, par définition, l'empathie ne peux s'appliquer qu'à des individualités. Je ne comprends pas ce que tu entends pas "humanité dans son ensemble". Tu veux peut-être dire quelque chose comme "compassion"? La compassion peut être ressentie envers un groupe de personnes, par exemple.
Si on n'utilise pas les mêmes définition, c'est sûr qu'on ne risque pas de se comprendre!
oserais-je faire remarquer l'utilisation générique de "il" dans toutes ces définitions? :-)
On pourrait imaginer que n'importe quelle consultation chez un généraliste entraîne un prélèvement et des tests systématiques
Pas forcément, parce qu'il faudrait que le coût soit justifié médicalement, ce qui est probablement le cas pour le diabète, mais pas par l'identification des variants de rhinovirus. Je pensais juste à un protocole d'échantillonnage scientifique, et pas à une remontée de cas spontanée. Par exemple, tirer au sort un généraliste sur 1000 et lui faire faire ces tests suffirait probablement largement. Mieux, tirer des gens au hasard (et pas des malades qui consultent).
Un exemple que je trouve assez symptomatique, c'est les "symptomes grippaux". Pas besoin d'identifier le virus, puisque le traitement est le même. Sauf que, mine de rien, savoir qu'on a la grippe, le covid, ou le VRS, ça permet de déterminer qui on peut cotoyer ou non (vieux ou bébés), ça détermine aussi le bénéfice de la vaccination à l'hiver qui suit. Et en plus ça permet d'anticiper le diagnostic sur les 12 vieux qui vont le chopper en salle d'attente.
Le VRS par exemple, c'est exactement le truc qu'on a complètement raté parce qu'on n'étudie pas les virus respitatoires. On s'est créés une génération de gamins asthmatiques parce que "le rhume c'est pas grave" : pas d'identification du virus, pas de tests, pas d'exclusion des crèches et des écoles, pas d'isolement. Forcément, on considère que 1) pour comprendre les maladies, il faut étudier les malades, 2) les maladies on les connait, elles sont dans les livres de médecine, 3) les traitements contre les virus sont identiques (il n'y en a quasiment pas, en fait), donc la connaissance des souches virales n'a aucune indication médicale. En gros, on ne fait que de l'épidémiologie appliquée à la médecine, ce qui ne permet pas de détecter les nouvelles maladies, de comprendre comment elles se propagent, ou comment on pourrait limiter leur propagation. En 2020, on en était exactement au même point qu'en 1920 pour la grippe espagnole : on met un chiffon devant le nez et on pshit des huiles essentielles; si on est à 3m de distance c'est bon. Vous avez vu par exemple des purificateurs d'air achetés par l'éducation nationale, depuis? Bah non, pas besoin, ils se lavent les mains, c'est bien connu, les virus respiratoires s'attrappent par les mains. Bon, OK, c'est pas "connu", c'est juste ce qu'on dit depuis 100 ans sans jamais l'avoir vérifié, mais c'est comme ça qu'on fait de la science en médecine.
Bah là je ne te comprends pas. Le respect des droits humains est totalement dissociable de l'empathie, autrement, ça serait terrible : tu ne défendrait le respect des droits de l'Homme qu'envers ceux pour lesquels tu ressens de l'empathie? Je suis pour que les pédonazis criminels de guerre aient droit à un procès équitable, mais s'ils ne veulent pas être appelés pédonazis parce que ça les offense, bah je m'en ballec, je les appelle comme je veux.
Au final, qui décide à quelles demandes tu accèdes et quelles demandes tu refuses? Tu utilises ton libre arbitre. Est-ce que "il" ou "elle" c'est raisonnable, et pas "iel"? Ou "il" le jour et "elle" la nuit? Ou "Mademoiselle", "Rajah", "Herr Doktor", "Monsieur le Président", "Skippy le Grand Gourou" ou "Maître de l'Univers"? Tu tranches bien à un endroit, et d'autres personnes trancheront à un autre endroit, ça n'est pas par manque d'empathie ou par manque de respect. À la limite, c'est bien plus irrespecteux d'utliliser le pronom souhaiter tout en pensant que c'est ridicule. Et en tout cas, tu peux toujours défendre que les gens ont des droits fondamentaux qui méritent d'être respectés indépendamment de la manière dont ils veulent se faire appeler.
N'est-ce pas une des bases du fascisme? Qui peut être autant d'extrême gauche comme d'extrême droite comme le passé nous l'a montré?
Honnêtement, je ne vois pas à quelle expérience générale de "fascisme d'extrême gauche" tu fais référence. On sait que les expériences communistes ont systématiquement tourné vers le totalitarisme, mais on n'y trouve normalement pas les marqueurs du fascisme (traditionalisme, xénophobie, etc), même si on se rapproche sur d'autres points (paranoïa politique, anti-pacifisme…). C'est pour ça que j'ai écrit que ça pourrait se rapprocher, mais ne me faites pas dire ce que je n'ai pas dit, le "wokisme" n'est pas une forme de fascisme.
Ça me fait penser à une série d'affichettes "anti-sexistes" exposées à mon boulot. En plus de situations de "sexisme ordinaire" au boulot, illustrant des comportements fréquents qui génèrent une pression "masculiniste" dans le cadre professionnel, quelques situations illustrent également la vie privée (par exemple un type qui demande à sa femme de s'habiller différemment). Et c'est là que je trouve que ça déconne sec quand même : quoi qu'on puisse penser des types qui règlementent la tenue vestimentaire de leur nana, la pensée progressiste ne peut pas prétendre règlementer les conversations privées, ou ce que les gens font au plumard, et avec qui ils le font. C'est très bien de viser la parité dans un comité d'administration, mais c'est légitime de ne pas avoir de parité dans un groupe d'amis qui partent au camping. Je pense que ça illustre pas mal comment on peut partir plein de bonnes intentions et continuer sur sa lancée sans s'apercevoir qu'on va beaucoup trop loin, et que le projet de société qu'on propose n'est qu'une énième avatar de totalitarisme: on peut concevoir un totalitarisme progerssiste (je pense que c'est ça, le "wokisme", en fait), même s'il est peu probable qu'un tel mouvement puisse obtenir un réel pouvoir politique.
Dans le he-gate dont on parle, on n'est pas loin de ça : refuser un patch qui change 5 occurences de "he" en "they" dans une doc confidentielle d'un logiciel pas très connu est décrit comme un acte exécrable, qui conduit à des accusations de mysogynie et de transphobie. On sent bien qu'il y a derrière ça une volonté normative, pleine de bonnes intentions probablement, mais quasi-totalitaire quand même. C'est ce quasi-totalitarisme qui me refroidit : c'est peut-être OK pour he/they sur le fond, mais qu'est-ce qu'on fait pour le point médian, pour la féminisation des noms de métiers, pour la grammaire "neutre" (iels, celleux, etc?). Est-ce que publier un document qui ne suit pas une norme sociale progressiste va forcément induire le risque d'être pointé du doigt et harcelé jusqu'à ce qu'on accepte cette nouvelle "norme"? Ça ne correspond pas vraiment à ma conception du progressisme…
Si tu penses vraiment que face au comportement d'un dev qu'on désapprouve, la bonne attitude c'est de ne pas faire de bruit et de juste l'ignorer, pourquoi est-ce que la bonne attitude devant un contributeur potentiel qui exprime son malaise c'est de lui expliquer qu'il a tort?
Sauf que ça n'est pas du tout comme ça que ça s'est passé. Quelqu'un a soumis un patch pour modifier toute la doc sans que personne ne lui ai demandé et sans en avoir discuté, le dev a répondu "c'est une contribution cosmétique motivée par un agenda politque et je ne marche pas dans la démarche", et c'est tout. Aucun contributeur ou utilisateur régulier n'a contacté la ML des devs pour demander d'où ça venait et si les devs pensaient que c'était une bonne idée de changer.
Mon interprétation c'est que le dev s'intéresse à ses vrais utilisateurs, et il ne donne pas suite aux contributions dont l'objectif principal n'est pas d'améliorer le logiciel. On peut désaprouver, mais c'est assez pathétique d'aller l'accuser de mysogynie ou de transphobie, et d'aller faire du buzz sur les rézosocio. De toutes façons, personne n'utilisait ce soft avant, donc ça ne va rien changer, et c'est bien parce que tout le monde le sait que la campagne s'est transformée en dénigrement et en incitation au boycott ou à pourrir les ML.
C'est ce qui est pratique avec les discriminations, c'est que quand on est blanc chrétien hétérosexuel dans un pays développé, on a le luxe de pouvoir s'en foutre.
On a au moins le luxe de la pensée quantitative. Entre une discrimination à l'embauche et le choix des pronoms dans la doc d'un logiciel, il y a une petite différence qui pourrait bien expliquer qu'on s'intéresse à la première et qu'on se foute totalement de la seconde.
Bref, ce sont des débats sans fin pour des projets techniques qui ne nous appartiennent pas. Le meilleur moyen d'exprimer votre désapprobation est de ne pas les utiliser.
Moi j'irais même plus loin : poussée à l'extrême, la pensée progressiste peut avoir des relents normatifs quasiment fascistes. L'idée n'est plus de convaincre par des arguments (du style "attention, votre doc considère que le lecteur ne peut être qu'un homme, or certaines femmes utilisent votre logiciel et il faudrait savoir si elles ne se sentent pas offensées par ce choix"), mais d'imposer ("vous devez faire comme ça, si vous ne le faites pas c'est que vous êtes un sale xyz-phobe, et je vais demander à mes copains de parler de vous partout sur les rézosocio pour que vous souffriez de ne pas m'avoir obéi".
On est dans un registre qui a abandonné depuis longtemps la bienveillance: l'opposition, ou même l'indifférence, aux thèmes progressistes du moment, est devenue insupportable pour certains militants, qui ne sont plus dans une démarche de conviction, mais dans une démarche de faire appliquer par la contrainte. Parfois ils n'y arrivent pas, parce qu'ils ne sont pas tout-puissants, mais la méthode est quand même inquiétante.
Si tu as un minimum d'empathie tu ne peux pas être l'indifférent à leurs droits et t'en foutre de la question des pronoms.
Donc on parle bien de droits ou pas? Ou alors je ne vois vraiment pas où tu veux en venir. Ou alors, tu veux dire qu'il faut de l'empathie pour ne pas être indifférent à la question des pronoms, de manière indépendante des droits? Auquel cas on est peut-être d'accord; en effet, les histoires de pronoms n'ont rien à voir avec les droits, c'est plus une histoire de politesse ("que penserait une femme qui lit cette doc dans laquelle je considère que le lecteur est un homme?").
Si tu as un minimum d'empathie tu ne peux pas être l'indifférent à leurs droits et t'en foutre de la question des pronoms.
Je ne suis pas certain de comprendre la phrase, mais pourquoi? Ce n'est pas très difficile de distinguer ce qui est du ressort des droits fondamentaux et ce qui est une question d'inconfort vis-à-vis du reste de la société. Pour revenir dans le contexte, ici il s'agit d'une documentation écrite comme si le lecteur ne pouvait être qu'un homme. On peut trouver ça idiot ou y être indifférent, une utilisatrice du logiciel pourrait s'en trouver mal à l'aise, et en effet, on pourrait même dire que ça contribue à maintenir une sorte d'ambiance pas très paritaire dans le monde du logiciel. Mais considérer que des droits sont bafoués, ça revient à judiciariser une situation qui est parfaitement compatible avec la vie de tous les jours; par contraste, ça revient également à assimiler des vraies violations des droits avec une chose aussi ridicule que l'utilisation de mauvais pronoms dans une doc.
Bon, encore une fois, on ne parle pas d'intolérance. On ne parle que de quelqu'un qui refuse de suivre le délire de quelques uns sur ces histoires de pronoms. Ces espèces de "faux ennemis" sont faciles à identifier et à harceler, ce sont des cibles faciles parce qu'ils sont inoffensifs. C'est beaucoup plus difficile de s'attaquer aux milieux masculinistes, parce qu'eux sont de vrais méchants.
[^] # Re: je mange de tout
Posté par arnaudus . En réponse au sondage votre alimentation. Évalué à 5.
Il n'y a pas des fois où tu te dis, en prenant une direction, que tu devrais éviter parce que tu vas rapidement sortir les rames et pagayer longtemps, longtemps à contre-courant?
Il y a peut-être besoin d'expliciter les sous-entendus, mais quand les gens disent qu'ils mangent "de tout", ils ne veulent pas dire en fait qu'ils mangent "de tout". Ils ne mangent ni les cailloux, ni les crottes de chiens, ni les amanites phalloïdes. Quand on dit qu'on mange "de tout", on s'arrête aux aliments comestibles, nutritifs, et communs. Ça veut dire par exemple qu'on ne mange pas forcément:
1) des trucs que culturellement on n'identifie pas comme comestible (parce que ça ne pousse pas en Europe, parce que quelque chose qui ressemble n'est pas comestible, etc)
2) les trucs qui ne sont pas bons (trop amers, trop salés, trop piquants, trop fades)
3) les trucs qui rendent malades ou qui provoquent le décès rapidement
4) les trucs qui provoquent le dégôut (les vers de terre, les couilles d'agneaux)
5) les trucs qui n'ont pas d'intérêt nutritif, ou qui nécessitent des efforts de récolte et de préparation disproportionnés (ça inclut les machins qu'on ne trouve pas en supermarché et qu'il faut aller chercher soi-même dans les bois)
Donc si tu veux dire que certains végétaliens mangent des pétales de fleur rares, du tofu préparé selon une cette Tibétaine, ou des bourgeons de sapins des Alpes, oui, c'est certainement vrai, mais je ne pense pas que c'est de ça qu'on parle quand on diversifie son alimentation. Du point de vue nutritif, tu peux manger 40 variétés de légumes secs, ça reste des légumes secs, ils ont grosso-modo le même rôle dans ton alimentation. Et les condiments n'ont pas de valeur nutritive, c'est pour la diversité des goûts.
[^] # Re: Flexitarien vs "mange de tout"
Posté par arnaudus . En réponse au sondage votre alimentation. Évalué à 6.
Parce qu'il mange un yaourt, du jambon et du poisson une fois par semaine? Bah dis donc, c'est du flexitarisme qui a oublié de faire des étirements…
Pas si tu es végétalien. C'est un peu bizarre ton raisonnement; si tu as une alimentation variée ton apport de protéines est en effet suffisant, mais dès que tu retires la viande, les œufs, et le poisson, tout de suite c'est plus compliqué, et il faut faire attention (ajouter des légumes avec beaucoup de protéines, etc). Donc la phrase exacte, ça devrait être "si tu manges de la viande, il n'y a aucun disque de manquer de protéines parce que tu en consommes trop, mais si tu ne manges pas de viande il faudra faire un peu attention parce que tu vas te rapprocher de la limite basse."
Et si tu fais du sport ou une activité quotidienne physique qui demande un peu de force, la récupération et la prise de masse musculaire demande bien plus de protéines que ça (ça passe souvent par des compléments alimentaires pour ceux qui ne veulent pas manger du poulet à chaque repas).
Mais je suis sûr qu'avec une poupée gonflable aussi :-) Quand on dit que la viande c'est bon, on ne dit pas que les légumes c'est pas bon, c'est juste que spontanément, la plupart des gens préfèrent la viande (en général, ça n'est pas très dur de faire manger de la viande aux enfants, alors que les légumes verts, c'est moins spontané). C'est pareil chez tous les animaux omnivores (les cochons, les ours, les poules…), tu leurs balances des restes de repas et ils commencent toujours par la viande. Du coup, il y a forcément quelque chose d'artificiel dans le discours "moi je n'aime plus la viande". Évidemment, la puissance de l'esprit humain est telle qu'il est tout à fait possible de se conditionner pour arriver à avoir un comportement socialement acceptable sans trop de frustrations (payer ses impôts, se tenir à la monogamie, respecter les limitations de vitesse, utiliser des logiciels libres même quand ils sont un peu buggués, etc), mais évidemment, cet auto-conditionnement ne fonctionne pas forcément sur les autres!
# Besoin de GPS en temps réel?
Posté par arnaudus . En réponse au message vélo/GPS: quel matériel utilisez vous ?. Évalué à 3.
j'ai l'impression que le GPS n'est utile que quand on s'en sert comme une carte lors des sorties, et pas vraiment pour la trace en elle-même. Pour la trace, une montre connectée fonctionne très bien; elle sert à commander le GPS du smartphone planqué quelque part au chaud (sac à dos, sacoche sur le vélo…). Par contre, la question se pose si on veut extraire la trace pour la mettre sur un ordinateur et l'analyser avec autre chose que l'application dédiée du téléphone; j'ai l'impression que ça va être spécifique de l'application, et donc de la marque de la montre.
[^] # Re: Clarification bienvenue
Posté par arnaudus . En réponse au lien Judge dismisses DMCA copyright claim in GitHub Copilot suit. Évalué à 5.
Normalement non, je ne crois pas. Ce qui compte, c'est la démarche : création intellectuelle ou artistique. En droit, il me semble aussi qu'on retient le critère de la personnalité de l'auteur pour déterminer l'originalité (en gros, est-ce que quelqu'un d'autre dans ce domaine aurait fait la même chose ou pas, est-ce qu'on peut reconnaitre l'auteur à l'aveugle par exemple). Une photo toute floue parce que tu as fais une fausse manip n'est pas une œuvre de l'esprit, la même photo faite exprès l'est. Définition assez bizarre et peu opérationnelle, je trouve…
Dans les faits, le code de la propriété intellectuelle donne depuis 1994 une liste non exhaustive (https://www.legifrance.gouv.fr/codes/article_lc/LEGIARTI000006278875): les livres, les films, les dessins, les photos, le code informatique, les créations de mode… Du coup, quand tu es là-dedans, tu n'as pas à t'embêter avec ces histoires d’œuvres de l'esprit. C'est bien pratique pour les logiciels, parce que c'est un domaine où ça n'est carrément pas évident que le code porte en lui la personnalité de son auteur…
De toutes manières, le droit n'est pas une science exacte. On avait déja discuté ici de plusieurs cas où la justice avait reconnu des droits pour les photographies de tableaux dans le domaine public, en prétextant du fait que le photographe devait faire des réglages et choisir l'éclairage, ce qui semble profondément contraire à l'esprit de la loi (quand ton but est de fournir une copie conforme, tous les réglages n'ont pour unique but de ne pas modifier l'oeuvre originale; quelle que soit la difficulté de la tâche il n'y a aucune démarche artistique). L'argument des musée est l'équilibre financier (dur dur d'être un musée, les reproductions papier sont une source de revenus, si on nous retire ça on va fermer et les conséquences pour la société sont terribles, etc), et la justice interprète la loi comme il faut pour éviter les conséquences néfastes d'une éventuelle application à la lettre. C'est quelque chose que je n'ai jamais compris, mais je n'y connais rien en droit, et c'est pour ça qu'il est toujours difficile d'être trop affirmatif : ça n'est pas parce que quelque chose découle logiquement d'une lecture naïve d'un texte de loi qu'on peut prédire une décision de justice.
[^] # Re: Et qu'en est-il de lemonde.fr ?
Posté par arnaudus . En réponse au lien «Dark patterns» : la majorité des sites web manipulent leurs usagers, selon une étude internationale. Évalué à 3.
Bah tu peux lire l'arrêt du conseil d'État si tu veux… L'idée, si j'ai bien compris, c'est que si tu rentres dans un magasin et que c'est trop cher ou que les conditions générales de vente ne te plaisent pas, tu vas ressortir sans rien acheter, et ça, ça n'est pas un préjudice. Donc l'interprétation que le conseil d'État fait de la RGPD, c'est qu'il n'y a préjudice que quand tu est obligé de te soumettre aux cookies. Si le site te propose une alternative (payer un abonnement, aller voir chez un concurrent, etc), alors il n'y a pas de préjudice.
Ce n'est pas ce que la CNIL avait compris, d'où la situation instable.
Moi je vois bien les dangers quand même de trop élargir la notion de préjudice. Tu te pointes à la boulangerie à 20h05 alors qu'ils ferment, tu ne peux pas dire que de ne pas avoir de pain pour manger ton saucisson est un préjudice. Mais au final, ça rend la RGPD assez caduque, puisque ça permet un web inutilisable. Si au moins les aggrégateurs de news et moteurs de recherche étaient paramétrables pour n'afficher que des résultats accessibles sans paywalls ou cookiewalls…
[^] # Re: Et qu'en est-il de lemonde.fr ?
Posté par arnaudus . En réponse au lien «Dark patterns» : la majorité des sites web manipulent leurs usagers, selon une étude internationale. Évalué à 6.
Oui, tu as raison. En fait, la chronologie est bizarre. La CNIL avait fait une lecture restrictive de la RGPD, c'est à dire qu'elle avait clairement interdit les cookie walls, pour la raison (qui me semble assez évidente) que de devoir donner de l'argent est un préjudice matériel. Les éditeurs ont porté l'affaire au conseil d'État, qui n'a pas encore tranché sur le fond, mais qui a considéré qu'il existait possiblement une lecture alternative et qu'on pouvait oublier l'histoire du préjudice tant qu'une alternative était possible (payer, aller sur un autre site, etc). Il faudra attendre le jugement sur le fond pour en savoir plus; en attendant la CNIL a saisi les instances européennes pour avoir une clarification.
De toutes manières, pour moi, ça reste de l'escroquerie : quand tu payes, tu n'arrives pas sur un site paradisiaque qui te renvoie du HTML propre en 0.1s. Tu restes sur leur site merdissimal bourré de JS qui interprète tous tes faits et gestes avec les traceurs dans tous les coins, des pop-ups, des pubs "raisonnables", etc. Bref, tu payes, mais tu n'as pas mieux, tu as juste ce que tu avais quand tu cliquais sur "ne pas accepter" quand l'option était disponible.
Ces gens ne savent juste plus faire un site web qui fournit un service à leurs clients. Ils sont tellement shootés à la maximisation de leurs profits qu'ils ne savent même pas respecter leurs clients, si tu es assez bête pour payer, alors tu es assez bête pour qu'on exploite quand même jusqu'au moindre centime sur la moindre donnée que tu peux leur laisser. C'est là à quel point il est important de militer pour avoir les lois les plus protectrices possibles, les services qui s'occupent des sites commerciaux ont perdu toute forme de rationalité et s'il existait un moyen légal de récupérer ton numéro de carte bancaire, ils le feraient.
[^] # Re: Et qu'en est-il de lemonde.fr ?
Posté par arnaudus . En réponse au lien «Dark patterns» : la majorité des sites web manipulent leurs usagers, selon une étude internationale. Évalué à 7. Dernière modification le 11 juillet 2024 à 16:28.
En tout cas il y a un cookie wall, qui viole allègrement l'article 4 de la RGPD ("le consentement ne devrait pas être considéré comme ayant été donné librement si la personne concernée ne dispose pas d'une véritable liberté de choix ou n'est pas en mesure de refuser ou de retirer son consentement sans subir de préjudice").
[^] # Re: Émission aux frais du diffuseur
Posté par arnaudus . En réponse au journal L'ARCOM va-t-elle virer Bolloré du PAF ?. Évalué à 7.
Est-ce que tu n'as quand même pas un effet du canal? Il y a plus de chances de t'arrêter sur la chaîne n°9 que sur la chaîne n° 121…
Je ne sais pas comment ça se passe pour être diffusé via une box. Il faut payer, ou bien c'est donnant-donnant avec le FAI qui élargit son offre?
[^] # Re: Comment débattre sans différence ?
Posté par arnaudus . En réponse au journal L'ARCOM va-t-elle virer Bolloré du PAF ?. Évalué à 10.
Le fait que la déontologie n'est pas censée être partisane?
Ce qui est assez frappant, c'est qu'il semble impossible pour une chaine d'extrême droite de respecter les principes de base de la déontologie journalistique. Si on demande à ces chaines de faire un travail de journalisme dans les règles de l'art, elles crient à la censure. C'est quand même étrange, non?
[^] # Re: Émission aux frais du diffuseur
Posté par arnaudus . En réponse au journal L'ARCOM va-t-elle virer Bolloré du PAF ?. Évalué à 10.
Non, je pense que tu te trompes. L'État a son mot à dire parce que les fréquences sont un bien public (le nombre de chaines est contraint par une limite physique, et l'État doit arbitrer pour attribuer les canaux de diffusion), mais les chaines payent un loyer pour diffuser (compenser les coûts de diffusion).
[^] # Re: Clarification bienvenue
Posté par arnaudus . En réponse au lien Judge dismisses DMCA copyright claim in GitHub Copilot suit. Évalué à 4.
Tu as parfaitement raison. Ça marche avec les deux bouts de phrases indépendamment, mais personne ne les avait jamais mis ensemble! :-)
Ceci dit, l'originalité de la citation ne permet pas forcément de prouver la contrefaçon, puisqu'il reste possible d'assembler ces deux bouts de phrase par hasard. Et par dessus tout, il est peu probable qu'une phrase aussi triviale puisse être qualifiée d’œuvre de l'esprit. Ça n'est pas une question de longueur, puisque "Les sanglots longs des violons de l'automne" est clairement une œuvre de l'esprit, alors que "J'ai vachement mal au bide ce matin", probablement pas :-)
[^] # Re: Clarification bienvenue
Posté par arnaudus . En réponse au lien Judge dismisses DMCA copyright claim in GitHub Copilot suit. Évalué à 4.
Bah c'est assez fréquent en fait, donc tu ne devrais pas être surpris. Sur un répertoire OpenSource par exemple https://www.mend.io/blog/open-source-licenses-trends-and-predictions, les licences les plus populaires sont Apache (30%), suivi par MIT (26%), puis GPL v2 et v3 (à peu près 10% chacune). Donc le "copyleft" n'est souvent pas majoritaire parmi les licences libres; ça dépend évidemment du type de répertoire et de la manière dont on compte.
Mais de toutes manières, l'argument n'est pas que le jugement viole les licences copyleft. Le jugement me semble tout à fait compatible avec l'esprit et la lettre des licences libres copyleft! C'est juste que des gens n'ont pas compris le droit d'auteur et/ou les licences libres et/ou le fonctionnement des LLM. Moi j'utilise les licences copyleft et je ne me suis jamais attendu à ce que la sortie d'un LLM puisse être sous une quelconque licence, pour toutes les raisons que j'ai évoquées au dessus. Donc tu n'arrêtes pas de dire qu'on te prête des idées que tu n'as pas, mais tu n'arrêtes pas de répéter que les libristes devraient s'opposer à ce jugement. Or, ce jugement me semble parfaitement logique, sur la forme et sur le fond, et parfaitement en accord avec le droit d'auteur et les licences logicielles libres et copyleft. Es-tu certain d'avoir bien compris comment fonctionne le droit d'auteur, les logiciels libres, et les LLM? Si oui, alors ça serait pas mal de présenter clairement ton raisonnement, plutôt que de partir dans tous les sens avec des analogies sur les armes à feu que personne ne comprend.
Si tu veux dire que tu croyais avoir compris que les licences libres te protégeaient de l'analyse du code par des grandes entreprises, et qu'elles interdiraient la diffusion du produit de cette analyse, alors 1) je te crois, mais 2) le problème vient de toi, parce que rien dans le texte de la licence ne permettait de te faire croire ça. Tu t'étais donc fourvoyé et tu peux être légitimement dégoûté, mais ça ne sert à rien de t'en prendre à tout le monde, aux libristes qui ne sont pas d'accord avec toi, aux juges, aux grandes entreprises, ou aux LLM.
[^] # Re: Clarification bienvenue
Posté par arnaudus . En réponse au lien Judge dismisses DMCA copyright claim in GitHub Copilot suit. Évalué à 3.
Je viens de réaliser que l'analogie de l'interdiction des armes à feu venait en réponse à mon argument "seules les œuvres de l'esprit sont soumises au droit d'auteur, or les sorties des LLM ne sont pas des œuvres de l'esprit parce que la jurisprudence n'accorde ce titre qu'aux œuvres créees par les humains". Avec toute la meilleure volonté du monde, je ne vois vraiment pas le rapport.
À part de conclure que l'état de droit est frustrant parce que la loi n'interdit pas ce qu'on voudrait bien interdire une fois que c'est arrivé mais qu'on ne peut pas le savoir avant que quelqu'un le fasse, je ne sais pas où tout ça nous amène.
La première étape serait peut-être de proposer une GPL v4 qui interdit d'utiliser le code pour entrainer un algorithme. Ceci dit, cette clause n'est certainement pas compatible avec les libertés fondamentales 2 et 3 des logiciels libres (copier et étudier), ce qui risque de rendre les logiciels sous une telle licence non-acceptable pour plusieurs projets.
[^] # Re: Clarification bienvenue
Posté par arnaudus . En réponse au lien Judge dismisses DMCA copyright claim in GitHub Copilot suit. Évalué à 7.
Je ne vois pas le rapport. La loi définit la contrefaçon et les peines encourures pour contrefaçon. Or, la sortie des LLM ne correspond pas à la définition de la contrefaçon (ce n'est pas une copie ou un travail dérivé). Tout ce qui n'est pas interdit par la loi est légal, et les LLM sont donc légaux.
Bien sûr, il est possible de changer les lois, et ça sera peut-être fait. Mais ça ne change rien au fait que le fonctionnement des LLM qui mangent des bases de code libre en entrée et qui recrachent du code sans auteur et sans copyright semble légal.
Tu t'attends mal. Tu ne sais pas comment fonctionnent les LLMs, ce qui n'est pas très grave en soi, mais tu te trompes sur la manière dont ces algorithmes fonctionnent. Ils ne recopient pas des morceaux de code, ils intègrent la logique des données sur lesquelles ils s'entrainent dans un réseau de neurones. Du coup, les bouts de code que tu lui as donnés ne sont pas stockés par le LLM, il n'en extrait qu'une sorte de logique générale. Il fait ensuite passer les requêtes à travers son modèle, et te revoit la sortie.
Ce que tu mentionnes existe (le modèle recrache les données d'entrainement verbatim, comme un moteur de recherche), mais c'est un comportement pathologique (non-souhaité et non-souhaitable): le modèle a été sur-paramétré, le réseau n'a pas été entrainé avec assez de données, et il "colle" trop aux données d'entrainement. Tu peux aussi "provoquer" ce comportement avec des requêtes trop spécifiques (par exemple, au lieu de "tri à bulle", tu demandes "tri à bulle en 5 lignes avec des variables qui s'appellent Titeuf et Koko, et avec une erreur de logique à la ligne 3"). Mais ça reste un comportement buggué, auquel justement tu ne devrais pas t'attendre.
On ne parle pas de déréguler les armes à feu, on parle de savoir si la sortie des LLMs peut être considérée comme de la contrefaçon. La loi n'est pas magique, elle interdit certaines choses, et ce qui n'est pas interdit est autorisé. Les licences copyleft sont explicitement publiées pour autoriser l'étude du code, ce que font les LLMs. Elles n'autorisent la publication de versions modifiées que si la même licence est appliquée. Or, les LLMs ne modifient pas le code, elles l'étudient et intègrent leur logique dans un réseau de neurones, qui peut être par la suite utilisé pour générer du code qui diffère du jeu de données d'entrainement (si c'était le même, ça ne serait qu'un moteur de recherche).
Si tu crois qu'un LLM est un moteur de recherche sophistiqué, tu ne peux pas comprendre pourquoi la licence n'est pas conservée en sortie. Mais je ne peux pas l'écrire différemment : un LLM n'est pas un moteur de recherche. C'est un algorithme qui génère quelque chose à partir de patterns qu'il a appris d'un jeu de données. Il ne ressort pas les données, il crée des données nouvelles qui correspondent à une structure qu'il a induite de ses données d'entrainement.
Ça tombe bien : il n'y a aucune licence à respecter, puisque la sortie du modèle n'est pas un travail dérivé ou une contrefaçon. J'ai l'impression que ce qui n'est peut-être pas clair, c'est que tu peux mettre du 100% GPL en entrée, et que la sortie n'a pas de licence. Pourtant, c'est comme ça que fonctionne la propriété intellectuelle. Quand tu apprends à lire, tu mets du 100% copyright en entrée, et ce que tu écris t'appartient à 100% (sauf si tu as copié). Quand tu es musicien, tu mets du 100% de copyright en entrée, et ce qui sort t'appartient à 100% (sauf si tu as copié). Le fait de combiner de multiples sources d'influence ne crée pas quelque chose qui appartient à quelques % à ces sources, ça crée quelque chose qui ne leur appartient plus. C'est comme ça que ça marche avec les humains, et c'est comme ça que ça marche avec les LLM, qui fonctionnent selon le même principe.
Tu peux penser que ça devrait fonctionner autrement, et on pourrait avoir une discussion sur ce sujet. Mais actuellement, à mon avis, la seule interprétation possible de la propriété intellectuelle est que la sortie des LLM n'est ni de la contrefaçon, ni une œuvre originale (puisque pas créé par un humain), et que sa publication ne peut pas être illégale (puisque pas interdite par la loi).
J'ai bien compris ton opinion, mais je pense (c'est mon avis) que c'est ton incompréhension de ce qu'est la propriété intellectuelle, de ce qu'est la GPL, et de la manière dont les LLM fonctionnent qui te porte à croire ça.
Pour ma part, j'ai du code GPL dans Github et il est donc probable qu'il a été utilisé pour entrainer de nombreux modèles de langage, et ça ne me dérange pas, parce que 1) la possibilité d'étudier et d'apprendre à partir du code est explicitement autorisé et encouragé par la GPL, 2) que la très grande majorité du code que j'ai écrit est trivial et qu'il ne pourrait pas raisonnablement être considéré comme une œuvre de l'esprit devant un tribunal (et donc que la licence que j'ai attribuée au code n'a probablement pas de substance légale), 3) que je n'ai aucun moyen de savoir si une sortie des modèles de langage a été influencée par un bout de réseau pour lequel mon code a affecté les paramètres (en gros, un bout de code qui ressemble au mien a peut-être 9 chances sur 10 de n'avoir aucun lien causal avec mon code, que mon code n'a peut-être pas été inclus dans la base pour une raison ou pour une autre), ce qui prouve bien que ça n'est pas de la contrefaçon (si même moi je ne peux pas savoir, alors comment quelqu'un d'autre le pourrait?).
Je serais intéressé de savoir si c'est parce que tu penses que leurs résultats sont médiocres ou inutiles, ou inversement parce que tu te sens humilié en tant qu'être humain par l'existence d'algorithmes capables de faire mieux que toi ce que tu pensais maitriser. Étrangement, j'ai l'impression que beaucoup de gens sont sur les deux options en même temps, ce qui me semble assez instable comme point de vue.
L'idée de détester les trucs nouveaux qu'on a du mal à comprendre et qui peuvent modifier l'équilibre de notre vie n'est pas nouvelle, elle est probablement aussi vieille que l'humanité. Mais j'imagine que tu es déja au courant que cette idée n'a jamais gagné; que les nouvelles générations vont s'approprier cet outil et réussir à faire des choses avec, et que tu finiras tes jours malheureux en ronchonnant que c'était mieux avant?
On voit d'ailleurs que la révolution IA n'a pas encore eu lieu. Les LLM servent beaucoup à générer du bullshit publicitaire, des articles de faux journaux, ils servent aux étudiants à tricher, et à tout un tas de gens incompétents de faire croire qu'ils savent faire des choses dont ils sont incapables (écrire du code, écrire une lettre sans faire de faute, ou dans une langue qu'ils ne connaissent pas, etc). Nul doute qu'il existe une utilité marginale à de tels outils (pour remplacer la doc des logiciels, typiquement), mais à ma connaissance, la productivité du secteur tertiaire n'a pas pris 75% en un an. Aucune raison de paniquer, aucune raison de détester un nouvel outil, aucune raison de croire que le monde va changer.
# Clarification bienvenue
Posté par arnaudus . En réponse au lien Judge dismisses DMCA copyright claim in GitHub Copilot suit. Évalué à 10. Dernière modification le 10 juillet 2024 à 12:42.
TL/DR: c'est juste l'application des lois existantes à une situation que les législateurs n'avaient pas prévu.
Il va falloir un certain nombre de décisions de justice similaires pour "stabiliser" la situation.
Dans tous les cas, j'ai toujours pensé que c'était la seule issue possible sans modification des lois existantes, pour plusieurs raisons:
1) À ma connaissance, dans la plupart (toutes) les législations qui implémentent la convention de Berne (le socle commun à la propriété intellectuelle dans le monde), la notion de travail dérivé n'est définie que par la similarité d'une oeuvre par rapport à l'original, et pas par le processus qui a permis de créer cette oeuvre (du coup, c'est peut-être le terme de "dérivé" en français qui est trompeur). Un modèle de langage bien paramétré ne ressort pas de morceaux identifiables, et ses sorties ne peuvent donc pas être des oeuvres dérivées. C'est d'ailleurs l'argument qui justifie le jugement dont il est question: les plaignants n'ont pas fourni la preuve que les sorties du modèles étaient dérivées de leur travail.
La propriété intellectuelle ne peut pas être diluée. Elle n'est pas quantitative, soit une oeuvre est protégée, soit elle ne l'est pas. Ça veut dire qu'il est tout à fait possible par exemple d'écrire un texte qui ne contient que des phrases tirées de livres déja publiés, sans que ça soit une contrefaçon. Et c'est probablement déja arrivé, puisqu'une phrase triviale ("Il prit son chapeau et ferma la porte derrière lui") a toutes les chances d'avoir déja été écrite. Du coup, un code composé de lignes qui sont toutes tirées de sources sous GPL n'est pas nécessairement sous GPL. C'est une profonde incompréhension de la nature de la propriété intellectuelle que d'imaginer que c'est nécessairement le cas.
2) Il ne faut pas oublier que seules les oeuvres de l'esprit originales sont protégées par le droit d'auteur. Parfois on oublie ça, parce qu'on applique une licence à un ensemble de fichiers, mais il est très peu probable que vos .h qui contient des constructeurs, des destructeurs, et des méthodes triviales, soient en fait protégés par le droit d'auteur. Seuls les algorithmes un peu élaborés, les designs spécifiques à un problème donné, les optimisations un peu chiadées, etc. sont susceptibles d'ouvrir des droits d'auteur. Même si vous pouviez prouver qu'un LLM ressort une de vos fonctions telles quelles, il faudrait en plus démontrer que cette fonction est originale (par exemple, qu'elle est unique dans la base de données). Si la base de données de code contient 57 implémentations du tri à bulle et que l'IA a sorti celles avec vos noms de variables, ça ne veut pas dire qu'il y a eu contrefaçon.
3) L'aspiration de bases de données de code libre, qui est souvent reprochée à ces modèles, est tout à fait compatible avec la très grande majorité des licences libres. "Je ne voulait pas que mon code sous GPL serve à entrainer les modèles de langage" n'est pas un argument. Une modification des licences libres est peut-être envisageable, mais en tout cas l'argument n'est pas opposable.
Bref, je pense que la jurisprudence qui va s'établir va être assez claire : 1) l'inclusion de code dans une base de données destinée à l'entrainement de LLM ne constitue pas une violation de la propriété intellectuelle des auteurs du code (la question reste ouverte pour la base de données aspirée, mais on passe aux droits voisins, et en tout cas ça ne concerne pas les auteurs du code). 2) Sauf similarité dûment démontrée dans les sorties d'un modèle mal paramétré (comme l'étaient les premières versions de Copilot, si je me souviens bien), le code produit par une IA n'est pas soumis au code de la propriété intellectuelle (parce que ça n'est pas une oeuvre de l'esprit).
Ça me semble assez évident quand on lit le code de la propriété intellectuelle par exemple, mais je ne suis pas juriste et bien sûr les juges considèrent aussi autre chose que la loi. Mais en tout cas, j'ai l'impression que la plupart des arguments de ceux qui pensent que "ça devrait être interdit" n'ont pas de base légale, et qu'ils s'exposent à de grosses désillusions s'ils pensent que quelque chose comme "Je ne voulais pas que mon code soit réutilisé par des grosses boîtes pour faire du pognon" est un argument recevable.
Il y a d'ailleurs un point "philosophique" qui me semble intéressant : prétendre que la sortie d'un LLM peut violer sa propriété intellectuelle me semble quasiment auto-contradictoire. Par définition, la propriété intellectuelle ne s'applique qu'aux oeuvres de l'esprit (que la jurisprudence considère comme uniquement humain, pas de copyright sur les dessins de chimpanzés etc). Or, les sorties d'une IA ne peuvent pas être protégées par le droit d'auteur, parce que justement elles ne sont pas des oeuvres de l'esprit (sortir une sorte de code consensus ne peut produire qu'un code trivial qui ne reflète pas la personnalité de son auteur). Comment peut-on donc prétendre qu'un code suffisamment original pour être protégé par le droit d'auteur peut ressortir d'une IA d'une manière suffisamment similaire pour être une contrefaçon? (encore une fois, sauf si l'IA n'a pas été surparamétrée, ce qui est un problème technique qui peut en effet s'apparenter à de la contrefaçon)? À mon avis, il faut un raisonnement particulièrement précis pour s'en sortir. Par exemple, les "artistes numériques" prétendent que c'est le texte d'invocation de l'IA qui est l'oeuvre de leur esprit, et qui justifieraient la protection de la sortie de l'IA. Mais ça, ça permet d'attribuer une propriété à l'utilisateur de l'IA, ce qui est assez différent de la question du droit sur le bout de code qui sort d'une requête triviale.
[^] # Re: dev principal de Ladybird
Posté par arnaudus . En réponse à la dépêche Pour 100 briques t'as plus rien : le navigateur Ladybird reçoit un million de brouzoufs. Évalué à 3. Dernière modification le 05 juillet 2024 à 17:38.
Wikipédia:
L'empathie […] est la reconnaissance et la compréhension des sentiments et des émotions d'un autre individu.
Le Robert:
Capacité de s'identifier à autrui dans ce qu'il ressent.
Wiktionnaire:
Capacité de comprendre, de ressentir les sentiments ou de se mettre à la place d’une autre personne.
Larousse:
Faculté intuitive de se mettre à la place d'autrui, de percevoir ce qu'il ressent.
Du coup, oui, par définition, l'empathie ne peux s'appliquer qu'à des individualités. Je ne comprends pas ce que tu entends pas "humanité dans son ensemble". Tu veux peut-être dire quelque chose comme "compassion"? La compassion peut être ressentie envers un groupe de personnes, par exemple.
Si on n'utilise pas les mêmes définition, c'est sûr qu'on ne risque pas de se comprendre!
oserais-je faire remarquer l'utilisation générique de "il" dans toutes ces définitions? :-)
[^] # Re: Le problème n'est pas que pour la grippe
Posté par arnaudus . En réponse au lien L'humain pourrait être contaminé par la grippe aviaire ?. Évalué à 4.
Pas forcément, parce qu'il faudrait que le coût soit justifié médicalement, ce qui est probablement le cas pour le diabète, mais pas par l'identification des variants de rhinovirus. Je pensais juste à un protocole d'échantillonnage scientifique, et pas à une remontée de cas spontanée. Par exemple, tirer au sort un généraliste sur 1000 et lui faire faire ces tests suffirait probablement largement. Mieux, tirer des gens au hasard (et pas des malades qui consultent).
Un exemple que je trouve assez symptomatique, c'est les "symptomes grippaux". Pas besoin d'identifier le virus, puisque le traitement est le même. Sauf que, mine de rien, savoir qu'on a la grippe, le covid, ou le VRS, ça permet de déterminer qui on peut cotoyer ou non (vieux ou bébés), ça détermine aussi le bénéfice de la vaccination à l'hiver qui suit. Et en plus ça permet d'anticiper le diagnostic sur les 12 vieux qui vont le chopper en salle d'attente.
Le VRS par exemple, c'est exactement le truc qu'on a complètement raté parce qu'on n'étudie pas les virus respitatoires. On s'est créés une génération de gamins asthmatiques parce que "le rhume c'est pas grave" : pas d'identification du virus, pas de tests, pas d'exclusion des crèches et des écoles, pas d'isolement. Forcément, on considère que 1) pour comprendre les maladies, il faut étudier les malades, 2) les maladies on les connait, elles sont dans les livres de médecine, 3) les traitements contre les virus sont identiques (il n'y en a quasiment pas, en fait), donc la connaissance des souches virales n'a aucune indication médicale. En gros, on ne fait que de l'épidémiologie appliquée à la médecine, ce qui ne permet pas de détecter les nouvelles maladies, de comprendre comment elles se propagent, ou comment on pourrait limiter leur propagation. En 2020, on en était exactement au même point qu'en 1920 pour la grippe espagnole : on met un chiffon devant le nez et on pshit des huiles essentielles; si on est à 3m de distance c'est bon. Vous avez vu par exemple des purificateurs d'air achetés par l'éducation nationale, depuis? Bah non, pas besoin, ils se lavent les mains, c'est bien connu, les virus respiratoires s'attrappent par les mains. Bon, OK, c'est pas "connu", c'est juste ce qu'on dit depuis 100 ans sans jamais l'avoir vérifié, mais c'est comme ça qu'on fait de la science en médecine.
[^] # Re: dev principal de Ladybird
Posté par arnaudus . En réponse à la dépêche Pour 100 briques t'as plus rien : le navigateur Ladybird reçoit un million de brouzoufs. Évalué à 5. Dernière modification le 05 juillet 2024 à 14:31.
Bah là je ne te comprends pas. Le respect des droits humains est totalement dissociable de l'empathie, autrement, ça serait terrible : tu ne défendrait le respect des droits de l'Homme qu'envers ceux pour lesquels tu ressens de l'empathie? Je suis pour que les pédonazis criminels de guerre aient droit à un procès équitable, mais s'ils ne veulent pas être appelés pédonazis parce que ça les offense, bah je m'en ballec, je les appelle comme je veux.
Au final, qui décide à quelles demandes tu accèdes et quelles demandes tu refuses? Tu utilises ton libre arbitre. Est-ce que "il" ou "elle" c'est raisonnable, et pas "iel"? Ou "il" le jour et "elle" la nuit? Ou "Mademoiselle", "Rajah", "Herr Doktor", "Monsieur le Président", "Skippy le Grand Gourou" ou "Maître de l'Univers"? Tu tranches bien à un endroit, et d'autres personnes trancheront à un autre endroit, ça n'est pas par manque d'empathie ou par manque de respect. À la limite, c'est bien plus irrespecteux d'utliliser le pronom souhaiter tout en pensant que c'est ridicule. Et en tout cas, tu peux toujours défendre que les gens ont des droits fondamentaux qui méritent d'être respectés indépendamment de la manière dont ils veulent se faire appeler.
[^] # Re: dev principal de Ladybird
Posté par arnaudus . En réponse à la dépêche Pour 100 briques t'as plus rien : le navigateur Ladybird reçoit un million de brouzoufs. Évalué à 6. Dernière modification le 05 juillet 2024 à 09:42.
Honnêtement, je ne vois pas à quelle expérience générale de "fascisme d'extrême gauche" tu fais référence. On sait que les expériences communistes ont systématiquement tourné vers le totalitarisme, mais on n'y trouve normalement pas les marqueurs du fascisme (traditionalisme, xénophobie, etc), même si on se rapproche sur d'autres points (paranoïa politique, anti-pacifisme…). C'est pour ça que j'ai écrit que ça pourrait se rapprocher, mais ne me faites pas dire ce que je n'ai pas dit, le "wokisme" n'est pas une forme de fascisme.
Ça me fait penser à une série d'affichettes "anti-sexistes" exposées à mon boulot. En plus de situations de "sexisme ordinaire" au boulot, illustrant des comportements fréquents qui génèrent une pression "masculiniste" dans le cadre professionnel, quelques situations illustrent également la vie privée (par exemple un type qui demande à sa femme de s'habiller différemment). Et c'est là que je trouve que ça déconne sec quand même : quoi qu'on puisse penser des types qui règlementent la tenue vestimentaire de leur nana, la pensée progressiste ne peut pas prétendre règlementer les conversations privées, ou ce que les gens font au plumard, et avec qui ils le font. C'est très bien de viser la parité dans un comité d'administration, mais c'est légitime de ne pas avoir de parité dans un groupe d'amis qui partent au camping. Je pense que ça illustre pas mal comment on peut partir plein de bonnes intentions et continuer sur sa lancée sans s'apercevoir qu'on va beaucoup trop loin, et que le projet de société qu'on propose n'est qu'une énième avatar de totalitarisme: on peut concevoir un totalitarisme progerssiste (je pense que c'est ça, le "wokisme", en fait), même s'il est peu probable qu'un tel mouvement puisse obtenir un réel pouvoir politique.
Dans le he-gate dont on parle, on n'est pas loin de ça : refuser un patch qui change 5 occurences de "he" en "they" dans une doc confidentielle d'un logiciel pas très connu est décrit comme un acte exécrable, qui conduit à des accusations de mysogynie et de transphobie. On sent bien qu'il y a derrière ça une volonté normative, pleine de bonnes intentions probablement, mais quasi-totalitaire quand même. C'est ce quasi-totalitarisme qui me refroidit : c'est peut-être OK pour he/they sur le fond, mais qu'est-ce qu'on fait pour le point médian, pour la féminisation des noms de métiers, pour la grammaire "neutre" (iels, celleux, etc?). Est-ce que publier un document qui ne suit pas une norme sociale progressiste va forcément induire le risque d'être pointé du doigt et harcelé jusqu'à ce qu'on accepte cette nouvelle "norme"? Ça ne correspond pas vraiment à ma conception du progressisme…
[^] # Re: dev principal de Ladybird
Posté par arnaudus . En réponse à la dépêche Pour 100 briques t'as plus rien : le navigateur Ladybird reçoit un million de brouzoufs. Évalué à 9.
Sauf que ça n'est pas du tout comme ça que ça s'est passé. Quelqu'un a soumis un patch pour modifier toute la doc sans que personne ne lui ai demandé et sans en avoir discuté, le dev a répondu "c'est une contribution cosmétique motivée par un agenda politque et je ne marche pas dans la démarche", et c'est tout. Aucun contributeur ou utilisateur régulier n'a contacté la ML des devs pour demander d'où ça venait et si les devs pensaient que c'était une bonne idée de changer.
Mon interprétation c'est que le dev s'intéresse à ses vrais utilisateurs, et il ne donne pas suite aux contributions dont l'objectif principal n'est pas d'améliorer le logiciel. On peut désaprouver, mais c'est assez pathétique d'aller l'accuser de mysogynie ou de transphobie, et d'aller faire du buzz sur les rézosocio. De toutes façons, personne n'utilisait ce soft avant, donc ça ne va rien changer, et c'est bien parce que tout le monde le sait que la campagne s'est transformée en dénigrement et en incitation au boycott ou à pourrir les ML.
[^] # Re: dev principal de Ladybird
Posté par arnaudus . En réponse à la dépêche Pour 100 briques t'as plus rien : le navigateur Ladybird reçoit un million de brouzoufs. Évalué à 4.
On a au moins le luxe de la pensée quantitative. Entre une discrimination à l'embauche et le choix des pronoms dans la doc d'un logiciel, il y a une petite différence qui pourrait bien expliquer qu'on s'intéresse à la première et qu'on se foute totalement de la seconde.
[^] # Re: dev principal de Ladybird
Posté par arnaudus . En réponse à la dépêche Pour 100 briques t'as plus rien : le navigateur Ladybird reçoit un million de brouzoufs. Évalué à 10.
Moi j'irais même plus loin : poussée à l'extrême, la pensée progressiste peut avoir des relents normatifs quasiment fascistes. L'idée n'est plus de convaincre par des arguments (du style "attention, votre doc considère que le lecteur ne peut être qu'un homme, or certaines femmes utilisent votre logiciel et il faudrait savoir si elles ne se sentent pas offensées par ce choix"), mais d'imposer ("vous devez faire comme ça, si vous ne le faites pas c'est que vous êtes un sale xyz-phobe, et je vais demander à mes copains de parler de vous partout sur les rézosocio pour que vous souffriez de ne pas m'avoir obéi".
On est dans un registre qui a abandonné depuis longtemps la bienveillance: l'opposition, ou même l'indifférence, aux thèmes progressistes du moment, est devenue insupportable pour certains militants, qui ne sont plus dans une démarche de conviction, mais dans une démarche de faire appliquer par la contrainte. Parfois ils n'y arrivent pas, parce qu'ils ne sont pas tout-puissants, mais la méthode est quand même inquiétante.
[^] # Re: dev principal de Ladybird
Posté par arnaudus . En réponse à la dépêche Pour 100 briques t'as plus rien : le navigateur Ladybird reçoit un million de brouzoufs. Évalué à 2.
Je ne comprends pas. Tu as écrit:
Donc on parle bien de droits ou pas? Ou alors je ne vois vraiment pas où tu veux en venir. Ou alors, tu veux dire qu'il faut de l'empathie pour ne pas être indifférent à la question des pronoms, de manière indépendante des droits? Auquel cas on est peut-être d'accord; en effet, les histoires de pronoms n'ont rien à voir avec les droits, c'est plus une histoire de politesse ("que penserait une femme qui lit cette doc dans laquelle je considère que le lecteur est un homme?").
[^] # Re: dev principal de Ladybird
Posté par arnaudus . En réponse à la dépêche Pour 100 briques t'as plus rien : le navigateur Ladybird reçoit un million de brouzoufs. Évalué à 2.
Je ne suis pas certain de comprendre la phrase, mais pourquoi? Ce n'est pas très difficile de distinguer ce qui est du ressort des droits fondamentaux et ce qui est une question d'inconfort vis-à-vis du reste de la société. Pour revenir dans le contexte, ici il s'agit d'une documentation écrite comme si le lecteur ne pouvait être qu'un homme. On peut trouver ça idiot ou y être indifférent, une utilisatrice du logiciel pourrait s'en trouver mal à l'aise, et en effet, on pourrait même dire que ça contribue à maintenir une sorte d'ambiance pas très paritaire dans le monde du logiciel. Mais considérer que des droits sont bafoués, ça revient à judiciariser une situation qui est parfaitement compatible avec la vie de tous les jours; par contraste, ça revient également à assimiler des vraies violations des droits avec une chose aussi ridicule que l'utilisation de mauvais pronoms dans une doc.
[^] # Re: débordements quand tu nous tiens
Posté par arnaudus . En réponse à la dépêche Pour 100 briques t'as plus rien : le navigateur Ladybird reçoit un million de brouzoufs. Évalué à 6.
https://fr.wikipedia.org/wiki/Ou_vous_%C3%AAtes_avec_nous,_ou_vous_%C3%AAtes_contre_nous
On ne compte d'ailleurs plus les gens retrouvés morts ou aveugles après avoir lu un mauvais pronom dans une documentation.
https://fr.wikipedia.org/wiki/Paradoxe_de_la_tol%C3%A9rance
Bon, encore une fois, on ne parle pas d'intolérance. On ne parle que de quelqu'un qui refuse de suivre le délire de quelques uns sur ces histoires de pronoms. Ces espèces de "faux ennemis" sont faciles à identifier et à harceler, ce sont des cibles faciles parce qu'ils sont inoffensifs. C'est beaucoup plus difficile de s'attaquer aux milieux masculinistes, parce qu'eux sont de vrais méchants.