Non, je pense que tu te trompes. L'État a son mot à dire parce que les fréquences sont un bien public (le nombre de chaines est contraint par une limite physique, et l'État doit arbitrer pour attribuer les canaux de diffusion), mais les chaines payent un loyer pour diffuser (compenser les coûts de diffusion).
Tu as parfaitement raison. Ça marche avec les deux bouts de phrases indépendamment, mais personne ne les avait jamais mis ensemble! :-)
Ceci dit, l'originalité de la citation ne permet pas forcément de prouver la contrefaçon, puisqu'il reste possible d'assembler ces deux bouts de phrase par hasard. Et par dessus tout, il est peu probable qu'une phrase aussi triviale puisse être qualifiée d’œuvre de l'esprit. Ça n'est pas une question de longueur, puisque "Les sanglots longs des violons de l'automne" est clairement une œuvre de l'esprit, alors que "J'ai vachement mal au bide ce matin", probablement pas :-)
Si je te comprends bien, tu es un libriste qui critique les licences copyleft.
Bah c'est assez fréquent en fait, donc tu ne devrais pas être surpris. Sur un répertoire OpenSource par exemple https://www.mend.io/blog/open-source-licenses-trends-and-predictions, les licences les plus populaires sont Apache (30%), suivi par MIT (26%), puis GPL v2 et v3 (à peu près 10% chacune). Donc le "copyleft" n'est souvent pas majoritaire parmi les licences libres; ça dépend évidemment du type de répertoire et de la manière dont on compte.
Mais de toutes manières, l'argument n'est pas que le jugement viole les licences copyleft. Le jugement me semble tout à fait compatible avec l'esprit et la lettre des licences libres copyleft! C'est juste que des gens n'ont pas compris le droit d'auteur et/ou les licences libres et/ou le fonctionnement des LLM. Moi j'utilise les licences copyleft et je ne me suis jamais attendu à ce que la sortie d'un LLM puisse être sous une quelconque licence, pour toutes les raisons que j'ai évoquées au dessus. Donc tu n'arrêtes pas de dire qu'on te prête des idées que tu n'as pas, mais tu n'arrêtes pas de répéter que les libristes devraient s'opposer à ce jugement. Or, ce jugement me semble parfaitement logique, sur la forme et sur le fond, et parfaitement en accord avec le droit d'auteur et les licences logicielles libres et copyleft. Es-tu certain d'avoir bien compris comment fonctionne le droit d'auteur, les logiciels libres, et les LLM? Si oui, alors ça serait pas mal de présenter clairement ton raisonnement, plutôt que de partir dans tous les sens avec des analogies sur les armes à feu que personne ne comprend.
Si tu veux dire que tu croyais avoir compris que les licences libres te protégeaient de l'analyse du code par des grandes entreprises, et qu'elles interdiraient la diffusion du produit de cette analyse, alors 1) je te crois, mais 2) le problème vient de toi, parce que rien dans le texte de la licence ne permettait de te faire croire ça. Tu t'étais donc fourvoyé et tu peux être légitimement dégoûté, mais ça ne sert à rien de t'en prendre à tout le monde, aux libristes qui ne sont pas d'accord avec toi, aux juges, aux grandes entreprises, ou aux LLM.
Au passage, je comprend donc que tu adorerais interdire les couteaux de cuisine (on condamne une mauvaise utilisation de la chose mais pas une autre utilisation). Non merci.
Je viens de réaliser que l'analogie de l'interdiction des armes à feu venait en réponse à mon argument "seules les œuvres de l'esprit sont soumises au droit d'auteur, or les sorties des LLM ne sont pas des œuvres de l'esprit parce que la jurisprudence n'accorde ce titre qu'aux œuvres créees par les humains". Avec toute la meilleure volonté du monde, je ne vois vraiment pas le rapport.
À part de conclure que l'état de droit est frustrant parce que la loi n'interdit pas ce qu'on voudrait bien interdire une fois que c'est arrivé mais qu'on ne peut pas le savoir avant que quelqu'un le fasse, je ne sais pas où tout ça nous amène.
La première étape serait peut-être de proposer une GPL v4 qui interdit d'utiliser le code pour entrainer un algorithme. Ceci dit, cette clause n'est certainement pas compatible avec les libertés fondamentales 2 et 3 des logiciels libres (copier et étudier), ce qui risque de rendre les logiciels sous une telle licence non-acceptable pour plusieurs projets.
Les lois ont été écrites pour les humains, selon ce qu'ils sont capables de faire, alors que les LLM ont la capacité d'ingérer des quantités de données sans commune mesure
Je ne vois pas le rapport. La loi définit la contrefaçon et les peines encourures pour contrefaçon. Or, la sortie des LLM ne correspond pas à la définition de la contrefaçon (ce n'est pas une copie ou un travail dérivé). Tout ce qui n'est pas interdit par la loi est légal, et les LLM sont donc légaux.
Bien sûr, il est possible de changer les lois, et ça sera peut-être fait. Mais ça ne change rien au fait que le fonctionnement des LLM qui mangent des bases de code libre en entrée et qui recrachent du code sans auteur et sans copyright semble légal.
S'il existe déjà un bout code de taille significative qui fait grosso modo ce que le développeur souhaite, je m'attend à ce qu'il soit repompé d'une manière qui ne serait pas autorisé normalement sans LLM.
Tu t'attends mal. Tu ne sais pas comment fonctionnent les LLMs, ce qui n'est pas très grave en soi, mais tu te trompes sur la manière dont ces algorithmes fonctionnent. Ils ne recopient pas des morceaux de code, ils intègrent la logique des données sur lesquelles ils s'entrainent dans un réseau de neurones. Du coup, les bouts de code que tu lui as donnés ne sont pas stockés par le LLM, il n'en extrait qu'une sorte de logique générale. Il fait ensuite passer les requêtes à travers son modèle, et te revoit la sortie.
Ce que tu mentionnes existe (le modèle recrache les données d'entrainement verbatim, comme un moteur de recherche), mais c'est un comportement pathologique (non-souhaité et non-souhaitable): le modèle a été sur-paramétré, le réseau n'a pas été entrainé avec assez de données, et il "colle" trop aux données d'entrainement. Tu peux aussi "provoquer" ce comportement avec des requêtes trop spécifiques (par exemple, au lieu de "tri à bulle", tu demandes "tri à bulle en 5 lignes avec des variables qui s'appellent Titeuf et Koko, et avec une erreur de logique à la ligne 3"). Mais ça reste un comportement buggué, auquel justement tu ne devrais pas t'attendre.
Ouais, ça c'est l'argument pour déréguler la possession une arme à feu en prétendant qu'un outil est innocent et qu'il faut se contenter de condamner une mauvaise utilisation.
On ne parle pas de déréguler les armes à feu, on parle de savoir si la sortie des LLMs peut être considérée comme de la contrefaçon. La loi n'est pas magique, elle interdit certaines choses, et ce qui n'est pas interdit est autorisé. Les licences copyleft sont explicitement publiées pour autoriser l'étude du code, ce que font les LLMs. Elles n'autorisent la publication de versions modifiées que si la même licence est appliquée. Or, les LLMs ne modifient pas le code, elles l'étudient et intègrent leur logique dans un réseau de neurones, qui peut être par la suite utilisé pour générer du code qui diffère du jeu de données d'entrainement (si c'était le même, ça ne serait qu'un moteur de recherche).
Mais LLM ne sont rien d'autre qu'un outil de copiage sophistiqué dont on ignore la source.
Si tu crois qu'un LLM est un moteur de recherche sophistiqué, tu ne peux pas comprendre pourquoi la licence n'est pas conservée en sortie. Mais je ne peux pas l'écrire différemment : un LLM n'est pas un moteur de recherche. C'est un algorithme qui génère quelque chose à partir de patterns qu'il a appris d'un jeu de données. Il ne ressort pas les données, il crée des données nouvelles qui correspondent à une structure qu'il a induite de ses données d'entrainement.
Même si l'utilisateur souhaite respecter les licences, il ne peut pas le faire.
Ça tombe bien : il n'y a aucune licence à respecter, puisque la sortie du modèle n'est pas un travail dérivé ou une contrefaçon. J'ai l'impression que ce qui n'est peut-être pas clair, c'est que tu peux mettre du 100% GPL en entrée, et que la sortie n'a pas de licence. Pourtant, c'est comme ça que fonctionne la propriété intellectuelle. Quand tu apprends à lire, tu mets du 100% copyright en entrée, et ce que tu écris t'appartient à 100% (sauf si tu as copié). Quand tu es musicien, tu mets du 100% de copyright en entrée, et ce qui sort t'appartient à 100% (sauf si tu as copié). Le fait de combiner de multiples sources d'influence ne crée pas quelque chose qui appartient à quelques % à ces sources, ça crée quelque chose qui ne leur appartient plus. C'est comme ça que ça marche avec les humains, et c'est comme ça que ça marche avec les LLM, qui fonctionnent selon le même principe.
Tu peux penser que ça devrait fonctionner autrement, et on pourrait avoir une discussion sur ce sujet. Mais actuellement, à mon avis, la seule interprétation possible de la propriété intellectuelle est que la sortie des LLM n'est ni de la contrefaçon, ni une œuvre originale (puisque pas créé par un humain), et que sa publication ne peut pas être illégale (puisque pas interdite par la loi).
Je ne supporte pas le fait que du code publié en GPL finisse aussi facilement dans des projets non-GPL. Et je suis d'autant plus mécontent que je maudis les LLM.
J'ai bien compris ton opinion, mais je pense (c'est mon avis) que c'est ton incompréhension de ce qu'est la propriété intellectuelle, de ce qu'est la GPL, et de la manière dont les LLM fonctionnent qui te porte à croire ça.
Pour ma part, j'ai du code GPL dans Github et il est donc probable qu'il a été utilisé pour entrainer de nombreux modèles de langage, et ça ne me dérange pas, parce que 1) la possibilité d'étudier et d'apprendre à partir du code est explicitement autorisé et encouragé par la GPL, 2) que la très grande majorité du code que j'ai écrit est trivial et qu'il ne pourrait pas raisonnablement être considéré comme une œuvre de l'esprit devant un tribunal (et donc que la licence que j'ai attribuée au code n'a probablement pas de substance légale), 3) que je n'ai aucun moyen de savoir si une sortie des modèles de langage a été influencée par un bout de réseau pour lequel mon code a affecté les paramètres (en gros, un bout de code qui ressemble au mien a peut-être 9 chances sur 10 de n'avoir aucun lien causal avec mon code, que mon code n'a peut-être pas été inclus dans la base pour une raison ou pour une autre), ce qui prouve bien que ça n'est pas de la contrefaçon (si même moi je ne peux pas savoir, alors comment quelqu'un d'autre le pourrait?).
je maudis les LLM.
Je serais intéressé de savoir si c'est parce que tu penses que leurs résultats sont médiocres ou inutiles, ou inversement parce que tu te sens humilié en tant qu'être humain par l'existence d'algorithmes capables de faire mieux que toi ce que tu pensais maitriser. Étrangement, j'ai l'impression que beaucoup de gens sont sur les deux options en même temps, ce qui me semble assez instable comme point de vue.
L'idée de détester les trucs nouveaux qu'on a du mal à comprendre et qui peuvent modifier l'équilibre de notre vie n'est pas nouvelle, elle est probablement aussi vieille que l'humanité. Mais j'imagine que tu es déja au courant que cette idée n'a jamais gagné; que les nouvelles générations vont s'approprier cet outil et réussir à faire des choses avec, et que tu finiras tes jours malheureux en ronchonnant que c'était mieux avant?
On voit d'ailleurs que la révolution IA n'a pas encore eu lieu. Les LLM servent beaucoup à générer du bullshit publicitaire, des articles de faux journaux, ils servent aux étudiants à tricher, et à tout un tas de gens incompétents de faire croire qu'ils savent faire des choses dont ils sont incapables (écrire du code, écrire une lettre sans faire de faute, ou dans une langue qu'ils ne connaissent pas, etc). Nul doute qu'il existe une utilité marginale à de tels outils (pour remplacer la doc des logiciels, typiquement), mais à ma connaissance, la productivité du secteur tertiaire n'a pas pris 75% en un an. Aucune raison de paniquer, aucune raison de détester un nouvel outil, aucune raison de croire que le monde va changer.
TL/DR: c'est juste l'application des lois existantes à une situation que les législateurs n'avaient pas prévu.
Il va falloir un certain nombre de décisions de justice similaires pour "stabiliser" la situation.
Dans tous les cas, j'ai toujours pensé que c'était la seule issue possible sans modification des lois existantes, pour plusieurs raisons:
1) À ma connaissance, dans la plupart (toutes) les législations qui implémentent la convention de Berne (le socle commun à la propriété intellectuelle dans le monde), la notion de travail dérivé n'est définie que par la similarité d'une oeuvre par rapport à l'original, et pas par le processus qui a permis de créer cette oeuvre (du coup, c'est peut-être le terme de "dérivé" en français qui est trompeur). Un modèle de langage bien paramétré ne ressort pas de morceaux identifiables, et ses sorties ne peuvent donc pas être des oeuvres dérivées. C'est d'ailleurs l'argument qui justifie le jugement dont il est question: les plaignants n'ont pas fourni la preuve que les sorties du modèles étaient dérivées de leur travail.
La propriété intellectuelle ne peut pas être diluée. Elle n'est pas quantitative, soit une oeuvre est protégée, soit elle ne l'est pas. Ça veut dire qu'il est tout à fait possible par exemple d'écrire un texte qui ne contient que des phrases tirées de livres déja publiés, sans que ça soit une contrefaçon. Et c'est probablement déja arrivé, puisqu'une phrase triviale ("Il prit son chapeau et ferma la porte derrière lui") a toutes les chances d'avoir déja été écrite. Du coup, un code composé de lignes qui sont toutes tirées de sources sous GPL n'est pas nécessairement sous GPL. C'est une profonde incompréhension de la nature de la propriété intellectuelle que d'imaginer que c'est nécessairement le cas.
2) Il ne faut pas oublier que seules les oeuvres de l'esprit originales sont protégées par le droit d'auteur. Parfois on oublie ça, parce qu'on applique une licence à un ensemble de fichiers, mais il est très peu probable que vos .h qui contient des constructeurs, des destructeurs, et des méthodes triviales, soient en fait protégés par le droit d'auteur. Seuls les algorithmes un peu élaborés, les designs spécifiques à un problème donné, les optimisations un peu chiadées, etc. sont susceptibles d'ouvrir des droits d'auteur. Même si vous pouviez prouver qu'un LLM ressort une de vos fonctions telles quelles, il faudrait en plus démontrer que cette fonction est originale (par exemple, qu'elle est unique dans la base de données). Si la base de données de code contient 57 implémentations du tri à bulle et que l'IA a sorti celles avec vos noms de variables, ça ne veut pas dire qu'il y a eu contrefaçon.
3) L'aspiration de bases de données de code libre, qui est souvent reprochée à ces modèles, est tout à fait compatible avec la très grande majorité des licences libres. "Je ne voulait pas que mon code sous GPL serve à entrainer les modèles de langage" n'est pas un argument. Une modification des licences libres est peut-être envisageable, mais en tout cas l'argument n'est pas opposable.
Bref, je pense que la jurisprudence qui va s'établir va être assez claire : 1) l'inclusion de code dans une base de données destinée à l'entrainement de LLM ne constitue pas une violation de la propriété intellectuelle des auteurs du code (la question reste ouverte pour la base de données aspirée, mais on passe aux droits voisins, et en tout cas ça ne concerne pas les auteurs du code). 2) Sauf similarité dûment démontrée dans les sorties d'un modèle mal paramétré (comme l'étaient les premières versions de Copilot, si je me souviens bien), le code produit par une IA n'est pas soumis au code de la propriété intellectuelle (parce que ça n'est pas une oeuvre de l'esprit).
Ça me semble assez évident quand on lit le code de la propriété intellectuelle par exemple, mais je ne suis pas juriste et bien sûr les juges considèrent aussi autre chose que la loi. Mais en tout cas, j'ai l'impression que la plupart des arguments de ceux qui pensent que "ça devrait être interdit" n'ont pas de base légale, et qu'ils s'exposent à de grosses désillusions s'ils pensent que quelque chose comme "Je ne voulais pas que mon code soit réutilisé par des grosses boîtes pour faire du pognon" est un argument recevable.
Il y a d'ailleurs un point "philosophique" qui me semble intéressant : prétendre que la sortie d'un LLM peut violer sa propriété intellectuelle me semble quasiment auto-contradictoire. Par définition, la propriété intellectuelle ne s'applique qu'aux oeuvres de l'esprit (que la jurisprudence considère comme uniquement humain, pas de copyright sur les dessins de chimpanzés etc). Or, les sorties d'une IA ne peuvent pas être protégées par le droit d'auteur, parce que justement elles ne sont pas des oeuvres de l'esprit (sortir une sorte de code consensus ne peut produire qu'un code trivial qui ne reflète pas la personnalité de son auteur). Comment peut-on donc prétendre qu'un code suffisamment original pour être protégé par le droit d'auteur peut ressortir d'une IA d'une manière suffisamment similaire pour être une contrefaçon? (encore une fois, sauf si l'IA n'a pas été surparamétrée, ce qui est un problème technique qui peut en effet s'apparenter à de la contrefaçon)? À mon avis, il faut un raisonnement particulièrement précis pour s'en sortir. Par exemple, les "artistes numériques" prétendent que c'est le texte d'invocation de l'IA qui est l'oeuvre de leur esprit, et qui justifieraient la protection de la sortie de l'IA. Mais ça, ça permet d'attribuer une propriété à l'utilisateur de l'IA, ce qui est assez différent de la question du droit sur le bout de code qui sort d'une requête triviale.
L'empathie […] est la reconnaissance et la compréhension des sentiments et des émotions d'un autre individu.
Le Robert:
Capacité de s'identifier à autrui dans ce qu'il ressent.
Wiktionnaire:
Capacité de comprendre, de ressentir les sentiments ou de se mettre à la place d’une autre personne.
Larousse:
Faculté intuitive de se mettre à la place d'autrui, de percevoir ce qu'il ressent.
Du coup, oui, par définition, l'empathie ne peux s'appliquer qu'à des individualités. Je ne comprends pas ce que tu entends pas "humanité dans son ensemble". Tu veux peut-être dire quelque chose comme "compassion"? La compassion peut être ressentie envers un groupe de personnes, par exemple.
Si on n'utilise pas les mêmes définition, c'est sûr qu'on ne risque pas de se comprendre!
oserais-je faire remarquer l'utilisation générique de "il" dans toutes ces définitions? :-)
On pourrait imaginer que n'importe quelle consultation chez un généraliste entraîne un prélèvement et des tests systématiques
Pas forcément, parce qu'il faudrait que le coût soit justifié médicalement, ce qui est probablement le cas pour le diabète, mais pas par l'identification des variants de rhinovirus. Je pensais juste à un protocole d'échantillonnage scientifique, et pas à une remontée de cas spontanée. Par exemple, tirer au sort un généraliste sur 1000 et lui faire faire ces tests suffirait probablement largement. Mieux, tirer des gens au hasard (et pas des malades qui consultent).
Un exemple que je trouve assez symptomatique, c'est les "symptomes grippaux". Pas besoin d'identifier le virus, puisque le traitement est le même. Sauf que, mine de rien, savoir qu'on a la grippe, le covid, ou le VRS, ça permet de déterminer qui on peut cotoyer ou non (vieux ou bébés), ça détermine aussi le bénéfice de la vaccination à l'hiver qui suit. Et en plus ça permet d'anticiper le diagnostic sur les 12 vieux qui vont le chopper en salle d'attente.
Le VRS par exemple, c'est exactement le truc qu'on a complètement raté parce qu'on n'étudie pas les virus respitatoires. On s'est créés une génération de gamins asthmatiques parce que "le rhume c'est pas grave" : pas d'identification du virus, pas de tests, pas d'exclusion des crèches et des écoles, pas d'isolement. Forcément, on considère que 1) pour comprendre les maladies, il faut étudier les malades, 2) les maladies on les connait, elles sont dans les livres de médecine, 3) les traitements contre les virus sont identiques (il n'y en a quasiment pas, en fait), donc la connaissance des souches virales n'a aucune indication médicale. En gros, on ne fait que de l'épidémiologie appliquée à la médecine, ce qui ne permet pas de détecter les nouvelles maladies, de comprendre comment elles se propagent, ou comment on pourrait limiter leur propagation. En 2020, on en était exactement au même point qu'en 1920 pour la grippe espagnole : on met un chiffon devant le nez et on pshit des huiles essentielles; si on est à 3m de distance c'est bon. Vous avez vu par exemple des purificateurs d'air achetés par l'éducation nationale, depuis? Bah non, pas besoin, ils se lavent les mains, c'est bien connu, les virus respiratoires s'attrappent par les mains. Bon, OK, c'est pas "connu", c'est juste ce qu'on dit depuis 100 ans sans jamais l'avoir vérifié, mais c'est comme ça qu'on fait de la science en médecine.
Bah là je ne te comprends pas. Le respect des droits humains est totalement dissociable de l'empathie, autrement, ça serait terrible : tu ne défendrait le respect des droits de l'Homme qu'envers ceux pour lesquels tu ressens de l'empathie? Je suis pour que les pédonazis criminels de guerre aient droit à un procès équitable, mais s'ils ne veulent pas être appelés pédonazis parce que ça les offense, bah je m'en ballec, je les appelle comme je veux.
Au final, qui décide à quelles demandes tu accèdes et quelles demandes tu refuses? Tu utilises ton libre arbitre. Est-ce que "il" ou "elle" c'est raisonnable, et pas "iel"? Ou "il" le jour et "elle" la nuit? Ou "Mademoiselle", "Rajah", "Herr Doktor", "Monsieur le Président", "Skippy le Grand Gourou" ou "Maître de l'Univers"? Tu tranches bien à un endroit, et d'autres personnes trancheront à un autre endroit, ça n'est pas par manque d'empathie ou par manque de respect. À la limite, c'est bien plus irrespecteux d'utliliser le pronom souhaiter tout en pensant que c'est ridicule. Et en tout cas, tu peux toujours défendre que les gens ont des droits fondamentaux qui méritent d'être respectés indépendamment de la manière dont ils veulent se faire appeler.
N'est-ce pas une des bases du fascisme? Qui peut être autant d'extrême gauche comme d'extrême droite comme le passé nous l'a montré?
Honnêtement, je ne vois pas à quelle expérience générale de "fascisme d'extrême gauche" tu fais référence. On sait que les expériences communistes ont systématiquement tourné vers le totalitarisme, mais on n'y trouve normalement pas les marqueurs du fascisme (traditionalisme, xénophobie, etc), même si on se rapproche sur d'autres points (paranoïa politique, anti-pacifisme…). C'est pour ça que j'ai écrit que ça pourrait se rapprocher, mais ne me faites pas dire ce que je n'ai pas dit, le "wokisme" n'est pas une forme de fascisme.
Ça me fait penser à une série d'affichettes "anti-sexistes" exposées à mon boulot. En plus de situations de "sexisme ordinaire" au boulot, illustrant des comportements fréquents qui génèrent une pression "masculiniste" dans le cadre professionnel, quelques situations illustrent également la vie privée (par exemple un type qui demande à sa femme de s'habiller différemment). Et c'est là que je trouve que ça déconne sec quand même : quoi qu'on puisse penser des types qui règlementent la tenue vestimentaire de leur nana, la pensée progressiste ne peut pas prétendre règlementer les conversations privées, ou ce que les gens font au plumard, et avec qui ils le font. C'est très bien de viser la parité dans un comité d'administration, mais c'est légitime de ne pas avoir de parité dans un groupe d'amis qui partent au camping. Je pense que ça illustre pas mal comment on peut partir plein de bonnes intentions et continuer sur sa lancée sans s'apercevoir qu'on va beaucoup trop loin, et que le projet de société qu'on propose n'est qu'une énième avatar de totalitarisme: on peut concevoir un totalitarisme progerssiste (je pense que c'est ça, le "wokisme", en fait), même s'il est peu probable qu'un tel mouvement puisse obtenir un réel pouvoir politique.
Dans le he-gate dont on parle, on n'est pas loin de ça : refuser un patch qui change 5 occurences de "he" en "they" dans une doc confidentielle d'un logiciel pas très connu est décrit comme un acte exécrable, qui conduit à des accusations de mysogynie et de transphobie. On sent bien qu'il y a derrière ça une volonté normative, pleine de bonnes intentions probablement, mais quasi-totalitaire quand même. C'est ce quasi-totalitarisme qui me refroidit : c'est peut-être OK pour he/they sur le fond, mais qu'est-ce qu'on fait pour le point médian, pour la féminisation des noms de métiers, pour la grammaire "neutre" (iels, celleux, etc?). Est-ce que publier un document qui ne suit pas une norme sociale progressiste va forcément induire le risque d'être pointé du doigt et harcelé jusqu'à ce qu'on accepte cette nouvelle "norme"? Ça ne correspond pas vraiment à ma conception du progressisme…
Si tu penses vraiment que face au comportement d'un dev qu'on désapprouve, la bonne attitude c'est de ne pas faire de bruit et de juste l'ignorer, pourquoi est-ce que la bonne attitude devant un contributeur potentiel qui exprime son malaise c'est de lui expliquer qu'il a tort?
Sauf que ça n'est pas du tout comme ça que ça s'est passé. Quelqu'un a soumis un patch pour modifier toute la doc sans que personne ne lui ai demandé et sans en avoir discuté, le dev a répondu "c'est une contribution cosmétique motivée par un agenda politque et je ne marche pas dans la démarche", et c'est tout. Aucun contributeur ou utilisateur régulier n'a contacté la ML des devs pour demander d'où ça venait et si les devs pensaient que c'était une bonne idée de changer.
Mon interprétation c'est que le dev s'intéresse à ses vrais utilisateurs, et il ne donne pas suite aux contributions dont l'objectif principal n'est pas d'améliorer le logiciel. On peut désaprouver, mais c'est assez pathétique d'aller l'accuser de mysogynie ou de transphobie, et d'aller faire du buzz sur les rézosocio. De toutes façons, personne n'utilisait ce soft avant, donc ça ne va rien changer, et c'est bien parce que tout le monde le sait que la campagne s'est transformée en dénigrement et en incitation au boycott ou à pourrir les ML.
C'est ce qui est pratique avec les discriminations, c'est que quand on est blanc chrétien hétérosexuel dans un pays développé, on a le luxe de pouvoir s'en foutre.
On a au moins le luxe de la pensée quantitative. Entre une discrimination à l'embauche et le choix des pronoms dans la doc d'un logiciel, il y a une petite différence qui pourrait bien expliquer qu'on s'intéresse à la première et qu'on se foute totalement de la seconde.
Bref, ce sont des débats sans fin pour des projets techniques qui ne nous appartiennent pas. Le meilleur moyen d'exprimer votre désapprobation est de ne pas les utiliser.
Moi j'irais même plus loin : poussée à l'extrême, la pensée progressiste peut avoir des relents normatifs quasiment fascistes. L'idée n'est plus de convaincre par des arguments (du style "attention, votre doc considère que le lecteur ne peut être qu'un homme, or certaines femmes utilisent votre logiciel et il faudrait savoir si elles ne se sentent pas offensées par ce choix"), mais d'imposer ("vous devez faire comme ça, si vous ne le faites pas c'est que vous êtes un sale xyz-phobe, et je vais demander à mes copains de parler de vous partout sur les rézosocio pour que vous souffriez de ne pas m'avoir obéi".
On est dans un registre qui a abandonné depuis longtemps la bienveillance: l'opposition, ou même l'indifférence, aux thèmes progressistes du moment, est devenue insupportable pour certains militants, qui ne sont plus dans une démarche de conviction, mais dans une démarche de faire appliquer par la contrainte. Parfois ils n'y arrivent pas, parce qu'ils ne sont pas tout-puissants, mais la méthode est quand même inquiétante.
Si tu as un minimum d'empathie tu ne peux pas être l'indifférent à leurs droits et t'en foutre de la question des pronoms.
Donc on parle bien de droits ou pas? Ou alors je ne vois vraiment pas où tu veux en venir. Ou alors, tu veux dire qu'il faut de l'empathie pour ne pas être indifférent à la question des pronoms, de manière indépendante des droits? Auquel cas on est peut-être d'accord; en effet, les histoires de pronoms n'ont rien à voir avec les droits, c'est plus une histoire de politesse ("que penserait une femme qui lit cette doc dans laquelle je considère que le lecteur est un homme?").
Si tu as un minimum d'empathie tu ne peux pas être l'indifférent à leurs droits et t'en foutre de la question des pronoms.
Je ne suis pas certain de comprendre la phrase, mais pourquoi? Ce n'est pas très difficile de distinguer ce qui est du ressort des droits fondamentaux et ce qui est une question d'inconfort vis-à-vis du reste de la société. Pour revenir dans le contexte, ici il s'agit d'une documentation écrite comme si le lecteur ne pouvait être qu'un homme. On peut trouver ça idiot ou y être indifférent, une utilisatrice du logiciel pourrait s'en trouver mal à l'aise, et en effet, on pourrait même dire que ça contribue à maintenir une sorte d'ambiance pas très paritaire dans le monde du logiciel. Mais considérer que des droits sont bafoués, ça revient à judiciariser une situation qui est parfaitement compatible avec la vie de tous les jours; par contraste, ça revient également à assimiler des vraies violations des droits avec une chose aussi ridicule que l'utilisation de mauvais pronoms dans une doc.
Bon, encore une fois, on ne parle pas d'intolérance. On ne parle que de quelqu'un qui refuse de suivre le délire de quelques uns sur ces histoires de pronoms. Ces espèces de "faux ennemis" sont faciles à identifier et à harceler, ce sont des cibles faciles parce qu'ils sont inoffensifs. C'est beaucoup plus difficile de s'attaquer aux milieux masculinistes, parce qu'eux sont de vrais méchants.
faire l'apologie de l'indifférence quant à leurs droits
En ce qui me concerne, je ne suis absolument pas indifférent aux droits des femmes et des trans. Par contre, je me fous royalement de ces histoires de pronoms. Je pense que des gens pourtant bien intentionnés se sont complètement emmélé les neurones et finissent par casser les pieds de tous avec des choses qui n'ont aucun intérêt, ce qui génère des réactions négatives à leur égard, qu'ils interprètent (à tort) comme une réaction contre la cause qu'ils défendent.
bref, accepter la différence entre être xyz-phobe et être "militant·e xyz-phobe", ce n'est pas nécessairement accepter la xyz-phobie comme étant une loi de la nature.
Personne n'a dit ça, au contraire même : quand des gens qui ne sont pas xyz-phobes en viennent à penser que les "militants xyz" sont infréquentables, il y a peut-être un petit problème dans la stratégie de communication.
Par exemple, je pense que j'aurais le même plaisir à faire bouffer des poignées de points médiants à ceux qui ne peuvent pas s'empêcher de montrer à quel point leur militantisme est supérieur aux règles de typographies établies, que ça soit des hommes, des femmes, ou des trans.
Le gars n'a pas répondu qu'il détestait les femmes et qu'il refusait pour cette raison. Il dit très clairement qu'il s'en fout, et qu'il ne veut pas de contributions motivées par un agenda politique.
Il n'est pas mysogyne ou transphobe. Il ne méprise pas les trans ou les femmes, il méprise les gens qui n'ont pas d'autres occupations que de modifier les pronoms dans les docs de logiciels. C'est certainement vexant pour les gens qui pensent que c'est important de modifier les pronoms, mais ça n'a rien à voir avec ce dont on l'accuse.
Des combats fondamentaux qui n'intéressent qu'une faible partie de la population, il y en a des centaines. Ça vaut pour la souffrance animale, pour l'extension des zones de chalutage, pour les conditions de travail des enfants au Pakistan… et même pour le logiciel libre.
Tu ne peux pas en vouloir à quelqu'un parce qu'il t'explique que ton combat, il s'en fout. Il ne dit pas que tu as tort, il dit qu'il s'en fout.
Je pense que ton problème, c'est de n'avoir que des gens qui s'investissent dans le même combat parmi tes proches. À force, on finit par croire que son combat est universel, et on ne comprend pas pourquoi la société n'avance pas plus vite. On étiquette les gens qui s'en foutent comme "mysogynes" ou "transphobes", sans s'apercevoir que c'est son comportement qui est problématique. On a tous connu une voisine mémé à chats qui a 35 chats et qui ne parle que de chats, qui recueille les chats abandonnés, qui milite pour tout un tas de trucs sur les chats, et qui classe les gens en "personnes qui aiment les chats" et "méchants". Bah voila, ce genre de personnes sont des "maniaques"; ce n'est pas que les gens sont "chatphobes" quand ils la traitent de maniaque, c'est juste qu'ils sont lucides sur l'importance relative de son "combat" par rapport aux autres combats à mener.
Bref, il faut au moins accepter qu'il y a une différence entre être "Xphobe" et être "Militant pour X phobe". On peut aimer les chats et ne pas aimer les mémés à chat maniaques, on peut utiliser une forme d'écriture inclusive tout en trouvant insupportables les militants de l'écriture inclusive.
J'avoue que je ne comprends pas trop l'argument. Il faut bien une raison pour recoder un truc existant de zéro, bonne ou mauvaise.
- C'est un exercice (l'objectif n'est pas d'obtenir un logiciel compétitif, mais d'apprendre en codant un truc)
- C'est une expérience (tenter une implémentation ou une méthode de développement théorique qui n'a pas été testée en pratique)
- L'existant a des défauts qui ne sont pas corrigeables (sécurité, perfs)
- L'existant est tellement complexe qu'il est plus simple de recoder que de s'approprier le code
- L'architecture de l'existant empêche l'implémentation de nouvelles fonctions
- La licence de l'existant n'est pas acceptable
Peut-être d'autres raisons existent. Mais "parce que voila" me semble un peu léger, on parle de millions d'euros et de dizaines de milliers d'heures de travail…
En plus, les 3/4 se ressemblent déjà visuellement alors je n'y vois peu d'intérêt à en faire un énième sur le même moteur.
J'ai peut-être loupé un épisode, mais n'est-il pas normal que le rendu de tous les moteurs se ressemblent quand la norme définit exactement ce que doit être le rendu d'une page, parfois au pixel près? Je trouve que l'argument inverse serait plutôt pertinent, il existe déja plusieurs moteurs qui ont un rendu conforme à la norme, à quoi peut bien servir d'en recoder un qui, par la force des choses, aura aussi un rendu conforme à la norme?
Les statistiques sont une branche des mathématiques, donc oui, c'est un outil scientifique. Ce dont on parle n'a pas grand chose à voir avec les statistiques, c'est juste une histoire de collecte de données. Normalement, les données sont collectées selon un protocole expérimental : on définit à l'avance la procédure d'échantillonnage, le temps sur lequel les données sont collectées, etc., en fonction des objectifs scientifiques. Par exemple, la recherche de coronavirus dans les eaux des égouts correspond à un tel protocole : on ne choisit pas les points de collecte au hasard, on a un budget, on sait combien de tests on peut faire par jour, et on détermine où et quand on échantillonne.
Pour la "surveillance" dont on parle, c'est plutôt des données qui remontent spontanément et sporadiquement, sans protocole d'échantillonnage et sans procédure normalisée. Alors oui, la mode est à la science participative et à l'application de modèles statistiques élaborés ou de boîtes noires style "machine learning" pour essayer de contrebalancer les biais de données foireuses, mais tout ça ne sera jamais équivalent à la collecte de données "propres".
En gros, c'est comme ça que je définis "scientifique" : un échantillonnage qui suit un protocole élaboré par des scientifiques en fonction d'un objectif.
Ça me semble très conceptuel ton truc. J'ai l'impression que toute confrontation avec le monde réel va simplement le faire exploser.
D'abord, les lois ne sont pas conçues pour être complexes. Elles le deviennent au fil de l'accumulation d'amendements et de lois rectificatives.
Ensuite, les lois sont issues d'un compromis entre des centaines de personnes (gouvernement, députés, sénateurs, syndicats, lobbys et groupes citoyens…). Tu n'as pas Linus tout seul dans son garage qui va te créer un nouvel OS selon sa logique. Chaque commit doit être discuté et modifié jusqu'à atteindre un consensus majoritaire parmi une population très hétérogène et très divergente idéologiquement.
Enfin, les exceptions font partie intégrante de la loi. Prends par exemple le code de la propriété intellectuelle. Une grande partie de ce qui permet une sorte d'équilibre entre la population et les ayant-droit vient justement d'une liste d'exceptions (qui sont réellement appelées "exceptions" dans la loi) : citation, caricature, copie privée… C'est ça que tu voudrais éviter, par exemple? Un code de la propriété intellectuelle qui dit "Les auteurs ont tous les droits, il n'y a pas d'exception"? Idem pour la légitime défense, c'est un exemple idéal de branchement conditionnel.
Pour les lois fiscales, bien sûr que tu veux des exceptions, tu en veux plein, et tu veux pouvoir en ajouter en fonction de l'évolution de la société. Tu peux vouloir des exonérations pour les handicapés, pour les DOM/TOM, pour les dons, pour le mécénat, pour les veuf/ves de guerre, pour les étrangers qui payent déja leurs impôts chez eux, pour les énergies renouvelables… Bref, tu veux utiliser la loi pour inciter les comportements vertueux ou pour diminuer les inégalités. C'est l'essence des lois de proposer des exceptions.
Pour le revenu universel que tu prenais en exemple, son fonctionnement entre en contradiction avec les régimes assurantiels de l'État : assurance maladie (arrêts de travail), assurance vieillesse, assurance chômage. Ce sont des régimes qui prévoient une indemnisation qui dépend de la cotisation, ce qui n'est pas compatible avec un revenu universel. Tu peux donc 1) supprimer les régimes assurantiels de l'État (et donc privatiser la sécurité sociale, les retraites, et l'assurance chômage, puisque les gens voudront nécessairement s'assurer en fonction de leurs revenus afin de conserver une partie de leur train de vie), 2) les superposer au revenu universel (tu n'as donc rien simplifié du tout, au contraire), 3) déroger au revenu universel pour les chômeurs, les retraités, et les malades (et donc, faire en sorte que le revenu universel n'est pas tellement universel, sans compter que du coup tu n'as rien simplifié).
Bienvenu dans le monde réel! Le monde réel est complexe, et ce n'est pas une vague analogie avec une base de code qui peut te permettre de comprendre pourquoi.
ça te convient, OK, juste pas moi qui pense juste que faire un truc simple sans surprise serait vachement plus aidant à ce que le peuple ne soit pas dégoûté de la politique.
Parce que tu considères peut-être qu'une équation en taux = A/(B+exp(-Cx)) avec A, B, et C des coefficients qui dépendent du nombre de tes enfants et de ton lieu d'habitation, c'est plus simple qu'un système d'abattement de type taux = 0 si x < A; taux = 6.2% si A < x < B, taux = 8.3% si x > B. Tu n'es pas sorti des accusations de technocratie…
Encore une fois, comment voudrais-tu te débarrasser des effets de seuil? "Faire simple", c'est juste des mots. Tu vois bien que dès qu'on propose un système plus simple (par exemple, le revenu universel), après 5 minutes tu commences à y coller tout un tas de couches de complexité (tu exclus les chômeurs parce que l'indemnisation chômage est une assurance, tu exclus les étrangers qui ont résidé moins de 5 ans en France (et paf, un bel effect seuil à 5 ans), tu ajoutes des restrictions pour les héritiers, pour les oeuvres d'art, des niches fiscales pour les dons, pour le mécénat… et pouf, revoila ton système tout plein de noeuds avec des stratégies d'optimisation.
Non, mais je suis complètement d'accord, la surveillance médicale existe. Tu as les statistiques de tests de Covid + et de l'évolution des consultations pour symptomes grippaux, c'est pratique pour coordonner les soins et anticiper les arrivées de patients dans les hopitaux, mettre en place des mesures, etc.
Mais ça n'a rien à voir avec la connaissance scientifique sur la circulation des centaines de souches virales respiratoires. Savoir qu'il y a une augmentation des cas grippaux, c'est bien quand tu es médecin et que tu veux soigner des gens, mais ça ne t'apporte aucune connaissance scientifique.
[^] # Re: Émission aux frais du diffuseur
Posté par arnaudus . En réponse au journal L'ARCOM va-t-elle virer Bolloré du PAF ?. Évalué à 10.
Non, je pense que tu te trompes. L'État a son mot à dire parce que les fréquences sont un bien public (le nombre de chaines est contraint par une limite physique, et l'État doit arbitrer pour attribuer les canaux de diffusion), mais les chaines payent un loyer pour diffuser (compenser les coûts de diffusion).
[^] # Re: Clarification bienvenue
Posté par arnaudus . En réponse au lien Judge dismisses DMCA copyright claim in GitHub Copilot suit. Évalué à 4.
Tu as parfaitement raison. Ça marche avec les deux bouts de phrases indépendamment, mais personne ne les avait jamais mis ensemble! :-)
Ceci dit, l'originalité de la citation ne permet pas forcément de prouver la contrefaçon, puisqu'il reste possible d'assembler ces deux bouts de phrase par hasard. Et par dessus tout, il est peu probable qu'une phrase aussi triviale puisse être qualifiée d’œuvre de l'esprit. Ça n'est pas une question de longueur, puisque "Les sanglots longs des violons de l'automne" est clairement une œuvre de l'esprit, alors que "J'ai vachement mal au bide ce matin", probablement pas :-)
[^] # Re: Clarification bienvenue
Posté par arnaudus . En réponse au lien Judge dismisses DMCA copyright claim in GitHub Copilot suit. Évalué à 4.
Bah c'est assez fréquent en fait, donc tu ne devrais pas être surpris. Sur un répertoire OpenSource par exemple https://www.mend.io/blog/open-source-licenses-trends-and-predictions, les licences les plus populaires sont Apache (30%), suivi par MIT (26%), puis GPL v2 et v3 (à peu près 10% chacune). Donc le "copyleft" n'est souvent pas majoritaire parmi les licences libres; ça dépend évidemment du type de répertoire et de la manière dont on compte.
Mais de toutes manières, l'argument n'est pas que le jugement viole les licences copyleft. Le jugement me semble tout à fait compatible avec l'esprit et la lettre des licences libres copyleft! C'est juste que des gens n'ont pas compris le droit d'auteur et/ou les licences libres et/ou le fonctionnement des LLM. Moi j'utilise les licences copyleft et je ne me suis jamais attendu à ce que la sortie d'un LLM puisse être sous une quelconque licence, pour toutes les raisons que j'ai évoquées au dessus. Donc tu n'arrêtes pas de dire qu'on te prête des idées que tu n'as pas, mais tu n'arrêtes pas de répéter que les libristes devraient s'opposer à ce jugement. Or, ce jugement me semble parfaitement logique, sur la forme et sur le fond, et parfaitement en accord avec le droit d'auteur et les licences logicielles libres et copyleft. Es-tu certain d'avoir bien compris comment fonctionne le droit d'auteur, les logiciels libres, et les LLM? Si oui, alors ça serait pas mal de présenter clairement ton raisonnement, plutôt que de partir dans tous les sens avec des analogies sur les armes à feu que personne ne comprend.
Si tu veux dire que tu croyais avoir compris que les licences libres te protégeaient de l'analyse du code par des grandes entreprises, et qu'elles interdiraient la diffusion du produit de cette analyse, alors 1) je te crois, mais 2) le problème vient de toi, parce que rien dans le texte de la licence ne permettait de te faire croire ça. Tu t'étais donc fourvoyé et tu peux être légitimement dégoûté, mais ça ne sert à rien de t'en prendre à tout le monde, aux libristes qui ne sont pas d'accord avec toi, aux juges, aux grandes entreprises, ou aux LLM.
[^] # Re: Clarification bienvenue
Posté par arnaudus . En réponse au lien Judge dismisses DMCA copyright claim in GitHub Copilot suit. Évalué à 3.
Je viens de réaliser que l'analogie de l'interdiction des armes à feu venait en réponse à mon argument "seules les œuvres de l'esprit sont soumises au droit d'auteur, or les sorties des LLM ne sont pas des œuvres de l'esprit parce que la jurisprudence n'accorde ce titre qu'aux œuvres créees par les humains". Avec toute la meilleure volonté du monde, je ne vois vraiment pas le rapport.
À part de conclure que l'état de droit est frustrant parce que la loi n'interdit pas ce qu'on voudrait bien interdire une fois que c'est arrivé mais qu'on ne peut pas le savoir avant que quelqu'un le fasse, je ne sais pas où tout ça nous amène.
La première étape serait peut-être de proposer une GPL v4 qui interdit d'utiliser le code pour entrainer un algorithme. Ceci dit, cette clause n'est certainement pas compatible avec les libertés fondamentales 2 et 3 des logiciels libres (copier et étudier), ce qui risque de rendre les logiciels sous une telle licence non-acceptable pour plusieurs projets.
[^] # Re: Clarification bienvenue
Posté par arnaudus . En réponse au lien Judge dismisses DMCA copyright claim in GitHub Copilot suit. Évalué à 7.
Je ne vois pas le rapport. La loi définit la contrefaçon et les peines encourures pour contrefaçon. Or, la sortie des LLM ne correspond pas à la définition de la contrefaçon (ce n'est pas une copie ou un travail dérivé). Tout ce qui n'est pas interdit par la loi est légal, et les LLM sont donc légaux.
Bien sûr, il est possible de changer les lois, et ça sera peut-être fait. Mais ça ne change rien au fait que le fonctionnement des LLM qui mangent des bases de code libre en entrée et qui recrachent du code sans auteur et sans copyright semble légal.
Tu t'attends mal. Tu ne sais pas comment fonctionnent les LLMs, ce qui n'est pas très grave en soi, mais tu te trompes sur la manière dont ces algorithmes fonctionnent. Ils ne recopient pas des morceaux de code, ils intègrent la logique des données sur lesquelles ils s'entrainent dans un réseau de neurones. Du coup, les bouts de code que tu lui as donnés ne sont pas stockés par le LLM, il n'en extrait qu'une sorte de logique générale. Il fait ensuite passer les requêtes à travers son modèle, et te revoit la sortie.
Ce que tu mentionnes existe (le modèle recrache les données d'entrainement verbatim, comme un moteur de recherche), mais c'est un comportement pathologique (non-souhaité et non-souhaitable): le modèle a été sur-paramétré, le réseau n'a pas été entrainé avec assez de données, et il "colle" trop aux données d'entrainement. Tu peux aussi "provoquer" ce comportement avec des requêtes trop spécifiques (par exemple, au lieu de "tri à bulle", tu demandes "tri à bulle en 5 lignes avec des variables qui s'appellent Titeuf et Koko, et avec une erreur de logique à la ligne 3"). Mais ça reste un comportement buggué, auquel justement tu ne devrais pas t'attendre.
On ne parle pas de déréguler les armes à feu, on parle de savoir si la sortie des LLMs peut être considérée comme de la contrefaçon. La loi n'est pas magique, elle interdit certaines choses, et ce qui n'est pas interdit est autorisé. Les licences copyleft sont explicitement publiées pour autoriser l'étude du code, ce que font les LLMs. Elles n'autorisent la publication de versions modifiées que si la même licence est appliquée. Or, les LLMs ne modifient pas le code, elles l'étudient et intègrent leur logique dans un réseau de neurones, qui peut être par la suite utilisé pour générer du code qui diffère du jeu de données d'entrainement (si c'était le même, ça ne serait qu'un moteur de recherche).
Si tu crois qu'un LLM est un moteur de recherche sophistiqué, tu ne peux pas comprendre pourquoi la licence n'est pas conservée en sortie. Mais je ne peux pas l'écrire différemment : un LLM n'est pas un moteur de recherche. C'est un algorithme qui génère quelque chose à partir de patterns qu'il a appris d'un jeu de données. Il ne ressort pas les données, il crée des données nouvelles qui correspondent à une structure qu'il a induite de ses données d'entrainement.
Ça tombe bien : il n'y a aucune licence à respecter, puisque la sortie du modèle n'est pas un travail dérivé ou une contrefaçon. J'ai l'impression que ce qui n'est peut-être pas clair, c'est que tu peux mettre du 100% GPL en entrée, et que la sortie n'a pas de licence. Pourtant, c'est comme ça que fonctionne la propriété intellectuelle. Quand tu apprends à lire, tu mets du 100% copyright en entrée, et ce que tu écris t'appartient à 100% (sauf si tu as copié). Quand tu es musicien, tu mets du 100% de copyright en entrée, et ce qui sort t'appartient à 100% (sauf si tu as copié). Le fait de combiner de multiples sources d'influence ne crée pas quelque chose qui appartient à quelques % à ces sources, ça crée quelque chose qui ne leur appartient plus. C'est comme ça que ça marche avec les humains, et c'est comme ça que ça marche avec les LLM, qui fonctionnent selon le même principe.
Tu peux penser que ça devrait fonctionner autrement, et on pourrait avoir une discussion sur ce sujet. Mais actuellement, à mon avis, la seule interprétation possible de la propriété intellectuelle est que la sortie des LLM n'est ni de la contrefaçon, ni une œuvre originale (puisque pas créé par un humain), et que sa publication ne peut pas être illégale (puisque pas interdite par la loi).
J'ai bien compris ton opinion, mais je pense (c'est mon avis) que c'est ton incompréhension de ce qu'est la propriété intellectuelle, de ce qu'est la GPL, et de la manière dont les LLM fonctionnent qui te porte à croire ça.
Pour ma part, j'ai du code GPL dans Github et il est donc probable qu'il a été utilisé pour entrainer de nombreux modèles de langage, et ça ne me dérange pas, parce que 1) la possibilité d'étudier et d'apprendre à partir du code est explicitement autorisé et encouragé par la GPL, 2) que la très grande majorité du code que j'ai écrit est trivial et qu'il ne pourrait pas raisonnablement être considéré comme une œuvre de l'esprit devant un tribunal (et donc que la licence que j'ai attribuée au code n'a probablement pas de substance légale), 3) que je n'ai aucun moyen de savoir si une sortie des modèles de langage a été influencée par un bout de réseau pour lequel mon code a affecté les paramètres (en gros, un bout de code qui ressemble au mien a peut-être 9 chances sur 10 de n'avoir aucun lien causal avec mon code, que mon code n'a peut-être pas été inclus dans la base pour une raison ou pour une autre), ce qui prouve bien que ça n'est pas de la contrefaçon (si même moi je ne peux pas savoir, alors comment quelqu'un d'autre le pourrait?).
Je serais intéressé de savoir si c'est parce que tu penses que leurs résultats sont médiocres ou inutiles, ou inversement parce que tu te sens humilié en tant qu'être humain par l'existence d'algorithmes capables de faire mieux que toi ce que tu pensais maitriser. Étrangement, j'ai l'impression que beaucoup de gens sont sur les deux options en même temps, ce qui me semble assez instable comme point de vue.
L'idée de détester les trucs nouveaux qu'on a du mal à comprendre et qui peuvent modifier l'équilibre de notre vie n'est pas nouvelle, elle est probablement aussi vieille que l'humanité. Mais j'imagine que tu es déja au courant que cette idée n'a jamais gagné; que les nouvelles générations vont s'approprier cet outil et réussir à faire des choses avec, et que tu finiras tes jours malheureux en ronchonnant que c'était mieux avant?
On voit d'ailleurs que la révolution IA n'a pas encore eu lieu. Les LLM servent beaucoup à générer du bullshit publicitaire, des articles de faux journaux, ils servent aux étudiants à tricher, et à tout un tas de gens incompétents de faire croire qu'ils savent faire des choses dont ils sont incapables (écrire du code, écrire une lettre sans faire de faute, ou dans une langue qu'ils ne connaissent pas, etc). Nul doute qu'il existe une utilité marginale à de tels outils (pour remplacer la doc des logiciels, typiquement), mais à ma connaissance, la productivité du secteur tertiaire n'a pas pris 75% en un an. Aucune raison de paniquer, aucune raison de détester un nouvel outil, aucune raison de croire que le monde va changer.
# Clarification bienvenue
Posté par arnaudus . En réponse au lien Judge dismisses DMCA copyright claim in GitHub Copilot suit. Évalué à 10. Dernière modification le 10 juillet 2024 à 12:42.
TL/DR: c'est juste l'application des lois existantes à une situation que les législateurs n'avaient pas prévu.
Il va falloir un certain nombre de décisions de justice similaires pour "stabiliser" la situation.
Dans tous les cas, j'ai toujours pensé que c'était la seule issue possible sans modification des lois existantes, pour plusieurs raisons:
1) À ma connaissance, dans la plupart (toutes) les législations qui implémentent la convention de Berne (le socle commun à la propriété intellectuelle dans le monde), la notion de travail dérivé n'est définie que par la similarité d'une oeuvre par rapport à l'original, et pas par le processus qui a permis de créer cette oeuvre (du coup, c'est peut-être le terme de "dérivé" en français qui est trompeur). Un modèle de langage bien paramétré ne ressort pas de morceaux identifiables, et ses sorties ne peuvent donc pas être des oeuvres dérivées. C'est d'ailleurs l'argument qui justifie le jugement dont il est question: les plaignants n'ont pas fourni la preuve que les sorties du modèles étaient dérivées de leur travail.
La propriété intellectuelle ne peut pas être diluée. Elle n'est pas quantitative, soit une oeuvre est protégée, soit elle ne l'est pas. Ça veut dire qu'il est tout à fait possible par exemple d'écrire un texte qui ne contient que des phrases tirées de livres déja publiés, sans que ça soit une contrefaçon. Et c'est probablement déja arrivé, puisqu'une phrase triviale ("Il prit son chapeau et ferma la porte derrière lui") a toutes les chances d'avoir déja été écrite. Du coup, un code composé de lignes qui sont toutes tirées de sources sous GPL n'est pas nécessairement sous GPL. C'est une profonde incompréhension de la nature de la propriété intellectuelle que d'imaginer que c'est nécessairement le cas.
2) Il ne faut pas oublier que seules les oeuvres de l'esprit originales sont protégées par le droit d'auteur. Parfois on oublie ça, parce qu'on applique une licence à un ensemble de fichiers, mais il est très peu probable que vos .h qui contient des constructeurs, des destructeurs, et des méthodes triviales, soient en fait protégés par le droit d'auteur. Seuls les algorithmes un peu élaborés, les designs spécifiques à un problème donné, les optimisations un peu chiadées, etc. sont susceptibles d'ouvrir des droits d'auteur. Même si vous pouviez prouver qu'un LLM ressort une de vos fonctions telles quelles, il faudrait en plus démontrer que cette fonction est originale (par exemple, qu'elle est unique dans la base de données). Si la base de données de code contient 57 implémentations du tri à bulle et que l'IA a sorti celles avec vos noms de variables, ça ne veut pas dire qu'il y a eu contrefaçon.
3) L'aspiration de bases de données de code libre, qui est souvent reprochée à ces modèles, est tout à fait compatible avec la très grande majorité des licences libres. "Je ne voulait pas que mon code sous GPL serve à entrainer les modèles de langage" n'est pas un argument. Une modification des licences libres est peut-être envisageable, mais en tout cas l'argument n'est pas opposable.
Bref, je pense que la jurisprudence qui va s'établir va être assez claire : 1) l'inclusion de code dans une base de données destinée à l'entrainement de LLM ne constitue pas une violation de la propriété intellectuelle des auteurs du code (la question reste ouverte pour la base de données aspirée, mais on passe aux droits voisins, et en tout cas ça ne concerne pas les auteurs du code). 2) Sauf similarité dûment démontrée dans les sorties d'un modèle mal paramétré (comme l'étaient les premières versions de Copilot, si je me souviens bien), le code produit par une IA n'est pas soumis au code de la propriété intellectuelle (parce que ça n'est pas une oeuvre de l'esprit).
Ça me semble assez évident quand on lit le code de la propriété intellectuelle par exemple, mais je ne suis pas juriste et bien sûr les juges considèrent aussi autre chose que la loi. Mais en tout cas, j'ai l'impression que la plupart des arguments de ceux qui pensent que "ça devrait être interdit" n'ont pas de base légale, et qu'ils s'exposent à de grosses désillusions s'ils pensent que quelque chose comme "Je ne voulais pas que mon code soit réutilisé par des grosses boîtes pour faire du pognon" est un argument recevable.
Il y a d'ailleurs un point "philosophique" qui me semble intéressant : prétendre que la sortie d'un LLM peut violer sa propriété intellectuelle me semble quasiment auto-contradictoire. Par définition, la propriété intellectuelle ne s'applique qu'aux oeuvres de l'esprit (que la jurisprudence considère comme uniquement humain, pas de copyright sur les dessins de chimpanzés etc). Or, les sorties d'une IA ne peuvent pas être protégées par le droit d'auteur, parce que justement elles ne sont pas des oeuvres de l'esprit (sortir une sorte de code consensus ne peut produire qu'un code trivial qui ne reflète pas la personnalité de son auteur). Comment peut-on donc prétendre qu'un code suffisamment original pour être protégé par le droit d'auteur peut ressortir d'une IA d'une manière suffisamment similaire pour être une contrefaçon? (encore une fois, sauf si l'IA n'a pas été surparamétrée, ce qui est un problème technique qui peut en effet s'apparenter à de la contrefaçon)? À mon avis, il faut un raisonnement particulièrement précis pour s'en sortir. Par exemple, les "artistes numériques" prétendent que c'est le texte d'invocation de l'IA qui est l'oeuvre de leur esprit, et qui justifieraient la protection de la sortie de l'IA. Mais ça, ça permet d'attribuer une propriété à l'utilisateur de l'IA, ce qui est assez différent de la question du droit sur le bout de code qui sort d'une requête triviale.
[^] # Re: dev principal de Ladybird
Posté par arnaudus . En réponse à la dépêche Pour 100 briques t'as plus rien : le navigateur Ladybird reçoit un million de brouzoufs. Évalué à 3. Dernière modification le 05 juillet 2024 à 17:38.
Wikipédia:
L'empathie […] est la reconnaissance et la compréhension des sentiments et des émotions d'un autre individu.
Le Robert:
Capacité de s'identifier à autrui dans ce qu'il ressent.
Wiktionnaire:
Capacité de comprendre, de ressentir les sentiments ou de se mettre à la place d’une autre personne.
Larousse:
Faculté intuitive de se mettre à la place d'autrui, de percevoir ce qu'il ressent.
Du coup, oui, par définition, l'empathie ne peux s'appliquer qu'à des individualités. Je ne comprends pas ce que tu entends pas "humanité dans son ensemble". Tu veux peut-être dire quelque chose comme "compassion"? La compassion peut être ressentie envers un groupe de personnes, par exemple.
Si on n'utilise pas les mêmes définition, c'est sûr qu'on ne risque pas de se comprendre!
oserais-je faire remarquer l'utilisation générique de "il" dans toutes ces définitions? :-)
[^] # Re: Le problème n'est pas que pour la grippe
Posté par arnaudus . En réponse au lien L'humain pourrait être contaminé par la grippe aviaire ?. Évalué à 4.
Pas forcément, parce qu'il faudrait que le coût soit justifié médicalement, ce qui est probablement le cas pour le diabète, mais pas par l'identification des variants de rhinovirus. Je pensais juste à un protocole d'échantillonnage scientifique, et pas à une remontée de cas spontanée. Par exemple, tirer au sort un généraliste sur 1000 et lui faire faire ces tests suffirait probablement largement. Mieux, tirer des gens au hasard (et pas des malades qui consultent).
Un exemple que je trouve assez symptomatique, c'est les "symptomes grippaux". Pas besoin d'identifier le virus, puisque le traitement est le même. Sauf que, mine de rien, savoir qu'on a la grippe, le covid, ou le VRS, ça permet de déterminer qui on peut cotoyer ou non (vieux ou bébés), ça détermine aussi le bénéfice de la vaccination à l'hiver qui suit. Et en plus ça permet d'anticiper le diagnostic sur les 12 vieux qui vont le chopper en salle d'attente.
Le VRS par exemple, c'est exactement le truc qu'on a complètement raté parce qu'on n'étudie pas les virus respitatoires. On s'est créés une génération de gamins asthmatiques parce que "le rhume c'est pas grave" : pas d'identification du virus, pas de tests, pas d'exclusion des crèches et des écoles, pas d'isolement. Forcément, on considère que 1) pour comprendre les maladies, il faut étudier les malades, 2) les maladies on les connait, elles sont dans les livres de médecine, 3) les traitements contre les virus sont identiques (il n'y en a quasiment pas, en fait), donc la connaissance des souches virales n'a aucune indication médicale. En gros, on ne fait que de l'épidémiologie appliquée à la médecine, ce qui ne permet pas de détecter les nouvelles maladies, de comprendre comment elles se propagent, ou comment on pourrait limiter leur propagation. En 2020, on en était exactement au même point qu'en 1920 pour la grippe espagnole : on met un chiffon devant le nez et on pshit des huiles essentielles; si on est à 3m de distance c'est bon. Vous avez vu par exemple des purificateurs d'air achetés par l'éducation nationale, depuis? Bah non, pas besoin, ils se lavent les mains, c'est bien connu, les virus respiratoires s'attrappent par les mains. Bon, OK, c'est pas "connu", c'est juste ce qu'on dit depuis 100 ans sans jamais l'avoir vérifié, mais c'est comme ça qu'on fait de la science en médecine.
[^] # Re: dev principal de Ladybird
Posté par arnaudus . En réponse à la dépêche Pour 100 briques t'as plus rien : le navigateur Ladybird reçoit un million de brouzoufs. Évalué à 5. Dernière modification le 05 juillet 2024 à 14:31.
Bah là je ne te comprends pas. Le respect des droits humains est totalement dissociable de l'empathie, autrement, ça serait terrible : tu ne défendrait le respect des droits de l'Homme qu'envers ceux pour lesquels tu ressens de l'empathie? Je suis pour que les pédonazis criminels de guerre aient droit à un procès équitable, mais s'ils ne veulent pas être appelés pédonazis parce que ça les offense, bah je m'en ballec, je les appelle comme je veux.
Au final, qui décide à quelles demandes tu accèdes et quelles demandes tu refuses? Tu utilises ton libre arbitre. Est-ce que "il" ou "elle" c'est raisonnable, et pas "iel"? Ou "il" le jour et "elle" la nuit? Ou "Mademoiselle", "Rajah", "Herr Doktor", "Monsieur le Président", "Skippy le Grand Gourou" ou "Maître de l'Univers"? Tu tranches bien à un endroit, et d'autres personnes trancheront à un autre endroit, ça n'est pas par manque d'empathie ou par manque de respect. À la limite, c'est bien plus irrespecteux d'utliliser le pronom souhaiter tout en pensant que c'est ridicule. Et en tout cas, tu peux toujours défendre que les gens ont des droits fondamentaux qui méritent d'être respectés indépendamment de la manière dont ils veulent se faire appeler.
[^] # Re: dev principal de Ladybird
Posté par arnaudus . En réponse à la dépêche Pour 100 briques t'as plus rien : le navigateur Ladybird reçoit un million de brouzoufs. Évalué à 6. Dernière modification le 05 juillet 2024 à 09:42.
Honnêtement, je ne vois pas à quelle expérience générale de "fascisme d'extrême gauche" tu fais référence. On sait que les expériences communistes ont systématiquement tourné vers le totalitarisme, mais on n'y trouve normalement pas les marqueurs du fascisme (traditionalisme, xénophobie, etc), même si on se rapproche sur d'autres points (paranoïa politique, anti-pacifisme…). C'est pour ça que j'ai écrit que ça pourrait se rapprocher, mais ne me faites pas dire ce que je n'ai pas dit, le "wokisme" n'est pas une forme de fascisme.
Ça me fait penser à une série d'affichettes "anti-sexistes" exposées à mon boulot. En plus de situations de "sexisme ordinaire" au boulot, illustrant des comportements fréquents qui génèrent une pression "masculiniste" dans le cadre professionnel, quelques situations illustrent également la vie privée (par exemple un type qui demande à sa femme de s'habiller différemment). Et c'est là que je trouve que ça déconne sec quand même : quoi qu'on puisse penser des types qui règlementent la tenue vestimentaire de leur nana, la pensée progressiste ne peut pas prétendre règlementer les conversations privées, ou ce que les gens font au plumard, et avec qui ils le font. C'est très bien de viser la parité dans un comité d'administration, mais c'est légitime de ne pas avoir de parité dans un groupe d'amis qui partent au camping. Je pense que ça illustre pas mal comment on peut partir plein de bonnes intentions et continuer sur sa lancée sans s'apercevoir qu'on va beaucoup trop loin, et que le projet de société qu'on propose n'est qu'une énième avatar de totalitarisme: on peut concevoir un totalitarisme progerssiste (je pense que c'est ça, le "wokisme", en fait), même s'il est peu probable qu'un tel mouvement puisse obtenir un réel pouvoir politique.
Dans le he-gate dont on parle, on n'est pas loin de ça : refuser un patch qui change 5 occurences de "he" en "they" dans une doc confidentielle d'un logiciel pas très connu est décrit comme un acte exécrable, qui conduit à des accusations de mysogynie et de transphobie. On sent bien qu'il y a derrière ça une volonté normative, pleine de bonnes intentions probablement, mais quasi-totalitaire quand même. C'est ce quasi-totalitarisme qui me refroidit : c'est peut-être OK pour he/they sur le fond, mais qu'est-ce qu'on fait pour le point médian, pour la féminisation des noms de métiers, pour la grammaire "neutre" (iels, celleux, etc?). Est-ce que publier un document qui ne suit pas une norme sociale progressiste va forcément induire le risque d'être pointé du doigt et harcelé jusqu'à ce qu'on accepte cette nouvelle "norme"? Ça ne correspond pas vraiment à ma conception du progressisme…
[^] # Re: dev principal de Ladybird
Posté par arnaudus . En réponse à la dépêche Pour 100 briques t'as plus rien : le navigateur Ladybird reçoit un million de brouzoufs. Évalué à 9.
Sauf que ça n'est pas du tout comme ça que ça s'est passé. Quelqu'un a soumis un patch pour modifier toute la doc sans que personne ne lui ai demandé et sans en avoir discuté, le dev a répondu "c'est une contribution cosmétique motivée par un agenda politque et je ne marche pas dans la démarche", et c'est tout. Aucun contributeur ou utilisateur régulier n'a contacté la ML des devs pour demander d'où ça venait et si les devs pensaient que c'était une bonne idée de changer.
Mon interprétation c'est que le dev s'intéresse à ses vrais utilisateurs, et il ne donne pas suite aux contributions dont l'objectif principal n'est pas d'améliorer le logiciel. On peut désaprouver, mais c'est assez pathétique d'aller l'accuser de mysogynie ou de transphobie, et d'aller faire du buzz sur les rézosocio. De toutes façons, personne n'utilisait ce soft avant, donc ça ne va rien changer, et c'est bien parce que tout le monde le sait que la campagne s'est transformée en dénigrement et en incitation au boycott ou à pourrir les ML.
[^] # Re: dev principal de Ladybird
Posté par arnaudus . En réponse à la dépêche Pour 100 briques t'as plus rien : le navigateur Ladybird reçoit un million de brouzoufs. Évalué à 4.
On a au moins le luxe de la pensée quantitative. Entre une discrimination à l'embauche et le choix des pronoms dans la doc d'un logiciel, il y a une petite différence qui pourrait bien expliquer qu'on s'intéresse à la première et qu'on se foute totalement de la seconde.
[^] # Re: dev principal de Ladybird
Posté par arnaudus . En réponse à la dépêche Pour 100 briques t'as plus rien : le navigateur Ladybird reçoit un million de brouzoufs. Évalué à 10.
Moi j'irais même plus loin : poussée à l'extrême, la pensée progressiste peut avoir des relents normatifs quasiment fascistes. L'idée n'est plus de convaincre par des arguments (du style "attention, votre doc considère que le lecteur ne peut être qu'un homme, or certaines femmes utilisent votre logiciel et il faudrait savoir si elles ne se sentent pas offensées par ce choix"), mais d'imposer ("vous devez faire comme ça, si vous ne le faites pas c'est que vous êtes un sale xyz-phobe, et je vais demander à mes copains de parler de vous partout sur les rézosocio pour que vous souffriez de ne pas m'avoir obéi".
On est dans un registre qui a abandonné depuis longtemps la bienveillance: l'opposition, ou même l'indifférence, aux thèmes progressistes du moment, est devenue insupportable pour certains militants, qui ne sont plus dans une démarche de conviction, mais dans une démarche de faire appliquer par la contrainte. Parfois ils n'y arrivent pas, parce qu'ils ne sont pas tout-puissants, mais la méthode est quand même inquiétante.
[^] # Re: dev principal de Ladybird
Posté par arnaudus . En réponse à la dépêche Pour 100 briques t'as plus rien : le navigateur Ladybird reçoit un million de brouzoufs. Évalué à 2.
Je ne comprends pas. Tu as écrit:
Donc on parle bien de droits ou pas? Ou alors je ne vois vraiment pas où tu veux en venir. Ou alors, tu veux dire qu'il faut de l'empathie pour ne pas être indifférent à la question des pronoms, de manière indépendante des droits? Auquel cas on est peut-être d'accord; en effet, les histoires de pronoms n'ont rien à voir avec les droits, c'est plus une histoire de politesse ("que penserait une femme qui lit cette doc dans laquelle je considère que le lecteur est un homme?").
[^] # Re: dev principal de Ladybird
Posté par arnaudus . En réponse à la dépêche Pour 100 briques t'as plus rien : le navigateur Ladybird reçoit un million de brouzoufs. Évalué à 2.
Je ne suis pas certain de comprendre la phrase, mais pourquoi? Ce n'est pas très difficile de distinguer ce qui est du ressort des droits fondamentaux et ce qui est une question d'inconfort vis-à-vis du reste de la société. Pour revenir dans le contexte, ici il s'agit d'une documentation écrite comme si le lecteur ne pouvait être qu'un homme. On peut trouver ça idiot ou y être indifférent, une utilisatrice du logiciel pourrait s'en trouver mal à l'aise, et en effet, on pourrait même dire que ça contribue à maintenir une sorte d'ambiance pas très paritaire dans le monde du logiciel. Mais considérer que des droits sont bafoués, ça revient à judiciariser une situation qui est parfaitement compatible avec la vie de tous les jours; par contraste, ça revient également à assimiler des vraies violations des droits avec une chose aussi ridicule que l'utilisation de mauvais pronoms dans une doc.
[^] # Re: débordements quand tu nous tiens
Posté par arnaudus . En réponse à la dépêche Pour 100 briques t'as plus rien : le navigateur Ladybird reçoit un million de brouzoufs. Évalué à 6.
https://fr.wikipedia.org/wiki/Ou_vous_%C3%AAtes_avec_nous,_ou_vous_%C3%AAtes_contre_nous
On ne compte d'ailleurs plus les gens retrouvés morts ou aveugles après avoir lu un mauvais pronom dans une documentation.
https://fr.wikipedia.org/wiki/Paradoxe_de_la_tol%C3%A9rance
Bon, encore une fois, on ne parle pas d'intolérance. On ne parle que de quelqu'un qui refuse de suivre le délire de quelques uns sur ces histoires de pronoms. Ces espèces de "faux ennemis" sont faciles à identifier et à harceler, ce sont des cibles faciles parce qu'ils sont inoffensifs. C'est beaucoup plus difficile de s'attaquer aux milieux masculinistes, parce qu'eux sont de vrais méchants.
[^] # Re: dev principal de Ladybird
Posté par arnaudus . En réponse à la dépêche Pour 100 briques t'as plus rien : le navigateur Ladybird reçoit un million de brouzoufs. Évalué à 6.
En ce qui me concerne, je ne suis absolument pas indifférent aux droits des femmes et des trans. Par contre, je me fous royalement de ces histoires de pronoms. Je pense que des gens pourtant bien intentionnés se sont complètement emmélé les neurones et finissent par casser les pieds de tous avec des choses qui n'ont aucun intérêt, ce qui génère des réactions négatives à leur égard, qu'ils interprètent (à tort) comme une réaction contre la cause qu'ils défendent.
Personne n'a dit ça, au contraire même : quand des gens qui ne sont pas xyz-phobes en viennent à penser que les "militants xyz" sont infréquentables, il y a peut-être un petit problème dans la stratégie de communication.
Par exemple, je pense que j'aurais le même plaisir à faire bouffer des poignées de points médiants à ceux qui ne peuvent pas s'empêcher de montrer à quel point leur militantisme est supérieur aux règles de typographies établies, que ça soit des hommes, des femmes, ou des trans.
[^] # Re: dev principal de Ladybird
Posté par arnaudus . En réponse à la dépêche Pour 100 briques t'as plus rien : le navigateur Ladybird reçoit un million de brouzoufs. Évalué à 8.
OK, tu as raison, je vais aller mouler sur un autre article.
Non en fait, ça me semble complètement absurde. Je ne vois pas pourquoi céder à n'importe quelle demande pour la simple raison que je m'en fous.
Regarde le lien original:
https://github.com/SerenityOS/serenity/pull/6814
Le gars n'a pas répondu qu'il détestait les femmes et qu'il refusait pour cette raison. Il dit très clairement qu'il s'en fout, et qu'il ne veut pas de contributions motivées par un agenda politique.
Il n'est pas mysogyne ou transphobe. Il ne méprise pas les trans ou les femmes, il méprise les gens qui n'ont pas d'autres occupations que de modifier les pronoms dans les docs de logiciels. C'est certainement vexant pour les gens qui pensent que c'est important de modifier les pronoms, mais ça n'a rien à voir avec ce dont on l'accuse.
[^] # Re: dev principal de Ladybird
Posté par arnaudus . En réponse à la dépêche Pour 100 briques t'as plus rien : le navigateur Ladybird reçoit un million de brouzoufs. Évalué à 10.
Des combats fondamentaux qui n'intéressent qu'une faible partie de la population, il y en a des centaines. Ça vaut pour la souffrance animale, pour l'extension des zones de chalutage, pour les conditions de travail des enfants au Pakistan… et même pour le logiciel libre.
Tu ne peux pas en vouloir à quelqu'un parce qu'il t'explique que ton combat, il s'en fout. Il ne dit pas que tu as tort, il dit qu'il s'en fout.
Je pense que ton problème, c'est de n'avoir que des gens qui s'investissent dans le même combat parmi tes proches. À force, on finit par croire que son combat est universel, et on ne comprend pas pourquoi la société n'avance pas plus vite. On étiquette les gens qui s'en foutent comme "mysogynes" ou "transphobes", sans s'apercevoir que c'est son comportement qui est problématique. On a tous connu une voisine mémé à chats qui a 35 chats et qui ne parle que de chats, qui recueille les chats abandonnés, qui milite pour tout un tas de trucs sur les chats, et qui classe les gens en "personnes qui aiment les chats" et "méchants". Bah voila, ce genre de personnes sont des "maniaques"; ce n'est pas que les gens sont "chatphobes" quand ils la traitent de maniaque, c'est juste qu'ils sont lucides sur l'importance relative de son "combat" par rapport aux autres combats à mener.
Bref, il faut au moins accepter qu'il y a une différence entre être "Xphobe" et être "Militant pour X phobe". On peut aimer les chats et ne pas aimer les mémés à chat maniaques, on peut utiliser une forme d'écriture inclusive tout en trouvant insupportables les militants de l'écriture inclusive.
[^] # Re: Pourquoi refaire un moteur de rendu ?
Posté par arnaudus . En réponse à la dépêche Pour 100 briques t'as plus rien : le navigateur Ladybird reçoit un million de brouzoufs. Évalué à 7.
J'avoue que je ne comprends pas trop l'argument. Il faut bien une raison pour recoder un truc existant de zéro, bonne ou mauvaise.
- C'est un exercice (l'objectif n'est pas d'obtenir un logiciel compétitif, mais d'apprendre en codant un truc)
- C'est une expérience (tenter une implémentation ou une méthode de développement théorique qui n'a pas été testée en pratique)
- L'existant a des défauts qui ne sont pas corrigeables (sécurité, perfs)
- L'existant est tellement complexe qu'il est plus simple de recoder que de s'approprier le code
- L'architecture de l'existant empêche l'implémentation de nouvelles fonctions
- La licence de l'existant n'est pas acceptable
Peut-être d'autres raisons existent. Mais "parce que voila" me semble un peu léger, on parle de millions d'euros et de dizaines de milliers d'heures de travail…
J'ai peut-être loupé un épisode, mais n'est-il pas normal que le rendu de tous les moteurs se ressemblent quand la norme définit exactement ce que doit être le rendu d'une page, parfois au pixel près? Je trouve que l'argument inverse serait plutôt pertinent, il existe déja plusieurs moteurs qui ont un rendu conforme à la norme, à quoi peut bien servir d'en recoder un qui, par la force des choses, aura aussi un rendu conforme à la norme?
[^] # Re: Le problème n'est pas que pour la grippe
Posté par arnaudus . En réponse au lien L'humain pourrait être contaminé par la grippe aviaire ?. Évalué à 5.
Les statistiques sont une branche des mathématiques, donc oui, c'est un outil scientifique. Ce dont on parle n'a pas grand chose à voir avec les statistiques, c'est juste une histoire de collecte de données. Normalement, les données sont collectées selon un protocole expérimental : on définit à l'avance la procédure d'échantillonnage, le temps sur lequel les données sont collectées, etc., en fonction des objectifs scientifiques. Par exemple, la recherche de coronavirus dans les eaux des égouts correspond à un tel protocole : on ne choisit pas les points de collecte au hasard, on a un budget, on sait combien de tests on peut faire par jour, et on détermine où et quand on échantillonne.
Pour la "surveillance" dont on parle, c'est plutôt des données qui remontent spontanément et sporadiquement, sans protocole d'échantillonnage et sans procédure normalisée. Alors oui, la mode est à la science participative et à l'application de modèles statistiques élaborés ou de boîtes noires style "machine learning" pour essayer de contrebalancer les biais de données foireuses, mais tout ça ne sera jamais équivalent à la collecte de données "propres".
En gros, c'est comme ça que je définis "scientifique" : un échantillonnage qui suit un protocole élaboré par des scientifiques en fonction d'un objectif.
[^] # Re: Désinformation
Posté par arnaudus . En réponse au journal Touche pas à ma retraite. Évalué à 3.
Ça me semble très conceptuel ton truc. J'ai l'impression que toute confrontation avec le monde réel va simplement le faire exploser.
D'abord, les lois ne sont pas conçues pour être complexes. Elles le deviennent au fil de l'accumulation d'amendements et de lois rectificatives.
Ensuite, les lois sont issues d'un compromis entre des centaines de personnes (gouvernement, députés, sénateurs, syndicats, lobbys et groupes citoyens…). Tu n'as pas Linus tout seul dans son garage qui va te créer un nouvel OS selon sa logique. Chaque commit doit être discuté et modifié jusqu'à atteindre un consensus majoritaire parmi une population très hétérogène et très divergente idéologiquement.
Enfin, les exceptions font partie intégrante de la loi. Prends par exemple le code de la propriété intellectuelle. Une grande partie de ce qui permet une sorte d'équilibre entre la population et les ayant-droit vient justement d'une liste d'exceptions (qui sont réellement appelées "exceptions" dans la loi) : citation, caricature, copie privée… C'est ça que tu voudrais éviter, par exemple? Un code de la propriété intellectuelle qui dit "Les auteurs ont tous les droits, il n'y a pas d'exception"? Idem pour la légitime défense, c'est un exemple idéal de branchement conditionnel.
Pour les lois fiscales, bien sûr que tu veux des exceptions, tu en veux plein, et tu veux pouvoir en ajouter en fonction de l'évolution de la société. Tu peux vouloir des exonérations pour les handicapés, pour les DOM/TOM, pour les dons, pour le mécénat, pour les veuf/ves de guerre, pour les étrangers qui payent déja leurs impôts chez eux, pour les énergies renouvelables… Bref, tu veux utiliser la loi pour inciter les comportements vertueux ou pour diminuer les inégalités. C'est l'essence des lois de proposer des exceptions.
Pour le revenu universel que tu prenais en exemple, son fonctionnement entre en contradiction avec les régimes assurantiels de l'État : assurance maladie (arrêts de travail), assurance vieillesse, assurance chômage. Ce sont des régimes qui prévoient une indemnisation qui dépend de la cotisation, ce qui n'est pas compatible avec un revenu universel. Tu peux donc 1) supprimer les régimes assurantiels de l'État (et donc privatiser la sécurité sociale, les retraites, et l'assurance chômage, puisque les gens voudront nécessairement s'assurer en fonction de leurs revenus afin de conserver une partie de leur train de vie), 2) les superposer au revenu universel (tu n'as donc rien simplifié du tout, au contraire), 3) déroger au revenu universel pour les chômeurs, les retraités, et les malades (et donc, faire en sorte que le revenu universel n'est pas tellement universel, sans compter que du coup tu n'as rien simplifié).
Bienvenu dans le monde réel! Le monde réel est complexe, et ce n'est pas une vague analogie avec une base de code qui peut te permettre de comprendre pourquoi.
[^] # Re: Désinformation
Posté par arnaudus . En réponse au journal Touche pas à ma retraite. Évalué à 3.
C'était justement mon exemple. En théorie c'est simple, et dès que tu l'appliques au monde réel en 10 minutes tu as reconstruit une usine à gaz.
[^] # Re: Désinformation
Posté par arnaudus . En réponse au journal Touche pas à ma retraite. Évalué à 2.
Parce que tu considères peut-être qu'une équation en taux = A/(B+exp(-Cx)) avec A, B, et C des coefficients qui dépendent du nombre de tes enfants et de ton lieu d'habitation, c'est plus simple qu'un système d'abattement de type taux = 0 si x < A; taux = 6.2% si A < x < B, taux = 8.3% si x > B. Tu n'es pas sorti des accusations de technocratie…
Encore une fois, comment voudrais-tu te débarrasser des effets de seuil? "Faire simple", c'est juste des mots. Tu vois bien que dès qu'on propose un système plus simple (par exemple, le revenu universel), après 5 minutes tu commences à y coller tout un tas de couches de complexité (tu exclus les chômeurs parce que l'indemnisation chômage est une assurance, tu exclus les étrangers qui ont résidé moins de 5 ans en France (et paf, un bel effect seuil à 5 ans), tu ajoutes des restrictions pour les héritiers, pour les oeuvres d'art, des niches fiscales pour les dons, pour le mécénat… et pouf, revoila ton système tout plein de noeuds avec des stratégies d'optimisation.
[^] # Re: Le problème n'est pas que pour la grippe
Posté par arnaudus . En réponse au lien L'humain pourrait être contaminé par la grippe aviaire ?. Évalué à 4.
Non, mais je suis complètement d'accord, la surveillance médicale existe. Tu as les statistiques de tests de Covid + et de l'évolution des consultations pour symptomes grippaux, c'est pratique pour coordonner les soins et anticiper les arrivées de patients dans les hopitaux, mettre en place des mesures, etc.
Mais ça n'a rien à voir avec la connaissance scientifique sur la circulation des centaines de souches virales respiratoires. Savoir qu'il y a une augmentation des cas grippaux, c'est bien quand tu es médecin et que tu veux soigner des gens, mais ça ne t'apporte aucune connaissance scientifique.