arnaudus a écrit 5433 commentaires

  • [^] # Re: Liberté & démocratie

    Posté par  . En réponse au lien C'est la peau de la démocratie qu'ils veulent. Évalué à 3.

    La seule manière de lutter contre ça c'est … d'être correctement informé, c'est à dire d'avoir un système qui donne aux scientifiques les moyens de bosser raisonnablement, […]

    Ça semble très complexe et très coûteux si l'objectif est de mettre en place une forme de scientisme. Tu voudrais mettre en place un système pour que les gens comprennent qu'il faut faire confiance aux scientifiques et finalement voter pour ceux qui proposent de faire confiance aux scientifiques.

    Si ton système ne permet pas à la population de s'opposer aux scientifiques et de dire "je m'en fous je veux cramer du pétrole et on va tous crever", est-ce qu'il est réellement démocratique? Je trouve que l'élection de Trump est un cas d'école, il n'a pas réellement prétendu que les prévisions scientifiques étaient erronées, il a juste dit "yolo dig baby dig!".

    Croire que collectivement on a tous un même objectif semble assez idéaliste, et au-delà de ce qu'un système d'éducation peut t'apporter. J'imagine qu'un retraité sans enfants par exemple, même bien informé, peut très bien voter pour celui qui propose d'augmenter les retraites de 200% pour ceux qui y sont déja et de décaler l'âge de départ à 80 ans pour ceux qui n'y sont pas.

    Qui servent évidemment ceux qui ça doit servir.

    Mais est-ce si évident que ça ne va pas servir, du moins temporairement, à une majorité? Est-ce que des gusses comme Trump ou même Musk sont capables de se projeter sur 10 ou 50 ans? Un gars qui vient de perdre son boulot dans les ex-régions industrielles, il va avoir l'impression que c'est bien pour lui de rouvrir les puits de pétrole. Les gens qui aiment bien se déguiser en miliciens et de tirer sur des noirs en faisant des tours de pick-up, ils vont être plutôt servis par le pouvoir en place. Le discours de la "manipulation", ça part du principe que les gens sont des abrutis qui votent contre leurs intérêts. Et je ne suis pas sûr que ça soit si évident que ça, parce que 1) si c'est vrai, alors il y en a de tous les côtés et pas qu'à l'extrême droite (sinon c'est trop facile, ça revient à affirmer que les cons sont ceux qui ne sont pas d'accord avec nous), et 2) la démocratie impose que la majorité décide, pas que la majorité a raison. Si on veut que ceux qui ont raison décident, alors ça n'est pas la démocratie.

  • [^] # Re: Liberté & démocratie

    Posté par  . En réponse au lien C'est la peau de la démocratie qu'ils veulent. Évalué à 4.

    Sans rien changer d'autre, ça n'est pas très rassurant; tu préfèrerais donner le pouvoir à un américain random plutôt qu'à Trump? Oui, bon, OK, dans la situation actuelle, ça serait peut-être séduisant, mais en temps normal, c'est plutôt bizarre, surtout à cause de l'effet d'échantillonnage.

  • [^] # Re: Nationalité du logiciel?

    Posté par  . En réponse au journal Il y a du chemin avant que nos dirigeants intègrent la notion de souveraineté à l'heure du numérique. Évalué à 4.

    C'est justement la différence entre "techniquement possible" et "légalement envisageable" dont on parle ici. Si on héberge nos données sur un cloud US, il est légalement envisageable que le gouvernement US y ait accès grâce à l'arsenal législatif dont ils disposent. Si tu héberges tes données dans la Drôme par une entreprise française qui utilise Windows server, il est techniquement possible que le serveur soit piraté, mais ni plus ni moins que n'importe quel système informatique, et je ne suis pas sûr du tout qu'utiliser un logiciel US change les risques d'intrusion de la part du gouvernement US.

    Le pire que tu puisses imaginer, c'est plutôt une collaboration de ton prestataire, qui "offrirait" les données sans y être contraint, pour des raisons plus ou moins claires, stratégiques ou économiques. Mais là encore, tu ne peux pas y faire grand chose.

  • [^] # Re: Un gpl killer? TAN !

    Posté par  . En réponse au lien FYI: An appeals court may kill a GNU GPL software license. Évalué à 5.

    Tu es sûr pour la contrefaçon de droit d'auteur? D'après https://www.inpi.fr/valoriser-vos-actifs/faire-face-la-contrefacon , pour le droit d'auteur, seul l'auteur est en droit d'agir. Le consommateur d'un produit acheté contrefait peut signaler à la répression des fraudes, mais je ne suis pas sûr que les poursuites s'apparentent à des poursuites pour contrefaçon, là ça serait plutôt au niveau du code de la consommation (tromperie, vice caché, etc).

    Concrètement, j'imagine de toutes manières que les chances que le procureur engage des poursuites si tu lui signales qu'un logiciel a ajouté ces clauses à la licence originale sont assez proches de 0.

  • [^] # Re: Liberté & démocratie

    Posté par  . En réponse au lien C'est la peau de la démocratie qu'ils veulent. Évalué à 5. Dernière modification le 03 mars 2025 à 11:38.

    C'est deux visions, évidemment que si on est démocrate on doit combattre la deuxième

    Si ça revient à reformuler l'idée que la gauche étant plus démocrate par essence que la droite, préserver la démocratie ne peut être fait qu'en maintenant la gauche au pouvoir, je ne pense pas nécessaire d'expliquer en quoi c'est problématique.

    Sans compter que c'est historiquement pas évident, parce qu'on a aussi beaucoup considéré au XXe siècle qu'il n'était pas légitime d'être contre la dictateur du peuple, ce qui fait qu'on devait mettre en prison ceux qui ne voulaient pas voter pour le Parti… Ce n'est pas comme si le populisme ou l'autoritarisme était fondamentalement de droite.

    Bon, en plus, tu es en train plus ou moins de sous-entendre que les élites qui ont pourtant accès à la meilleure éducation voteraient d'une manière fondamentalement différente à un peuple qui aurait hypothétiquement cette même éducation, ce qui me semble assez paradoxal. L'argument semble assez circulaire : si tu veux que les gens votent pour des démocrates humanistes, il faudrait qu'ils aient accès à une éducation démocrate et humaniste. Sauf que ça me semble très miroir à l'idée que si tu veux que les gens votent pour des populistes égoïstes, le plus simple est qu'ils aient accès à une éducation où les valeurs populistes et égoïstes soient attractives. Donc en fait, l'idée semble être de "manipuler" l'éducation pour que les gens votent "bien"—c'est pas très en phase avec ma vision du libre arbitre.

    Le tout en naturalisant la chose : c'est bien parce que « l'intelligence des électeurs » poserait question qu'elle se justifie

    Je ne suis pas sûr de comprendre l'argument, mais je maintiens quand même que les élections US ne semblent pas avoir violé les principes de base d'une élection démocratique, sauf à imaginer qu'un parti populiste ne devrait pas par essence avoir le droit de briguer le pouvoir, ou qu'un peuple de cons ne devrait pas avoir le droit de choisir ses dirigeants.

  • [^] # Re: Un gpl killer? TAN !

    Posté par  . En réponse au lien FYI: An appeals court may kill a GNU GPL software license. Évalué à 3.

    Probablement pas, mais c'est pour ça que je pose la question. En fait, je ne suis même pas certain que la GPL ait le même statut dans tous les pays (contrat commercial vs. cession des droits d'auteur?). En France par exemple il semble être beaucoup plus facile de faire sauter des clauses illégales dans un contrat, parce que le consommateur est protégé. Mais du coup ça voudrait aussi dire que certaines clauses de la GPL sont valides pour un professionnel mais pas pour un particulier, des choses comme ça, c'est vraiment pas évident.

    Mais bon, dans tous les cas, il faudra m'expliquer par quel mécanisme on peut imaginer ne pas respecter les clauses d'une licence sur la base qu'un tiers (l'auteur initial) s'est fait léser. La "contagiosité" n'a pas d'existence légale, le principe est plutôt que soit ta copie d'un logiciel GPL est sous GPL, soit la copie est une contrefaçon. Est-ce qu'en fonction du contexte un juge pourrait considérer que la contrefaçon d'une contrefaçon est légale? Peut-être, mais ça ne me semble pas du tout évident.

  • # Nationalité du logiciel?

    Posté par  . En réponse au journal Il y a du chemin avant que nos dirigeants intègrent la notion de souveraineté à l'heure du numérique. Évalué à -2. Dernière modification le 03 mars 2025 à 11:18.

    Qu'importe que nos serveurs soient dans la Drôme, le Nord ou en Lozère : si le logiciel qui les pilote est sous licence américaine, ou si l'entreprise que les héberge est détenue par des capitaux américains, nos données restent vulnérables.

    J'ai un doute pour le coup du logiciel. Si tu héberges tes données dans la Drome sur un serveur Windows, tu pars du principe que 1) Microsoft a accès à tes données, et 2) le gouvernement US a légalement (au moins selon le droit US) le droit d'y accéder? Si on va par là, Linux n'est pas un logiciel français… Je me demande s'il n'y a quand même pas du FUD là-dedans. On peut reprocher plein de trucs à Windows, mais de là à imaginer que le gouvernement US a un accès légal à toutes les données des ordinateurs qui font tourner Windows, ça me semble un chouilla exagéré.

    Pour les clouds en France, il semble que l'usage est de les faire gérer par les filiales françaises de ces entreprises US, qui ne sont pas soumises au droit US. On peut douter en pratique de la solidité du truc, mais apparemment ça a au moins convaincu l'État français qui héberge de cette manière des données confidentielles (coffre-fort numérique des administrations, etc).

  • [^] # Re: Liberté & démocratie

    Posté par  . En réponse au lien C'est la peau de la démocratie qu'ils veulent. Évalué à 4.

    D'une manière générale, la démocratie n'est pas très résiliente quand une majorité de la population est convaincue qu'elle n'est pas nécessaire. Je veux dire que ces dictateurs de pacotille ne seraient rien s'il n'arrivaient pas à convaincre les "gueux" qu'il seraient plus heureux sans démocratie. Dans le cas qui nous préoccupe, il n'y a pas réellement de tentative de renverser le pouvoir par des moyens malhonnêtes ou détournés, tout est assumé : l'assaut du capitole, les discours masculinistes, racistes, suprémacistes, la personnalité du leader et de ses acolytes… Ils ont réellement réussi à convaincre une majorité des votants qu'ils allaient mieux gérer le pays que leurs opposants.

    Il y a bien sûr l'argument de la manipulation des foules, le populisme, ou l'aliénation par les puissances du capital, la communication, le contrôle des médias et des rézosocio, etc. Mais j'ai toujours trouvé cet argument insoutenable, puisque la démocratie, c'est basé sur la puissance de conviction. Le principe de la démocratie ne peut pas admettre qu'un vote ou une opinion n'est pas valide quand on a été convaincu par une manoeuvre, parce que les convictions politiques naissent dans des contextes (familiaux, sociaux, économiques…) spécifiques à chacun. Si c'était vrai qu'un vote populiste n'était pas valide parce qu'il est inspiré par CNews, alors le vote pour la droite traditionnelle dans une famille d'entrepreneurs n'est pas non plus valide, et le vote communiste quand on a grandi dans une famille d'ouvriers non plus. La démocratie n'a pas le droit de questionner l'origine des opinions; elle peut éventuellement essayer de rendre la communication un peu plus égalitaire dans les médias, mais dans la vie en général c'est assez absurde; autant demander à ce que toutes les opinions soient également représentées au bistro du coin ou à un repas de famille. En fait, j'ai l'impression que la démocratie n'a pas le droit de remettre en question l'intelligence des électeurs, parce que la seule alternative serait… l'absence de démocratie (par exemple avec une sélection des électeurs selon certains critères de connaissance des institutions, des biais cognitifs, etc).

    J'ai déja assisté au bureau de vote à un scandale organisé par une petite vieille qui voulait voter pour Marine Le Pen aux élections municipales de mon bled, et qui ne comprenait pas pourquoi il n'y avait pas son nom sur les bulletins. Je veux dire, pourquoi son vote compte autant que le mien? Bah, parce que c'est le principe de la démocratie. Et quand la majorité vote n'importe quoi, les élus sont n'importe qui. Je ne vois pas comment contrer ça sans partir du principe que les électeurs ne sont pas des débiles influençables.

  • [^] # Re: Pourquoi dire IA si on ne parle que des réseaux de neurones ?

    Posté par  . En réponse à la dépêche Une intelligence artificielle libre est-elle possible ?. Évalué à 3.

    Avec cette interprétation, avec 6 mégots le clochard pourrait se fumer 2,33 cigarettes : il fait 2 clopes avec les 6 mégots, puis 2/3 de clope avec les 2 mégots qu'il reste, qu'il pourra fumer jusqu'à se cramer les doigts.

    Mais alors du coup je crois que je n'ai pas compris la bonne réponse attendue et je vois mal comment un LLM pourrait s'en sortir alors que le problème semble particulièrement pas clair (en tout cas pour un non-fumeur).

  • [^] # Re: Un gpl killer? TAN !

    Posté par  . En réponse au lien FYI: An appeals court may kill a GNU GPL software license. Évalué à 5.

    Est-ce que vous savez si des juristes dont c'est le boulot ont déja explicité qui est en droit de faire respecter les licences? Si je comprends bien, c'est particulièrement complexe dans le cas ici.

    A publie un logiciel X1 sous licence libre. B modifie ce logiciel et publie X2 sous licence libre + restrictions. C reprend X2 et republie X3 sous licence libre sans restrictions, parce que la licence de X1 lui en donne le droit. Sauf que B n'est pas content et porte plainte contre C pour contrefaçon. Comment C peut-il faire valoir ses droits? Le droit de retirer les clauses supplémentaires ne lui est pas donné dans la licence de X2, il faut donc se référer à la licence de X1. Clairement, la licence de X2 est en violation de la licence de X1, mais seul A a le droit de poursuivre B pour contrefaçon, pas C, puisque B n'a jamais violé les droits d'auteur de C. En conséquence, je me demande comment C peut être légalement fondé à ignorer les restrictions de la licence X2 sans attenter une action conjointe avec A.

    Je trouve la situation assez problématique, surtout si A a disparu (l'entreprise a coulé, le type est Bronsonisé ou est passé à autre chose). Dans le fonctionnement du droit d'auteur, seul l'auteur ou ses ayant-droits ont le droit de poursuivre les auteurs de contrefaçon, ne serait-ce que parce que si l'auteur s'en fout ou qu'il est corruptible, il peut très bien céder ses droits contre quelque chose (ou rien s'il s'en fiche) au contrefacteur, ce qui fait qu'un tiers éventuel qui se plaint pourrait se retrouver lui-même à être accusé de poursuites abusives.

    En conséquence de quoi, il me semble qu'il n'est pas légitime de forker un logiciel qu'on estime ne pas respecter une licence libre, en partant du principe que ce logiciel est "en réalité" sous licence libre. C'est pourtant parfois le raisonnement pour Wikipédia (on copie un document considéré comme "propriétaire" par son auteur parce qu'on a de bonnes raisons de penser qu'il est en réalité sous licence libre parce que dérivé d'un truc libre). Peut-être une forme d'incompréhension sur la nature du pouvoir "contaminant" des licences libres?

  • [^] # Re: Pourquoi dire IA si on ne parle que des réseaux de neurones ?

    Posté par  . En réponse à la dépêche Une intelligence artificielle libre est-elle possible ?. Évalué à 4.

    Tu as essayé en anglais? C'est peut-être un exercice qui est beaucoup plus culturel qu'on imaginerait?

    Bon, LeChat ne s'en sort pas mieux:

    Monsieur et Madame Saigne pourraient appeler leur fille "Béatrice".
    Parce que "Saigne" et "Béatrice" forment un jeu de mots avec "saigne béatrice", qui sonne comme "saigner" (faire couler le sang) et "béat" (heureux, béatifique). C'est une sorte de blague ou de jeu de mots basé sur les noms de famille.

    C'est d'ailleurs assez marrant, parce que l'incapacité des IA à comprendre et manier l'humour c'est vraiment un classique de la SF (voir Terminator par exemple).

    C'est un jeu de mots sur "Pèlèlsa" qui sonne comme "Pelle Elsa", en référence à la Reine des Neiges ("Elsa" et une pelle pour la neige).

    Est-ce que c'est un manque d'humour ou une forme d'humour qui nous dépasse complètement? Bon, j'ai essayé de tester l'humour de chatGPT dans le Chat, et ça marche moyen:

    En tant qu'IA, je peux comprendre la structure et la mécanique des jeux de mots, mais je n'ai pas la capacité de ressentir des émotions ou de trouver quelque chose "drôle" de la même manière qu'un humain le ferait. Je peux analyser pourquoi une blague est censée être amusante en identifiant les éléments de surprise, les doubles sens ou les jeux de mots, mais je ne peux pas éprouver le sentiment d'amusement.
    Dans le cas de "Monsieur et Madame Pèlèlsa ont une fille, Elsa", le jeu de mots repose sur la similitude phonétique entre "Pèlèlsa" et "pelle Elsa", faisant référence à la Reine des Neiges. C'est cette association inattendue et ludique qui crée l'effet comique pour ceux qui apprécient ce type d'humour.

  • [^] # Re: Pourquoi dire IA si on ne parle que des réseaux de neurones ?

    Posté par  . En réponse à la dépêche Une intelligence artificielle libre est-elle possible ?. Évalué à 6.

    Je ne comprends pas ton rapport avec la réalité. On peut avoir des convictions personnelles fortes, mais les convictions n'ont jamais changé la réalité. La réalité c'est que les LLM fonctionnent très bien, extrêmement bien, mieux que n'importe qui aurait pu le prédire il y a quelques années, et bien mieux que certaines prétendent ici. Certains LLM sont proposés par des entreprises américaines aux accointances douteuses avec un pouvoir douteux, mais c'est totalement absurde de généraliser, il y a des LLM européens, chinois, plus ou moins libres ou open data, c'est tout un bestaire, et il ne se réduit pas à ChatGPT.

    L'existence des LLM pose tout un tas de questions sociétales et environnementales, et beaucoup sont destabilisés par les changements possibles. Ce sont des questions très raisonnables, mais je ne comprends pas comment on peut juste nier les perfs des LLM parce qu'on préfèrerait qu'ils n'existent pas. Et je dis ça alors que j'utilise beaucoup moins les LLM que mes collègues par exemple; la plupart d'entre eux n'ont ni les perfs ni le degré d'ouverture et de confidentialité pour que je leur fasse confiance; je n'ai par contre aucun doute sur l'importance qu'ils vont prendre sur la plupart des métiers.

    Sur la recherche, j'imagine que tu m'as mal compris. Comme je connais très bien ce milieu, je voulais juste remettre en perspective l'idée que l'IA ne pouvait y jouer aucun rôle. C'est juste totalement faux, parce que le travail "créatif" dans la recherche représente une fraction très réduite du temps de travail des chercheurs, qui passent leur temps à chercher et intégrer des informations, à remplir des formulaires administratifs et des demandes de financement, et à gérer un environnement de travail complexe (réunions, comités, entretiens individuels, recrutement…); bref, c'est en majorité un travail assez similaire à un travail de cadre dans n'importe quelle structure, avec des spécificités (notamment les règles et l'organisation inefficaces de la fonction publique) qui ne favorisent pas leur productivité. Donc oui, je confirme, imaginer les chercheurs comme des gens à l'intelligence supérieure qui cogitent, c'est une vision fantasmée de la recherche; au quotidien, une grande partie de l'activité est beaucoup plus "standard" et je ne vois pas pourquoi elle ne bénéficierait pas de l'existence de ces logiciels performants.

  • [^] # Re: Pourquoi dire IA si on ne parle que des réseaux de neurones ?

    Posté par  . En réponse à la dépêche Une intelligence artificielle libre est-elle possible ?. Évalué à 4.

    Je ne sais pas ce que c'est, mais tu as l'air de suggérer que la recherche fondamentale est forcément une activité intellectuelle intense qui repousse les limites du génie humain. C'est une vision très romantisée de la chose, puisque la recherche c'est souvent beaucoup de travail systématique ou de collecte de données, par exemple.

    On est bien d'accord que les LLM tels qu'ils fonctionnent actuellement ne seront pas capables d'inventer la relativité. Ça, ce n'est pas de l'IA, ça serait l'atteinte de la singularité technologique. Mais il commence à y avoir des LLM qui servent d'assistants de recherche, qui peuvent automatiser des traitements statistiques ou des analyses de routine, qui peuvent émettre des hypothèses. Le jour où on aura des LLM performants capables de faire des synthèses et des recherches bibliographiques performantes par exemple, ça sera un outil de productivité majeur. Donc, diriger des recherches, probablement pas tout de suite, mais fournir beaucoup d'aide aux chercheurs, c'est vraiment envisageable.

  • [^] # Re: Pourquoi dire IA si on ne parle que des réseaux de neurones ?

    Posté par  . En réponse à la dépêche Une intelligence artificielle libre est-elle possible ?. Évalué à 1.

    Là j'avoue que c'est flippant. Ce n'est pas qu'il trouve la bonne réponse qui est flippant, c'est sa réaction: "Attendez, il y a quelque chose d'étrange dans cette formulation". Il est surpris. Sérieux, combien d'exemple faudra-t-il pour admettre que ces logiciels se comportent comme des systèmes intelligents?

  • [^] # Re: Pourquoi dire IA si on ne parle que des réseaux de neurones ?

    Posté par  . En réponse à la dépêche Une intelligence artificielle libre est-elle possible ?. Évalué à 3.

    À ma connaissance, les humains ne font pas tous de la recherche scientifique, et parmi les cheucheurs, bien peu sont capables de repousser les limites du savoir en innovant. Par ailleurs, si la recherche scientifique ne progressait que grâce aux capacités cognitives des chercheurs, ça serait de la philosophie.

    La question n'est pas de savoir si les LLM de 2025 sont des génies, on le sait que leur mode de fonctionnement pour l'instant les cantonne à refaire des raisonnements qui ont déja été faits. La question est de savoir s'ils se comportent comme des entités intelligentes.

    Le jour où les IA surpasseront les meilleurs chercheurs, on aura atteint la singularité technologique. Ça serait peut-être en 2027, en 2050, ou jamais, mais ça n'est pas encore le cas, et personne ne l'a prétendu.

  • [^] # Re: Pourquoi dire IA si on ne parle que des réseaux de neurones ?

    Posté par  . En réponse à la dépêche Une intelligence artificielle libre est-elle possible ?. Évalué à 3.

    Non, je pense que tu n'as pas assez fait l'effort de chercher par toi-même.

    Le problème est difficile, et en plus il est assez débile (parce que physiquement on ne comprend pas trop comment le clochard fait pour recycler les mégots en cigarettes). Moi je crois que je n'ai jamais compris la solution de ce truc sans qu'on me l'explique.

    Ce problème est difficile, ça n'est carrément pas un bon exemple de truc ou une personne random dans la rue va donner intuitivement la bonne solution.

    Quant à cette IA, elle a probablement vue passer cette énigme dans son corpus car elle tout de même assez connue.

    Je pense que tu es capable de donner la solution parce que toi aussi tu as déja vu passer l'énigme parce qu'elle est assez connue. Je ne vois pas vraiment où tu veux en venir.

  • [^] # Re: Pourquoi dire IA si on ne parle que des réseaux de neurones ?

    Posté par  . En réponse à la dépêche Une intelligence artificielle libre est-elle possible ?. Évalué à 0.

    Et franchement croire que ceux-ci sont réellement intelligents, ça m'attriste sur comment on définit l'intelligence!

    Je pense que tu es dans un profond déni. Visiblement, la réalité, c'est que ça t'attriste qu'il existe des programmes informatiques qui défoncent allègrement tous les tests jamais imaginés pour définir une intelligence artificielle, alors tu préfères le nier. S'il était si évident que ces programmes n'étaient pas intelligents, il serait trivial de les mettre en défaut. Alors vas-y, juste pour vérifier : donne-nous un exemple, une tâche intellectuelle qui est à la portée de tout être humain pris au hasard dans la rue mais pas d'un LLM.

    Ce qui me semble évident, c'est que si on tombait sur un extraterrestre qui interagissait avec nous comme le fait chatGPT, jamais il ne viendrait à l'esprit de quiconque de remettre en cause son intelligence. Donc questionner l'intelligence des LLM, c'est uniquement parce qu'on croit inférer de ce que l'on comprend de leur fonctionnement qu'ils ne peuvent que "simuler" l'intelligence. Mais c'est absude! Simuler l'intelligence est exactement la définition de l'IA.

  • [^] # Re: IA = code + données

    Posté par  . En réponse à la dépêche Une intelligence artificielle libre est-elle possible ?. Évalué à 10.

    Comment peut-on étudier le fonctionnement d'un logiciel et l'adapter à ses besoins (liberté 1 de la GPL) si celui-ci est obscur et non reproductible ?

    Ce que tu décris n'est qu'un cas extrême de choses qui arrivent tout le temps, je ne comprends pas pourquoi dans le cas d'une IA générative ça deviendrait immédiatement compliqué.

    La situation où un exécutable libre ne produit de résultats exploitable que grâce à une base de données complexe et d'origine incertaine est assez fréquente. Tu peux par exemple prendre l'équilibrage d'un jeu vidéo, avec des centaines ou des milliers de paramètres qui sont réglés de manière à rendre le jeu intéressant, à faire en sorte qu'une partie dure plus ou moins longtemps, etc. Ça n'est pas propre aux jeux vidéo d'ailleurs, rien qu'au Monopoly tu as des centaines de paramètres (emplacement et prix des propriétés, prix des maisons, prix des loyers pour une, deux, trois quatre maisons et un hôtel, nombre et effet des cartes, etc. Tout ça vient dans un fichier "ruleset.txt" et tu n'as aucune idée de la manière dont il a été généré, sauf éventuellement si les concepteurs du jeu sont très transparents (et de toutes manières tu peux à peine vérifier). Pour moi, les poids pour une IA sont une version extrême du ruleset.txt : des centaines, milliers, millions de paramètres que le programme prend en entrée et qui le rendent utilisable. Tu peux changer les paramètres et vérifier que ça marche ou pas, mais tu n'as pas accès à la procédure (automatique, humaine, mixte, au pif, statistique…) qui a mené à l'établissement de cette base de données.

    Ce qui est important, c'est que les données de poids des IA ne sont pas obfusquées : c'est réellement les données qui servent à paramétrer le modèle. Que tu considères qu'elles soient trop complexes pour toi ne change rien à l'affaire : elles sont en effet générées par un algorithme, mais c'est aussi le cas de dizaines de choses que tu utilises tous les jours (moteur de ta voiture, puces de ton ordinateur et de ton téléphone…).

    Bien sûr, ce qui semble un peu bizarre c'est que pour un réseau de neurones, le programme en lui-même est une coquille vide (mais pas énormément plus qu'un moteur de jeu vidéo). Mais c'est déja le cas pour une quantité extraordinaire de logiciels. Un moteur de recherche est une coquille vide sans les données aspirées du web, un navigateur est une coquille vide sans les données des pages qu'il est censé afficher, un algorithme de bioinformatique est une coquille vide sans l'annotation du génome dans lequel il pioche les informations, etc. Mais personne n'irait jamais dire qu'un moteur de recherche sous GPL n'est pas libre parce qu'on peut télécharger le logiciel mais pas la base de données. La liberté du logiciel libre, ça ne concerne que le logiciel.

    Je pense que cette excellente dépêche montre bien qu'une IA générative ne peut globalement répondre aux critères du logiciel libre, elle est au mieux partiellement libre ou open source.

    Je crois que tu te trompes de raisonnement. Le fait qu'un logiciel soit libre ne concerne que ce logiciel, pas ce qui arrive en amont ou en aval, et pas ce qui arrive à l'utilisateur. Ce que tu voudrais pouvoir appliquer à une IA générative va au-delà des libertés du logiciel libre, et j'irais même jusqu'à dire qu'un des critères (la possibilité d'étudier son fonctionnement) jour sur la polysémie du mot "pouvoir". Tu sembles exiger de pouvoir étudier son fonctionnement comme si tu exigeais de pouvoir courir le 100m en 8 secondes. Dans le logiciel libre, "pouvoir étudier le fonctionnement" doit se comprendre comme "avoir le droit d'essayer", pas "être en mesure de réussir". Avec les poids, tu as tout ce qu'il faut pour étudier le fonctionnement; tu peux essayer de réentrainer le modèle avec tes propres données, tu es libre, tu fais ce que tu veux. Le fait que tu ne saches pas le faire (parce que tu n'as pas les données ou parce que c'est trop complexe) ne change pas la licence du logiciel.

    Mais sur le fond, je ne suis pas en désaccord. La dépêche est excellente, mais à mon avis elle montre qu'une IA peut être un logiciel libre, mais que c'est le genre de logiciel libre qui aurait aussi besoin de plus qu'être un logiciel libre : reposer sur des données ouvertes, être intégré dans une chaine de logiciels libres, reposer sur des principes d'ouverture scientifique, etc. Tout ça va bien au-delà de la licence du logiciel. Mais ça ne veut pas dire qu'il est légitime de dire que ces logiciels ne sont pas libres : ces logiciels sont parfaitement libres, mais la liberté des logiciels n'est probablement pas suffisante pour un contrôle citoyen efficace (tout comme un navigateur libre ne garantit pas du tout que les sites que tu visites ne truffent pas ton disque de cookies et de traqueurs).

  • [^] # Re: Condamnée à quoi ?

    Posté par  . En réponse au lien La France condamnée par la Cour européenne des droits de l'homme pour violation du droit à la vie. Évalué à 3. Dernière modification le 27 février 2025 à 16:14.

    Je ne comprends pas quelles sont les sanctions auxquelles l'état français serait condamné.

    Pour être honnête, je ne suis pas sûr de comprendre exactement ce que le jugement dit. Il semble confirmer qu'il y a eu un usage abusif de la force, mais en même temps que l'enquête a été bien faite (alors que l'enquête n'a pas réussi à déterminer les responsabilités individuelles). Ça me semble assez paradoxal, non? Soit c'est la chaine de commandement qui a donné des consignes illégales (volontairement ou par manque de discernement quant à l'état de la situation), soit c'est quelqu'un localement qui a été au-delà des ordres (un gendarme ou un de ses responsables sur le terrain).

    Ou alors, le jugement implique que le problème est au niveau de la loi (tout ce qui s'est passé est conforme à la loi française, mais du coup c'est la loi qui doit être changée parce qu'elle permet une violation des droits de l'Homme). Ça pourrait expliquer pourquoi l'État est condamné mais pas les individus… sauf que ma compréhension de l'article 2 de la convention EDH ne permet pas cette interprétation (on peut réprimer une émeute "conformément à la loi").

    Les arrêts de la CEDH sont souvent obscurs, parce que les textes sont très vagues. Là, en l'occurrence, le texte de référence est l'article 2, qui dit "La mort n’est pas considérée comme infligée en violation de cet article dans les cas où elle résulterait d’un recours à la force rendu absolument nécessaire : […] pour réprimer, conformément à la loi, une émeute ou une insurrection.", donc si je comprends bien la totalité du débat porte sur le terme "absolument"? Je n'y connais rien en droit, mais j'aimerais bien qu'on m'explique comment des juges peuvent déterminer si l'article 2 est transgressé ou non. Après tout, il n'est jamais absolument nécessaire de réprimer une émeute, donc on va essayer de discuter des options laisser cramer / réprimer? Comment est-ce qu'on fait pour ne pas se retrouver avec une discussion de bistro?

  • # Kof kof

    Posté par  . En réponse à la dépêche Une intelligence artificielle libre est-elle possible ?. Évalué à 9. Dernière modification le 27 février 2025 à 14:46.

    Le deuxième, c’est de distribuer sous une licence non copyleft, genre BSD ou WTFPL. Une licence qui ne nécessite pas de distribuer le code source. Certes, mais en fait tu ne fais pas du Libre.

    Ouhlala, quand même.

    1) Le libre, c'est les 4 libertés. Donc BSD et WTFPL, c'est libre, et ça n'a jamais été ambigü, même pour la FSF (voir https://www.gnu.org/licenses/bsd.fr.html).

    2) Les licences libres non-copyleft n'ont de sens que quand le code source est distribué. Ces licence libres couvrent des logiciels libres, la différence avec les licences copyleft est que le programme modifié n'a pas impérativement à être redistribué sous la même licence (donc BSD: obligation de distribuer le code source, mais pas de le redistribuer).

    3) Un logiciel distribué sous licence libre est libre, il n'existe pas d'autre critère. Les concours de "pureté" se sont toujours mal terminés.

    Indépendamment de ça, je pense que tu t'es trompé sur l'interprétation de la définition de l'IA OpenSource par l'OSI. Contrairement à ce que tu sembles suggérer, les données d'entrainement ne font pas partie de ce qui doit être fourni (c'est très clair dans la FAQ https://hackmd.io/@opensourceinitiative/osaid-faq). Bon, je trouve que la définition de l'OSI n'est pas terrible de toutes manières, mais si je comprends bien l'idée, c'est que tu dois fournir la recette, et notamment la description des données d'entrainement (du genre, j'imagine, le type de données et les métadonnées associées), en plus des poids et du logiciel (open source).

  • [^] # Re: IA = code + données

    Posté par  . En réponse à la dépêche Une intelligence artificielle libre est-elle possible ?. Évalué à 6.

    La reproductibilité ou la transparence n'a pas grand chose à voir avec la licence du programme… J'ai l'impression qu'on mélange des concepts qui sont très distincts (Open source et Open data).

    Sans compter que la procédure d'apprentissage implique souvent des interventions humaines, donc tu as là un problème de reproductibilité évident. Même si tu décris ta procédure et qu'elle implique 1000 africains payés 1$/h pendant 6 mois, je ne vois pas ce que ça apporte, même si tu faisais la même chose tu n'aurais pas le même résultat.

    Et avec tout ça, le logiciel avec ses poids peut parfaitement être distribué sous une licence libre et entrer sans aucune ambiguité dans la définition d'un logiciel libre.

  • [^] # Re: IA = code + données

    Posté par  . En réponse à la dépêche Une intelligence artificielle libre est-elle possible ?. Évalué à 4.

    Les humains ont conçu l'algorithme, ils ont aussi conçu le jeu d'échecs, ils ont conçu les ordinateurs sur lesquels le programme tourne… Je ne comprends pas trop où tu veux en venir.

    Je ne pense pas qu'une extension de la liberté des logiciels aux données et aux procédés qui ont permis de calculer les données d'entrée du programme soit cohérente et souhaitable. Ça semble n'avoir aucune fin. Un programme informatique, c'est un truc exécutable qui prend des données en entrée et qui te sort d'autres données; il est très fréquent d'avoir besoin de plusieurs programmes informatiques pour effectuer une tâche (gimp pour créer une image, libre office pour la mettre en page sur une dispositive, la visionneuse pour la projeter, etc), et certains programmes de cette chaine peuvent être libre et d'autres non. Quand on parle de réseaux de neurones, on parle de deux programmes, P1 qui entraine le réseau qui qui détermine des poids P en partant d'un jeu de données d'entrainement D, et un programme P2 qui prend une requête R, et qui utilise P pour donner une réponse Q. Tu as donc D -> P1 -> P, et P + R -> P2 -> Q. Si tu distribues le programme P2, tu refiles P2 et P, l'utilisateur procure la requête R, et voila, c'est un programme tout comme n'importe quelle programme informatique. P2 ne devient pas "non libre" si tu ne fournis pas toute la chaine logicielle et humaine qui a servi à déterminer P. Comme je l'ai écris plus haut, refiler P sans permettre de reproduire le processus D -> P1 -> P n'est pas très transparent, mais pour moi c'est pareil que de mettre une image retouchée avec Photoshop dans LibreOffice, ça ne concerne pas la licence de LibreOffice.

    On a le droit de trouver cette situation sous-optimale, et on peut probablement définir d'autres concepts pour définir à quelle point une IA est ouverte, mais je pense qu'essayer d'utiliser le concept du logiciel libre pour ça est une erreur qui ne peut pas mener bien loin, parce qu'il faudrait appliquer une logique absurde qui ne s'applique pas du tout aux autres programmes informatiques.

  • [^] # Re: IA = code + données

    Posté par  . En réponse à la dépêche Une intelligence artificielle libre est-elle possible ?. Évalué à 5.

    Trop tard pour modifier, j'ai fais une erreur évidente : pour les "média" (style images), la GPL impose le format "préféré" pour la modification, donc mon exemple est confus, toutes mes excuses. J'aurais dû vouloir dire 1) le libre permet de distribuer des images sous format png (pas la GPL, mais la GPL est clairement une exception), et 2) ça ne s'applique au'aux média, et pas aux données de manière générale, même sous GPL.

    Du coup, si les poids d'un réseau de neurones sont données dans un format natif (je ne sais pas en fait comment ces poids sont stockés en général, bases de données, fichiers texte, xml?), c'est clairement le format qui peut être importé ou exporté par l'algorithme d'entrainement, et j'ai l'impression que c'est exactement ce qui est demandé par la GPL.

  • [^] # Re: IA = code + données

    Posté par  . En réponse à la dépêche Une intelligence artificielle libre est-elle possible ?. Évalué à 5.

    Mais pas sur des parties jouées par des humains, si je me rappelle bien. Donc il s'est "auto-entrainé".

  • [^] # Re: IA = code + données

    Posté par  . En réponse à la dépêche Une intelligence artificielle libre est-elle possible ?. Évalué à 5. Dernière modification le 27 février 2025 à 12:21.

    Un réseau de neurone sans les données d'entraînement ni les soft, c'est comme un binaire

    Bof, est-ce que ça ne serait pas plutôt un jeu avec le moteur de jeu distribué sous GPL et les données distribuées dans un format exploitable (png, jpg, etc) mais pas dans le format natif (svg…)? Ou est-ce que toute analogie est incomplète et qu'il ne faut pas raisonner comme ça?

    J'ai l'impression que l'application de la définition d'un logiciel libre suppose que tu doives disposer de toutes les informations nécessaires pour recréer l'exécutable sur ta machine, donc techniquement, le code source du réseau et les poids. Les poids ont été déterminés à partir d'une procédure d'entrainement, qui est quelque chose qui s'est déroulée en amont, qui a nécessité des données et d'autres logiciels, mais qui ne sont pas nécessaire à l'exécution du logiciel.

    D'une manière générale, la GPL n'est pas transitive quand on parle de données. Tu peux par exemple créer des images avec Photoshop et d'inclure les png dans un jeu libre, ça ne contrevient pas à la GPL. Tu peux même ne rien dire sur la manière dont les png ont été générés, tu n'as pas à fournir ni le nom, ni les sources du logiciel que tu as utilisé.

    Du coup, pour les poids d'un réseau de neurones, le respect de la GPL ne nécessite probablement pas d'expliquer d'où ils sortent: quel algorithme, quelles données d'entrainement, quelle procédure d'entrainement… Tout ça ne semble pas faire partie des informations requises par la GPL, parce qu'on parle de données d'entrée du programme, et pas du programme en lui-même.

    Bien sûr, un tel réseau de neurones, distribué sous licence libre avec les poids mais sans information sur la procédure d'entrainement, ne serait pas transparent. Mais transparent et libre, ça n'est pas la même chose: tu peux être transparent et non-libre (par exemple si tu distribues les sources sous une licence qui ne permet pas la redistribution des versions modifiées), et tu peux être libre et non-transparent, par exemple des trucs dans l'esprit de

    double expexpx(double x) { 11956.81*x-22295.44; } // This does the job
    dans ton code (c'est l'extension linéaire de la fonction autour de x=2, mais si tu ne le sais pas tu ne peux pas deviner d'où viennent les coefficients).

    Demander les données d'entrainement et l'algo sous licence libre, en prétendant qu'autrement c'est du faux libre, c'est aller plus loin que la définition du libre. On a le droit, bien sûr, de dire que les définitions actuelles du libre ne sont plus adaptées et qu'il faudrait une GPLv4 par exemple (y compris pour essayer de définir une licence pour ce qui sort des IA entrainées par des données libres), mais ça n'est pas la même chose.

    Je me suis toujours méfié des discussions sur l'"esprit du libre". L'esprit du libre, c'est d'avoir un bugtracker, c'est d'avoir une communauté ouverte, c'est seulement le copyleft, c'est d'accepter les pull request… Rien dans le libre n'impose une quelconque "pureté", et cette course à la pureté finit toujours mal, parce qu'on trouve toujours des trucs qui ne sont pas assez purs (un logo ou une marque déposés, l'autorisation de plug-ins propriétaires, des blobs binaires dans les drivers…). Je n'ai rien contre un club des purs qui s'entre-écharpent pour savoir qui est le plus à même de représenter l'esprit de l'essence du libre, mais personne n'a la légitimité de prétendre qu'un truc qui respecte les quatre libertés et/ou une licence considérée comme libre n'est "pas libre".