Qu'importe que nos serveurs soient dans la Drôme, le Nord ou en Lozère : si le logiciel qui les pilote est sous licence américaine, ou si l'entreprise que les héberge est détenue par des capitaux américains, nos données restent vulnérables.
J'ai un doute pour le coup du logiciel. Si tu héberges tes données dans la Drome sur un serveur Windows, tu pars du principe que 1) Microsoft a accès à tes données, et 2) le gouvernement US a légalement (au moins selon le droit US) le droit d'y accéder? Si on va par là, Linux n'est pas un logiciel français… Je me demande s'il n'y a quand même pas du FUD là-dedans. On peut reprocher plein de trucs à Windows, mais de là à imaginer que le gouvernement US a un accès légal à toutes les données des ordinateurs qui font tourner Windows, ça me semble un chouilla exagéré.
Pour les clouds en France, il semble que l'usage est de les faire gérer par les filiales françaises de ces entreprises US, qui ne sont pas soumises au droit US. On peut douter en pratique de la solidité du truc, mais apparemment ça a au moins convaincu l'État français qui héberge de cette manière des données confidentielles (coffre-fort numérique des administrations, etc).
D'une manière générale, la démocratie n'est pas très résiliente quand une majorité de la population est convaincue qu'elle n'est pas nécessaire. Je veux dire que ces dictateurs de pacotille ne seraient rien s'il n'arrivaient pas à convaincre les "gueux" qu'il seraient plus heureux sans démocratie. Dans le cas qui nous préoccupe, il n'y a pas réellement de tentative de renverser le pouvoir par des moyens malhonnêtes ou détournés, tout est assumé : l'assaut du capitole, les discours masculinistes, racistes, suprémacistes, la personnalité du leader et de ses acolytes… Ils ont réellement réussi à convaincre une majorité des votants qu'ils allaient mieux gérer le pays que leurs opposants.
Il y a bien sûr l'argument de la manipulation des foules, le populisme, ou l'aliénation par les puissances du capital, la communication, le contrôle des médias et des rézosocio, etc. Mais j'ai toujours trouvé cet argument insoutenable, puisque la démocratie, c'est basé sur la puissance de conviction. Le principe de la démocratie ne peut pas admettre qu'un vote ou une opinion n'est pas valide quand on a été convaincu par une manoeuvre, parce que les convictions politiques naissent dans des contextes (familiaux, sociaux, économiques…) spécifiques à chacun. Si c'était vrai qu'un vote populiste n'était pas valide parce qu'il est inspiré par CNews, alors le vote pour la droite traditionnelle dans une famille d'entrepreneurs n'est pas non plus valide, et le vote communiste quand on a grandi dans une famille d'ouvriers non plus. La démocratie n'a pas le droit de questionner l'origine des opinions; elle peut éventuellement essayer de rendre la communication un peu plus égalitaire dans les médias, mais dans la vie en général c'est assez absurde; autant demander à ce que toutes les opinions soient également représentées au bistro du coin ou à un repas de famille. En fait, j'ai l'impression que la démocratie n'a pas le droit de remettre en question l'intelligence des électeurs, parce que la seule alternative serait… l'absence de démocratie (par exemple avec une sélection des électeurs selon certains critères de connaissance des institutions, des biais cognitifs, etc).
J'ai déja assisté au bureau de vote à un scandale organisé par une petite vieille qui voulait voter pour Marine Le Pen aux élections municipales de mon bled, et qui ne comprenait pas pourquoi il n'y avait pas son nom sur les bulletins. Je veux dire, pourquoi son vote compte autant que le mien? Bah, parce que c'est le principe de la démocratie. Et quand la majorité vote n'importe quoi, les élus sont n'importe qui. Je ne vois pas comment contrer ça sans partir du principe que les électeurs ne sont pas des débiles influençables.
Avec cette interprétation, avec 6 mégots le clochard pourrait se fumer 2,33 cigarettes : il fait 2 clopes avec les 6 mégots, puis 2/3 de clope avec les 2 mégots qu'il reste, qu'il pourra fumer jusqu'à se cramer les doigts.
Mais alors du coup je crois que je n'ai pas compris la bonne réponse attendue et je vois mal comment un LLM pourrait s'en sortir alors que le problème semble particulièrement pas clair (en tout cas pour un non-fumeur).
Est-ce que vous savez si des juristes dont c'est le boulot ont déja explicité qui est en droit de faire respecter les licences? Si je comprends bien, c'est particulièrement complexe dans le cas ici.
A publie un logiciel X1 sous licence libre. B modifie ce logiciel et publie X2 sous licence libre + restrictions. C reprend X2 et republie X3 sous licence libre sans restrictions, parce que la licence de X1 lui en donne le droit. Sauf que B n'est pas content et porte plainte contre C pour contrefaçon. Comment C peut-il faire valoir ses droits? Le droit de retirer les clauses supplémentaires ne lui est pas donné dans la licence de X2, il faut donc se référer à la licence de X1. Clairement, la licence de X2 est en violation de la licence de X1, mais seul A a le droit de poursuivre B pour contrefaçon, pas C, puisque B n'a jamais violé les droits d'auteur de C. En conséquence, je me demande comment C peut être légalement fondé à ignorer les restrictions de la licence X2 sans attenter une action conjointe avec A.
Je trouve la situation assez problématique, surtout si A a disparu (l'entreprise a coulé, le type est Bronsonisé ou est passé à autre chose). Dans le fonctionnement du droit d'auteur, seul l'auteur ou ses ayant-droits ont le droit de poursuivre les auteurs de contrefaçon, ne serait-ce que parce que si l'auteur s'en fout ou qu'il est corruptible, il peut très bien céder ses droits contre quelque chose (ou rien s'il s'en fiche) au contrefacteur, ce qui fait qu'un tiers éventuel qui se plaint pourrait se retrouver lui-même à être accusé de poursuites abusives.
En conséquence de quoi, il me semble qu'il n'est pas légitime de forker un logiciel qu'on estime ne pas respecter une licence libre, en partant du principe que ce logiciel est "en réalité" sous licence libre. C'est pourtant parfois le raisonnement pour Wikipédia (on copie un document considéré comme "propriétaire" par son auteur parce qu'on a de bonnes raisons de penser qu'il est en réalité sous licence libre parce que dérivé d'un truc libre). Peut-être une forme d'incompréhension sur la nature du pouvoir "contaminant" des licences libres?
Tu as essayé en anglais? C'est peut-être un exercice qui est beaucoup plus culturel qu'on imaginerait?
Bon, LeChat ne s'en sort pas mieux:
Monsieur et Madame Saigne pourraient appeler leur fille "Béatrice".
Parce que "Saigne" et "Béatrice" forment un jeu de mots avec "saigne béatrice", qui sonne comme "saigner" (faire couler le sang) et "béat" (heureux, béatifique). C'est une sorte de blague ou de jeu de mots basé sur les noms de famille.
C'est d'ailleurs assez marrant, parce que l'incapacité des IA à comprendre et manier l'humour c'est vraiment un classique de la SF (voir Terminator par exemple).
C'est un jeu de mots sur "Pèlèlsa" qui sonne comme "Pelle Elsa", en référence à la Reine des Neiges ("Elsa" et une pelle pour la neige).
Est-ce que c'est un manque d'humour ou une forme d'humour qui nous dépasse complètement? Bon, j'ai essayé de tester l'humour de chatGPT dans le Chat, et ça marche moyen:
En tant qu'IA, je peux comprendre la structure et la mécanique des jeux de mots, mais je n'ai pas la capacité de ressentir des émotions ou de trouver quelque chose "drôle" de la même manière qu'un humain le ferait. Je peux analyser pourquoi une blague est censée être amusante en identifiant les éléments de surprise, les doubles sens ou les jeux de mots, mais je ne peux pas éprouver le sentiment d'amusement.
Dans le cas de "Monsieur et Madame Pèlèlsa ont une fille, Elsa", le jeu de mots repose sur la similitude phonétique entre "Pèlèlsa" et "pelle Elsa", faisant référence à la Reine des Neiges. C'est cette association inattendue et ludique qui crée l'effet comique pour ceux qui apprécient ce type d'humour.
Je ne comprends pas ton rapport avec la réalité. On peut avoir des convictions personnelles fortes, mais les convictions n'ont jamais changé la réalité. La réalité c'est que les LLM fonctionnent très bien, extrêmement bien, mieux que n'importe qui aurait pu le prédire il y a quelques années, et bien mieux que certaines prétendent ici. Certains LLM sont proposés par des entreprises américaines aux accointances douteuses avec un pouvoir douteux, mais c'est totalement absurde de généraliser, il y a des LLM européens, chinois, plus ou moins libres ou open data, c'est tout un bestaire, et il ne se réduit pas à ChatGPT.
L'existence des LLM pose tout un tas de questions sociétales et environnementales, et beaucoup sont destabilisés par les changements possibles. Ce sont des questions très raisonnables, mais je ne comprends pas comment on peut juste nier les perfs des LLM parce qu'on préfèrerait qu'ils n'existent pas. Et je dis ça alors que j'utilise beaucoup moins les LLM que mes collègues par exemple; la plupart d'entre eux n'ont ni les perfs ni le degré d'ouverture et de confidentialité pour que je leur fasse confiance; je n'ai par contre aucun doute sur l'importance qu'ils vont prendre sur la plupart des métiers.
Sur la recherche, j'imagine que tu m'as mal compris. Comme je connais très bien ce milieu, je voulais juste remettre en perspective l'idée que l'IA ne pouvait y jouer aucun rôle. C'est juste totalement faux, parce que le travail "créatif" dans la recherche représente une fraction très réduite du temps de travail des chercheurs, qui passent leur temps à chercher et intégrer des informations, à remplir des formulaires administratifs et des demandes de financement, et à gérer un environnement de travail complexe (réunions, comités, entretiens individuels, recrutement…); bref, c'est en majorité un travail assez similaire à un travail de cadre dans n'importe quelle structure, avec des spécificités (notamment les règles et l'organisation inefficaces de la fonction publique) qui ne favorisent pas leur productivité. Donc oui, je confirme, imaginer les chercheurs comme des gens à l'intelligence supérieure qui cogitent, c'est une vision fantasmée de la recherche; au quotidien, une grande partie de l'activité est beaucoup plus "standard" et je ne vois pas pourquoi elle ne bénéficierait pas de l'existence de ces logiciels performants.
Je ne sais pas ce que c'est, mais tu as l'air de suggérer que la recherche fondamentale est forcément une activité intellectuelle intense qui repousse les limites du génie humain. C'est une vision très romantisée de la chose, puisque la recherche c'est souvent beaucoup de travail systématique ou de collecte de données, par exemple.
On est bien d'accord que les LLM tels qu'ils fonctionnent actuellement ne seront pas capables d'inventer la relativité. Ça, ce n'est pas de l'IA, ça serait l'atteinte de la singularité technologique. Mais il commence à y avoir des LLM qui servent d'assistants de recherche, qui peuvent automatiser des traitements statistiques ou des analyses de routine, qui peuvent émettre des hypothèses. Le jour où on aura des LLM performants capables de faire des synthèses et des recherches bibliographiques performantes par exemple, ça sera un outil de productivité majeur. Donc, diriger des recherches, probablement pas tout de suite, mais fournir beaucoup d'aide aux chercheurs, c'est vraiment envisageable.
Là j'avoue que c'est flippant. Ce n'est pas qu'il trouve la bonne réponse qui est flippant, c'est sa réaction: "Attendez, il y a quelque chose d'étrange dans cette formulation". Il est surpris. Sérieux, combien d'exemple faudra-t-il pour admettre que ces logiciels se comportent comme des systèmes intelligents?
À ma connaissance, les humains ne font pas tous de la recherche scientifique, et parmi les cheucheurs, bien peu sont capables de repousser les limites du savoir en innovant. Par ailleurs, si la recherche scientifique ne progressait que grâce aux capacités cognitives des chercheurs, ça serait de la philosophie.
La question n'est pas de savoir si les LLM de 2025 sont des génies, on le sait que leur mode de fonctionnement pour l'instant les cantonne à refaire des raisonnements qui ont déja été faits. La question est de savoir s'ils se comportent comme des entités intelligentes.
Le jour où les IA surpasseront les meilleurs chercheurs, on aura atteint la singularité technologique. Ça serait peut-être en 2027, en 2050, ou jamais, mais ça n'est pas encore le cas, et personne ne l'a prétendu.
Non, je pense que tu n'as pas assez fait l'effort de chercher par toi-même.
Le problème est difficile, et en plus il est assez débile (parce que physiquement on ne comprend pas trop comment le clochard fait pour recycler les mégots en cigarettes). Moi je crois que je n'ai jamais compris la solution de ce truc sans qu'on me l'explique.
Ce problème est difficile, ça n'est carrément pas un bon exemple de truc ou une personne random dans la rue va donner intuitivement la bonne solution.
Quant à cette IA, elle a probablement vue passer cette énigme dans son corpus car elle tout de même assez connue.
Je pense que tu es capable de donner la solution parce que toi aussi tu as déja vu passer l'énigme parce qu'elle est assez connue. Je ne vois pas vraiment où tu veux en venir.
Et franchement croire que ceux-ci sont réellement intelligents, ça m'attriste sur comment on définit l'intelligence!
Je pense que tu es dans un profond déni. Visiblement, la réalité, c'est que ça t'attriste qu'il existe des programmes informatiques qui défoncent allègrement tous les tests jamais imaginés pour définir une intelligence artificielle, alors tu préfères le nier. S'il était si évident que ces programmes n'étaient pas intelligents, il serait trivial de les mettre en défaut. Alors vas-y, juste pour vérifier : donne-nous un exemple, une tâche intellectuelle qui est à la portée de tout être humain pris au hasard dans la rue mais pas d'un LLM.
Ce qui me semble évident, c'est que si on tombait sur un extraterrestre qui interagissait avec nous comme le fait chatGPT, jamais il ne viendrait à l'esprit de quiconque de remettre en cause son intelligence. Donc questionner l'intelligence des LLM, c'est uniquement parce qu'on croit inférer de ce que l'on comprend de leur fonctionnement qu'ils ne peuvent que "simuler" l'intelligence. Mais c'est absude! Simuler l'intelligence est exactement la définition de l'IA.
Comment peut-on étudier le fonctionnement d'un logiciel et l'adapter à ses besoins (liberté 1 de la GPL) si celui-ci est obscur et non reproductible ?
Ce que tu décris n'est qu'un cas extrême de choses qui arrivent tout le temps, je ne comprends pas pourquoi dans le cas d'une IA générative ça deviendrait immédiatement compliqué.
La situation où un exécutable libre ne produit de résultats exploitable que grâce à une base de données complexe et d'origine incertaine est assez fréquente. Tu peux par exemple prendre l'équilibrage d'un jeu vidéo, avec des centaines ou des milliers de paramètres qui sont réglés de manière à rendre le jeu intéressant, à faire en sorte qu'une partie dure plus ou moins longtemps, etc. Ça n'est pas propre aux jeux vidéo d'ailleurs, rien qu'au Monopoly tu as des centaines de paramètres (emplacement et prix des propriétés, prix des maisons, prix des loyers pour une, deux, trois quatre maisons et un hôtel, nombre et effet des cartes, etc. Tout ça vient dans un fichier "ruleset.txt" et tu n'as aucune idée de la manière dont il a été généré, sauf éventuellement si les concepteurs du jeu sont très transparents (et de toutes manières tu peux à peine vérifier). Pour moi, les poids pour une IA sont une version extrême du ruleset.txt : des centaines, milliers, millions de paramètres que le programme prend en entrée et qui le rendent utilisable. Tu peux changer les paramètres et vérifier que ça marche ou pas, mais tu n'as pas accès à la procédure (automatique, humaine, mixte, au pif, statistique…) qui a mené à l'établissement de cette base de données.
Ce qui est important, c'est que les données de poids des IA ne sont pas obfusquées : c'est réellement les données qui servent à paramétrer le modèle. Que tu considères qu'elles soient trop complexes pour toi ne change rien à l'affaire : elles sont en effet générées par un algorithme, mais c'est aussi le cas de dizaines de choses que tu utilises tous les jours (moteur de ta voiture, puces de ton ordinateur et de ton téléphone…).
Bien sûr, ce qui semble un peu bizarre c'est que pour un réseau de neurones, le programme en lui-même est une coquille vide (mais pas énormément plus qu'un moteur de jeu vidéo). Mais c'est déja le cas pour une quantité extraordinaire de logiciels. Un moteur de recherche est une coquille vide sans les données aspirées du web, un navigateur est une coquille vide sans les données des pages qu'il est censé afficher, un algorithme de bioinformatique est une coquille vide sans l'annotation du génome dans lequel il pioche les informations, etc. Mais personne n'irait jamais dire qu'un moteur de recherche sous GPL n'est pas libre parce qu'on peut télécharger le logiciel mais pas la base de données. La liberté du logiciel libre, ça ne concerne que le logiciel.
Je pense que cette excellente dépêche montre bien qu'une IA générative ne peut globalement répondre aux critères du logiciel libre, elle est au mieux partiellement libre ou open source.
Je crois que tu te trompes de raisonnement. Le fait qu'un logiciel soit libre ne concerne que ce logiciel, pas ce qui arrive en amont ou en aval, et pas ce qui arrive à l'utilisateur. Ce que tu voudrais pouvoir appliquer à une IA générative va au-delà des libertés du logiciel libre, et j'irais même jusqu'à dire qu'un des critères (la possibilité d'étudier son fonctionnement) jour sur la polysémie du mot "pouvoir". Tu sembles exiger de pouvoir étudier son fonctionnement comme si tu exigeais de pouvoir courir le 100m en 8 secondes. Dans le logiciel libre, "pouvoir étudier le fonctionnement" doit se comprendre comme "avoir le droit d'essayer", pas "être en mesure de réussir". Avec les poids, tu as tout ce qu'il faut pour étudier le fonctionnement; tu peux essayer de réentrainer le modèle avec tes propres données, tu es libre, tu fais ce que tu veux. Le fait que tu ne saches pas le faire (parce que tu n'as pas les données ou parce que c'est trop complexe) ne change pas la licence du logiciel.
Mais sur le fond, je ne suis pas en désaccord. La dépêche est excellente, mais à mon avis elle montre qu'une IA peut être un logiciel libre, mais que c'est le genre de logiciel libre qui aurait aussi besoin de plus qu'être un logiciel libre : reposer sur des données ouvertes, être intégré dans une chaine de logiciels libres, reposer sur des principes d'ouverture scientifique, etc. Tout ça va bien au-delà de la licence du logiciel. Mais ça ne veut pas dire qu'il est légitime de dire que ces logiciels ne sont pas libres : ces logiciels sont parfaitement libres, mais la liberté des logiciels n'est probablement pas suffisante pour un contrôle citoyen efficace (tout comme un navigateur libre ne garantit pas du tout que les sites que tu visites ne truffent pas ton disque de cookies et de traqueurs).
Je ne comprends pas quelles sont les sanctions auxquelles l'état français serait condamné.
Pour être honnête, je ne suis pas sûr de comprendre exactement ce que le jugement dit. Il semble confirmer qu'il y a eu un usage abusif de la force, mais en même temps que l'enquête a été bien faite (alors que l'enquête n'a pas réussi à déterminer les responsabilités individuelles). Ça me semble assez paradoxal, non? Soit c'est la chaine de commandement qui a donné des consignes illégales (volontairement ou par manque de discernement quant à l'état de la situation), soit c'est quelqu'un localement qui a été au-delà des ordres (un gendarme ou un de ses responsables sur le terrain).
Ou alors, le jugement implique que le problème est au niveau de la loi (tout ce qui s'est passé est conforme à la loi française, mais du coup c'est la loi qui doit être changée parce qu'elle permet une violation des droits de l'Homme). Ça pourrait expliquer pourquoi l'État est condamné mais pas les individus… sauf que ma compréhension de l'article 2 de la convention EDH ne permet pas cette interprétation (on peut réprimer une émeute "conformément à la loi").
Les arrêts de la CEDH sont souvent obscurs, parce que les textes sont très vagues. Là, en l'occurrence, le texte de référence est l'article 2, qui dit "La mort n’est pas considérée comme infligée en violation de cet article dans les cas où elle résulterait d’un recours à la force rendu absolument nécessaire : […] pour réprimer, conformément à la loi, une émeute ou une insurrection.", donc si je comprends bien la totalité du débat porte sur le terme "absolument"? Je n'y connais rien en droit, mais j'aimerais bien qu'on m'explique comment des juges peuvent déterminer si l'article 2 est transgressé ou non. Après tout, il n'est jamais absolument nécessaire de réprimer une émeute, donc on va essayer de discuter des options laisser cramer / réprimer? Comment est-ce qu'on fait pour ne pas se retrouver avec une discussion de bistro?
Le deuxième, c’est de distribuer sous une licence non copyleft, genre BSD ou WTFPL. Une licence qui ne nécessite pas de distribuer le code source. Certes, mais en fait tu ne fais pas du Libre.
Ouhlala, quand même.
1) Le libre, c'est les 4 libertés. Donc BSD et WTFPL, c'est libre, et ça n'a jamais été ambigü, même pour la FSF (voir https://www.gnu.org/licenses/bsd.fr.html).
2) Les licences libres non-copyleft n'ont de sens que quand le code source est distribué. Ces licence libres couvrent des logiciels libres, la différence avec les licences copyleft est que le programme modifié n'a pas impérativement à être redistribué sous la même licence (donc BSD: obligation de distribuer le code source, mais pas de le redistribuer).
3) Un logiciel distribué sous licence libre est libre, il n'existe pas d'autre critère. Les concours de "pureté" se sont toujours mal terminés.
Indépendamment de ça, je pense que tu t'es trompé sur l'interprétation de la définition de l'IA OpenSource par l'OSI. Contrairement à ce que tu sembles suggérer, les données d'entrainement ne font pas partie de ce qui doit être fourni (c'est très clair dans la FAQ https://hackmd.io/@opensourceinitiative/osaid-faq). Bon, je trouve que la définition de l'OSI n'est pas terrible de toutes manières, mais si je comprends bien l'idée, c'est que tu dois fournir la recette, et notamment la description des données d'entrainement (du genre, j'imagine, le type de données et les métadonnées associées), en plus des poids et du logiciel (open source).
La reproductibilité ou la transparence n'a pas grand chose à voir avec la licence du programme… J'ai l'impression qu'on mélange des concepts qui sont très distincts (Open source et Open data).
Sans compter que la procédure d'apprentissage implique souvent des interventions humaines, donc tu as là un problème de reproductibilité évident. Même si tu décris ta procédure et qu'elle implique 1000 africains payés 1$/h pendant 6 mois, je ne vois pas ce que ça apporte, même si tu faisais la même chose tu n'aurais pas le même résultat.
Et avec tout ça, le logiciel avec ses poids peut parfaitement être distribué sous une licence libre et entrer sans aucune ambiguité dans la définition d'un logiciel libre.
Les humains ont conçu l'algorithme, ils ont aussi conçu le jeu d'échecs, ils ont conçu les ordinateurs sur lesquels le programme tourne… Je ne comprends pas trop où tu veux en venir.
Je ne pense pas qu'une extension de la liberté des logiciels aux données et aux procédés qui ont permis de calculer les données d'entrée du programme soit cohérente et souhaitable. Ça semble n'avoir aucune fin. Un programme informatique, c'est un truc exécutable qui prend des données en entrée et qui te sort d'autres données; il est très fréquent d'avoir besoin de plusieurs programmes informatiques pour effectuer une tâche (gimp pour créer une image, libre office pour la mettre en page sur une dispositive, la visionneuse pour la projeter, etc), et certains programmes de cette chaine peuvent être libre et d'autres non. Quand on parle de réseaux de neurones, on parle de deux programmes, P1 qui entraine le réseau qui qui détermine des poids P en partant d'un jeu de données d'entrainement D, et un programme P2 qui prend une requête R, et qui utilise P pour donner une réponse Q. Tu as donc D -> P1 -> P, et P + R -> P2 -> Q. Si tu distribues le programme P2, tu refiles P2 et P, l'utilisateur procure la requête R, et voila, c'est un programme tout comme n'importe quelle programme informatique. P2 ne devient pas "non libre" si tu ne fournis pas toute la chaine logicielle et humaine qui a servi à déterminer P. Comme je l'ai écris plus haut, refiler P sans permettre de reproduire le processus D -> P1 -> P n'est pas très transparent, mais pour moi c'est pareil que de mettre une image retouchée avec Photoshop dans LibreOffice, ça ne concerne pas la licence de LibreOffice.
On a le droit de trouver cette situation sous-optimale, et on peut probablement définir d'autres concepts pour définir à quelle point une IA est ouverte, mais je pense qu'essayer d'utiliser le concept du logiciel libre pour ça est une erreur qui ne peut pas mener bien loin, parce qu'il faudrait appliquer une logique absurde qui ne s'applique pas du tout aux autres programmes informatiques.
Trop tard pour modifier, j'ai fais une erreur évidente : pour les "média" (style images), la GPL impose le format "préféré" pour la modification, donc mon exemple est confus, toutes mes excuses. J'aurais dû vouloir dire 1) le libre permet de distribuer des images sous format png (pas la GPL, mais la GPL est clairement une exception), et 2) ça ne s'applique au'aux média, et pas aux données de manière générale, même sous GPL.
Du coup, si les poids d'un réseau de neurones sont données dans un format natif (je ne sais pas en fait comment ces poids sont stockés en général, bases de données, fichiers texte, xml?), c'est clairement le format qui peut être importé ou exporté par l'algorithme d'entrainement, et j'ai l'impression que c'est exactement ce qui est demandé par la GPL.
Un réseau de neurone sans les données d'entraînement ni les soft, c'est comme un binaire
Bof, est-ce que ça ne serait pas plutôt un jeu avec le moteur de jeu distribué sous GPL et les données distribuées dans un format exploitable (png, jpg, etc) mais pas dans le format natif (svg…)? Ou est-ce que toute analogie est incomplète et qu'il ne faut pas raisonner comme ça?
J'ai l'impression que l'application de la définition d'un logiciel libre suppose que tu doives disposer de toutes les informations nécessaires pour recréer l'exécutable sur ta machine, donc techniquement, le code source du réseau et les poids. Les poids ont été déterminés à partir d'une procédure d'entrainement, qui est quelque chose qui s'est déroulée en amont, qui a nécessité des données et d'autres logiciels, mais qui ne sont pas nécessaire à l'exécution du logiciel.
D'une manière générale, la GPL n'est pas transitive quand on parle de données. Tu peux par exemple créer des images avec Photoshop et d'inclure les png dans un jeu libre, ça ne contrevient pas à la GPL. Tu peux même ne rien dire sur la manière dont les png ont été générés, tu n'as pas à fournir ni le nom, ni les sources du logiciel que tu as utilisé.
Du coup, pour les poids d'un réseau de neurones, le respect de la GPL ne nécessite probablement pas d'expliquer d'où ils sortent: quel algorithme, quelles données d'entrainement, quelle procédure d'entrainement… Tout ça ne semble pas faire partie des informations requises par la GPL, parce qu'on parle de données d'entrée du programme, et pas du programme en lui-même.
Bien sûr, un tel réseau de neurones, distribué sous licence libre avec les poids mais sans information sur la procédure d'entrainement, ne serait pas transparent. Mais transparent et libre, ça n'est pas la même chose: tu peux être transparent et non-libre (par exemple si tu distribues les sources sous une licence qui ne permet pas la redistribution des versions modifiées), et tu peux être libre et non-transparent, par exemple des trucs dans l'esprit de
double expexpx(double x) { 11956.81*x-22295.44; } // This does the job
dans ton code (c'est l'extension linéaire de la fonction autour de x=2, mais si tu ne le sais pas tu ne peux pas deviner d'où viennent les coefficients).
Demander les données d'entrainement et l'algo sous licence libre, en prétendant qu'autrement c'est du faux libre, c'est aller plus loin que la définition du libre. On a le droit, bien sûr, de dire que les définitions actuelles du libre ne sont plus adaptées et qu'il faudrait une GPLv4 par exemple (y compris pour essayer de définir une licence pour ce qui sort des IA entrainées par des données libres), mais ça n'est pas la même chose.
Je me suis toujours méfié des discussions sur l'"esprit du libre". L'esprit du libre, c'est d'avoir un bugtracker, c'est d'avoir une communauté ouverte, c'est seulement le copyleft, c'est d'accepter les pull request… Rien dans le libre n'impose une quelconque "pureté", et cette course à la pureté finit toujours mal, parce qu'on trouve toujours des trucs qui ne sont pas assez purs (un logo ou une marque déposés, l'autorisation de plug-ins propriétaires, des blobs binaires dans les drivers…). Je n'ai rien contre un club des purs qui s'entre-écharpent pour savoir qui est le plus à même de représenter l'esprit de l'essence du libre, mais personne n'a la légitimité de prétendre qu'un truc qui respecte les quatre libertés et/ou une licence considérée comme libre n'est "pas libre".
Note : le moteur de Firefox déteste ce genre de blague, par contre tout ce qui est basé sur Chromium semble le gérer sans trop de souci.
Il ne faut pas le dire trop fort, parce que si Google commence à coller ça dans les trackers qu'il affiche sur 99% des pages internet, Firefox va tomber à 0.1% de part de marché en 1 semaine…
Est-ce que cela a un sens d'autoriser une succession infinie de "variation selectors" pour chaque caractère?
Dans tous les cas, il semble assez facile pour une implémentation de couper la liste à un nombre raisonnable, pour au moins éviter les conséquences sur les perfs d'affichage.
Note que les 3% du PIB c'est pour la recherche totale (publique + privée). Quand tu regardes les statistiques au niveau Européen, la recherche publique en France est à peu près au niveau des autres pays (pas au-dessus, on est bien d'accord, 0.8% à 0.9% du PIB), c'est la recherche privée qui est en retard, malgré le CIR et les cadeaux fiscaux.
Depuis 25 ans elle démantèle lentement ses institutions de recherche.
Pas toutes, et c'est caricatural de parler de démantèlement. La France a plein de problèmes avec ses institutions de recherche publiques, à la fois pratiques et idéologiques. Elle n'arrive pas à financer ses universités, elle n'arrive pas à leur donner le rôle qu'elles devraient avoir par rapport aux écoles d'ingénieur, elle n'arrive pas à décider quoi faire avec les what millions d'universités dans les villes moyennes qui ne pourront jamais mener une recherche efficace, elle n'arrive pas à intégrer les docteurs à la place qui leur revient sur le marché du travail, elle n'arrive pas à donner une ligne claire au CNRS, elle n'arrive pas à gérer la masse salariale (les chercheurs coûtent trop cher mais sont trop mal payés), ni la pyramide des âges (avec les décalages des départs en retraite), ni les carrières complexes (impossible de recruter un fonctionnaire après 40 ans), elle n'arrive pas à gérer l'enfer bureaucratique qu'elle a elle-même crée, elle n'arrive pas à simplifier le mille-feuille administratif, son traitement des fraudes scientifiques est moyen-âgeux, il n'y a aucun traitement des conflits d'intérêt… Il y a plein de problèmes dans la recherche, mais globalement, les indicateurs ne sont pas mauvais. La productivité est correcte, la formation universitaire est de bon niveau, certaines institutions phares sont très visibles, certaines disciplines (maths, pĥysique) sont à la pointe, les conditions de travail pour les chercheurs sont assez attractives pour les étrangers, on sort assez efficacement de la culture du mandarinat (notamment par l'attribution directe des financements aux chercheurs sans passer par les directeurs de labo), il y a en France des équipements de pointe et des projets d'équipements de pointe (surtout pour les physiciens, qui raffolent de ces gros équipements qui coûtent des milliards et que les politiques aiment bien inaugurer)… Bien sûr, quand un secteur comme ça évolue, il y a des perdants, des unités qui disparaissent, des secteurs peu performants qui sont abandonnés ou restructurés, ou redirigés vers des occuppations plus visibles (recherche appliquée, enseignement…), puisqu'une réforme à budget stable (ou en légère décroissance) ne va pas bénéficier à tout le monde. Dans tous les cas, l'idée d'une recherche publique "démantelée" me semble mal refléter la situation générale; si tu fais de la phyisque des particules ou de l'algorithmique en IA dans un grand établissement, tu n'es pas du tout démantelé. Si tu fais des sciences sociales à l'université de Trifouillis les Oies, par contre, oui, là c'est sûr que tu es démantelé.
Si tu me qualifie de gauchiste, je pourrais toujours crier à la calomnie ça n'en sera pas moins vrai.
Wikipédia n'a pas vocation à affirmer des vérités, mais à rapporter un point de vue neutre. Tu peux par exemple reprendre les éléments de langage du journal ("Il se qualifie comme conservateur et identitaire" par exemple, je ne suis pas très au fait du vocabulaire alternatif utilisé par l'extrême droite), en le pondérant par une phrase dans le style "mais sa ligne éditoriale est souvent qualifiée d'extrême droite, voire d'islamophobe, par d'autres médias", ou quelque chose d'équivalent.
Ça n'est pas un hasard si c'est dans les principes fondateurs de Wikipédia, c'est que si c'est écrit comme ça, il y a beaucoup moins de raisons de se plaindre.
Mais non, mais c'est juste que je ne vois pas l'intérêt de s'offusquer pour le principe. À qui s'adressent ces documents? Les graphiques illustrent des choses qu'on sait très bien, mais ils les illustrent d'une manière que je ne trouve pas informative, et ça me gonfle. On ne peut pas se prétendre scientifique le jour, et militant le soir, en partant du principe que la rigueur du raisonnement, ça ne vaut pas pour les activités militantes.
Si tu veux parler de l'effort de recherche, alors tu dois regarder l'évolution des équivalents temps plein ou de la masse salariale, pas des seuls recrutements. C'est complètement trivial, tu peux réduire tes recrutements tout en augmentant ta masse salariale, ça dépend de la pyramide des ages, qui reste très déséquilibrée au CNRS. En fonction de la succession des gouvernements, tu as eu une alternance de périodes fastes et moins fastes, et donc la masse salariale fait le yoyo en fonction des départs à la retraite.
Tu peux aussi considérer la totalité de la masse salariale, et pas seulement cette des fonctionnaires. Parce que tu peux très bien augmenter ton personnel sans ouvrir de concours de fonctionnaire. Évidemment, idéologiquement, tu peux trouver ça bien ou mal, mais la question est assez indépendante de l'investissement dans la recherche (à moins d'imaginer par essence qu'un fonctionnaire est un meilleur chercheur, ce qui reste quand même assez douteux). Ce que le graphique montre, ce n'est pas une diminution de l'investissement public dans la recherche, c'est un changement progressif de modèle, avec une baisse du recrutement des cadres (fonctionnaires) de la recherche, qui vont chacun devoir financer leurs équipes par d'autres moyens (appels à projets, partenariats). À comparer par exemple avec le budget de l'ANR https://anr.fr/fileadmin/documents/2024/page-budget-2023-fig1.jpg
Au fond, quelle est la raison du changement de modèle? Bon, c'est évidemment multifactoriel, mais c'est principalement parce que l'État n'a pas confiance dans l'efficacité du modèle "traditionnel" de la recherche française. Pour plein de raisons plus ou moins idéologiques ou plus ou moins objectives, mais en gros, l'idée c'est que l'argent public serait mieux dépensé dans des groupes de recherche temporaires qui se concentreraient sur un projet scientifique pendant 4 ou 5 ans avant d'être refondu avec des contours différents pour un autre projet. Les labos et instituts de recherche seraient les hôtes de ces projets et leurs fourniraient les moyens de travailler, mais sans autre politique de recherche que de favoriser l'épanouissement scientifique des chercheurs pendant le temps de leur projet.
Sans surprise, c'est déja comme ça que fonctionnent les instituts scientifiques qui sont sur le devant de la scène (institut Pasteur, collège de France, etc). De nombreux chercheurs qui ont une activité scientifique soutenue n'ont pas de problèmes majeurs à être financés et à recruter les membres de leurs équipes selon leurs besoins au fil de leurs projets; ils ont par contre besoin d'un environnement scientifique (administration, locaux) et d'un accès à des équipements parfois coûteux; les enseignant-chercheurs cherchent à se débarrasser de leurs charges d'enseignement en les "rachetant" grâce au budget des projets, etc. Ce que ne dit pas par exemple les graphiques de RoguESR, c'est quelle part des chercheurs recrutés au CNRS ont déja tout ou partie de leur salaire de jeune chercheur financé par une source extérieure (typiquement, contrat européen). Ça doit énormément dépendre des sections du CNRS, mais je pense que la norme s'établit autour de 50%. Ce modèle définit un statut du chercheur plus proche d'une profession libérale que d'un statut de fonctionnaire.
Je comprends les critiques du modèle "moderne" de la recherche, mais je ne comprends pas quel modèle on propose à la place. Un monde où on recrute toujours plus, où tout le monde a des crédits pour fonctionner, où la recherche n'est évaluée ni en terme de productivité, ni en terme de retombées pour la société, où la liberté académique est totale… En gros, il faudrait que ça soit les chercheurs qui aient le contrôle du robinet du pognon, et qu'ils n'aient pas de comptes à rendre, parce que leur statut garantirait automagiquement à la société que ce que le chercheur veut, c'est ce qui est bon pour la société. À part donner envie aux dirigeants de restreindre encore plus les marges de manœuvre, je ne vois pas ce que ça peut apporter.
Ça parait tellement caricatural que je trouve ça contre-productif. Si on veut la la liberté académique, alors c'est normal de devoir négocier avec la société. Si on veut plus de PIB vers la recherche, c'est normal qu'il y ait des contreparties, notamment sur les retombées économiques. Si on veut des emplois sécurisés, alors c'est normal d'être évalués. C'est normal que le gouvernement et l'État aient le contrôle du robinet de pognon, c'est normal que la politique de la recherche dépende du résultat des élections. Ça ne fait pas forcément plaisir, mais c'est normal.
# Nationalité du logiciel?
Posté par arnaudus . En réponse au journal Il y a du chemin avant que nos dirigeants intègrent la notion de souveraineté à l'heure du numérique. Évalué à -2 (+2/-7). Dernière modification le 03 mars 2025 à 11:18.
J'ai un doute pour le coup du logiciel. Si tu héberges tes données dans la Drome sur un serveur Windows, tu pars du principe que 1) Microsoft a accès à tes données, et 2) le gouvernement US a légalement (au moins selon le droit US) le droit d'y accéder? Si on va par là, Linux n'est pas un logiciel français… Je me demande s'il n'y a quand même pas du FUD là-dedans. On peut reprocher plein de trucs à Windows, mais de là à imaginer que le gouvernement US a un accès légal à toutes les données des ordinateurs qui font tourner Windows, ça me semble un chouilla exagéré.
Pour les clouds en France, il semble que l'usage est de les faire gérer par les filiales françaises de ces entreprises US, qui ne sont pas soumises au droit US. On peut douter en pratique de la solidité du truc, mais apparemment ça a au moins convaincu l'État français qui héberge de cette manière des données confidentielles (coffre-fort numérique des administrations, etc).
[^] # Re: Liberté & démocratie
Posté par arnaudus . En réponse au lien C'est la peau de la démocratie qu'ils veulent. Évalué à 4 (+3/-2).
D'une manière générale, la démocratie n'est pas très résiliente quand une majorité de la population est convaincue qu'elle n'est pas nécessaire. Je veux dire que ces dictateurs de pacotille ne seraient rien s'il n'arrivaient pas à convaincre les "gueux" qu'il seraient plus heureux sans démocratie. Dans le cas qui nous préoccupe, il n'y a pas réellement de tentative de renverser le pouvoir par des moyens malhonnêtes ou détournés, tout est assumé : l'assaut du capitole, les discours masculinistes, racistes, suprémacistes, la personnalité du leader et de ses acolytes… Ils ont réellement réussi à convaincre une majorité des votants qu'ils allaient mieux gérer le pays que leurs opposants.
Il y a bien sûr l'argument de la manipulation des foules, le populisme, ou l'aliénation par les puissances du capital, la communication, le contrôle des médias et des rézosocio, etc. Mais j'ai toujours trouvé cet argument insoutenable, puisque la démocratie, c'est basé sur la puissance de conviction. Le principe de la démocratie ne peut pas admettre qu'un vote ou une opinion n'est pas valide quand on a été convaincu par une manoeuvre, parce que les convictions politiques naissent dans des contextes (familiaux, sociaux, économiques…) spécifiques à chacun. Si c'était vrai qu'un vote populiste n'était pas valide parce qu'il est inspiré par CNews, alors le vote pour la droite traditionnelle dans une famille d'entrepreneurs n'est pas non plus valide, et le vote communiste quand on a grandi dans une famille d'ouvriers non plus. La démocratie n'a pas le droit de questionner l'origine des opinions; elle peut éventuellement essayer de rendre la communication un peu plus égalitaire dans les médias, mais dans la vie en général c'est assez absurde; autant demander à ce que toutes les opinions soient également représentées au bistro du coin ou à un repas de famille. En fait, j'ai l'impression que la démocratie n'a pas le droit de remettre en question l'intelligence des électeurs, parce que la seule alternative serait… l'absence de démocratie (par exemple avec une sélection des électeurs selon certains critères de connaissance des institutions, des biais cognitifs, etc).
J'ai déja assisté au bureau de vote à un scandale organisé par une petite vieille qui voulait voter pour Marine Le Pen aux élections municipales de mon bled, et qui ne comprenait pas pourquoi il n'y avait pas son nom sur les bulletins. Je veux dire, pourquoi son vote compte autant que le mien? Bah, parce que c'est le principe de la démocratie. Et quand la majorité vote n'importe quoi, les élus sont n'importe qui. Je ne vois pas comment contrer ça sans partir du principe que les électeurs ne sont pas des débiles influençables.
[^] # Re: Pourquoi dire IA si on ne parle que des réseaux de neurones ?
Posté par arnaudus . En réponse à la dépêche Une intelligence artificielle libre est-elle possible ?. Évalué à 3 (+0/-0).
Avec cette interprétation, avec 6 mégots le clochard pourrait se fumer 2,33 cigarettes : il fait 2 clopes avec les 6 mégots, puis 2/3 de clope avec les 2 mégots qu'il reste, qu'il pourra fumer jusqu'à se cramer les doigts.
Mais alors du coup je crois que je n'ai pas compris la bonne réponse attendue et je vois mal comment un LLM pourrait s'en sortir alors que le problème semble particulièrement pas clair (en tout cas pour un non-fumeur).
[^] # Re: Un gpl killer? TAN !
Posté par arnaudus . En réponse au lien FYI: An appeals court may kill a GNU GPL software license. Évalué à 5 (+2/-0).
Est-ce que vous savez si des juristes dont c'est le boulot ont déja explicité qui est en droit de faire respecter les licences? Si je comprends bien, c'est particulièrement complexe dans le cas ici.
A publie un logiciel X1 sous licence libre. B modifie ce logiciel et publie X2 sous licence libre + restrictions. C reprend X2 et republie X3 sous licence libre sans restrictions, parce que la licence de X1 lui en donne le droit. Sauf que B n'est pas content et porte plainte contre C pour contrefaçon. Comment C peut-il faire valoir ses droits? Le droit de retirer les clauses supplémentaires ne lui est pas donné dans la licence de X2, il faut donc se référer à la licence de X1. Clairement, la licence de X2 est en violation de la licence de X1, mais seul A a le droit de poursuivre B pour contrefaçon, pas C, puisque B n'a jamais violé les droits d'auteur de C. En conséquence, je me demande comment C peut être légalement fondé à ignorer les restrictions de la licence X2 sans attenter une action conjointe avec A.
Je trouve la situation assez problématique, surtout si A a disparu (l'entreprise a coulé, le type est Bronsonisé ou est passé à autre chose). Dans le fonctionnement du droit d'auteur, seul l'auteur ou ses ayant-droits ont le droit de poursuivre les auteurs de contrefaçon, ne serait-ce que parce que si l'auteur s'en fout ou qu'il est corruptible, il peut très bien céder ses droits contre quelque chose (ou rien s'il s'en fiche) au contrefacteur, ce qui fait qu'un tiers éventuel qui se plaint pourrait se retrouver lui-même à être accusé de poursuites abusives.
En conséquence de quoi, il me semble qu'il n'est pas légitime de forker un logiciel qu'on estime ne pas respecter une licence libre, en partant du principe que ce logiciel est "en réalité" sous licence libre. C'est pourtant parfois le raisonnement pour Wikipédia (on copie un document considéré comme "propriétaire" par son auteur parce qu'on a de bonnes raisons de penser qu'il est en réalité sous licence libre parce que dérivé d'un truc libre). Peut-être une forme d'incompréhension sur la nature du pouvoir "contaminant" des licences libres?
[^] # Re: Pourquoi dire IA si on ne parle que des réseaux de neurones ?
Posté par arnaudus . En réponse à la dépêche Une intelligence artificielle libre est-elle possible ?. Évalué à 4 (+1/-0).
Tu as essayé en anglais? C'est peut-être un exercice qui est beaucoup plus culturel qu'on imaginerait?
Bon, LeChat ne s'en sort pas mieux:
C'est d'ailleurs assez marrant, parce que l'incapacité des IA à comprendre et manier l'humour c'est vraiment un classique de la SF (voir Terminator par exemple).
Est-ce que c'est un manque d'humour ou une forme d'humour qui nous dépasse complètement? Bon, j'ai essayé de tester l'humour de chatGPT dans le Chat, et ça marche moyen:
[^] # Re: Pourquoi dire IA si on ne parle que des réseaux de neurones ?
Posté par arnaudus . En réponse à la dépêche Une intelligence artificielle libre est-elle possible ?. Évalué à 6 (+4/-1).
Je ne comprends pas ton rapport avec la réalité. On peut avoir des convictions personnelles fortes, mais les convictions n'ont jamais changé la réalité. La réalité c'est que les LLM fonctionnent très bien, extrêmement bien, mieux que n'importe qui aurait pu le prédire il y a quelques années, et bien mieux que certaines prétendent ici. Certains LLM sont proposés par des entreprises américaines aux accointances douteuses avec un pouvoir douteux, mais c'est totalement absurde de généraliser, il y a des LLM européens, chinois, plus ou moins libres ou open data, c'est tout un bestaire, et il ne se réduit pas à ChatGPT.
L'existence des LLM pose tout un tas de questions sociétales et environnementales, et beaucoup sont destabilisés par les changements possibles. Ce sont des questions très raisonnables, mais je ne comprends pas comment on peut juste nier les perfs des LLM parce qu'on préfèrerait qu'ils n'existent pas. Et je dis ça alors que j'utilise beaucoup moins les LLM que mes collègues par exemple; la plupart d'entre eux n'ont ni les perfs ni le degré d'ouverture et de confidentialité pour que je leur fasse confiance; je n'ai par contre aucun doute sur l'importance qu'ils vont prendre sur la plupart des métiers.
Sur la recherche, j'imagine que tu m'as mal compris. Comme je connais très bien ce milieu, je voulais juste remettre en perspective l'idée que l'IA ne pouvait y jouer aucun rôle. C'est juste totalement faux, parce que le travail "créatif" dans la recherche représente une fraction très réduite du temps de travail des chercheurs, qui passent leur temps à chercher et intégrer des informations, à remplir des formulaires administratifs et des demandes de financement, et à gérer un environnement de travail complexe (réunions, comités, entretiens individuels, recrutement…); bref, c'est en majorité un travail assez similaire à un travail de cadre dans n'importe quelle structure, avec des spécificités (notamment les règles et l'organisation inefficaces de la fonction publique) qui ne favorisent pas leur productivité. Donc oui, je confirme, imaginer les chercheurs comme des gens à l'intelligence supérieure qui cogitent, c'est une vision fantasmée de la recherche; au quotidien, une grande partie de l'activité est beaucoup plus "standard" et je ne vois pas pourquoi elle ne bénéficierait pas de l'existence de ces logiciels performants.
[^] # Re: Pourquoi dire IA si on ne parle que des réseaux de neurones ?
Posté par arnaudus . En réponse à la dépêche Une intelligence artificielle libre est-elle possible ?. Évalué à 4 (+2/-1).
Je ne sais pas ce que c'est, mais tu as l'air de suggérer que la recherche fondamentale est forcément une activité intellectuelle intense qui repousse les limites du génie humain. C'est une vision très romantisée de la chose, puisque la recherche c'est souvent beaucoup de travail systématique ou de collecte de données, par exemple.
On est bien d'accord que les LLM tels qu'ils fonctionnent actuellement ne seront pas capables d'inventer la relativité. Ça, ce n'est pas de l'IA, ça serait l'atteinte de la singularité technologique. Mais il commence à y avoir des LLM qui servent d'assistants de recherche, qui peuvent automatiser des traitements statistiques ou des analyses de routine, qui peuvent émettre des hypothèses. Le jour où on aura des LLM performants capables de faire des synthèses et des recherches bibliographiques performantes par exemple, ça sera un outil de productivité majeur. Donc, diriger des recherches, probablement pas tout de suite, mais fournir beaucoup d'aide aux chercheurs, c'est vraiment envisageable.
[^] # Re: Pourquoi dire IA si on ne parle que des réseaux de neurones ?
Posté par arnaudus . En réponse à la dépêche Une intelligence artificielle libre est-elle possible ?. Évalué à 1 (+1/-3).
Là j'avoue que c'est flippant. Ce n'est pas qu'il trouve la bonne réponse qui est flippant, c'est sa réaction: "Attendez, il y a quelque chose d'étrange dans cette formulation". Il est surpris. Sérieux, combien d'exemple faudra-t-il pour admettre que ces logiciels se comportent comme des systèmes intelligents?
[^] # Re: Pourquoi dire IA si on ne parle que des réseaux de neurones ?
Posté par arnaudus . En réponse à la dépêche Une intelligence artificielle libre est-elle possible ?. Évalué à 3 (+0/-0).
À ma connaissance, les humains ne font pas tous de la recherche scientifique, et parmi les cheucheurs, bien peu sont capables de repousser les limites du savoir en innovant. Par ailleurs, si la recherche scientifique ne progressait que grâce aux capacités cognitives des chercheurs, ça serait de la philosophie.
La question n'est pas de savoir si les LLM de 2025 sont des génies, on le sait que leur mode de fonctionnement pour l'instant les cantonne à refaire des raisonnements qui ont déja été faits. La question est de savoir s'ils se comportent comme des entités intelligentes.
Le jour où les IA surpasseront les meilleurs chercheurs, on aura atteint la singularité technologique. Ça serait peut-être en 2027, en 2050, ou jamais, mais ça n'est pas encore le cas, et personne ne l'a prétendu.
[^] # Re: Pourquoi dire IA si on ne parle que des réseaux de neurones ?
Posté par arnaudus . En réponse à la dépêche Une intelligence artificielle libre est-elle possible ?. Évalué à 3 (+0/-0).
Le problème est difficile, et en plus il est assez débile (parce que physiquement on ne comprend pas trop comment le clochard fait pour recycler les mégots en cigarettes). Moi je crois que je n'ai jamais compris la solution de ce truc sans qu'on me l'explique.
Ce problème est difficile, ça n'est carrément pas un bon exemple de truc ou une personne random dans la rue va donner intuitivement la bonne solution.
Je pense que tu es capable de donner la solution parce que toi aussi tu as déja vu passer l'énigme parce qu'elle est assez connue. Je ne vois pas vraiment où tu veux en venir.
[^] # Re: Pourquoi dire IA si on ne parle que des réseaux de neurones ?
Posté par arnaudus . En réponse à la dépêche Une intelligence artificielle libre est-elle possible ?. Évalué à 1 (+3/-5).
Je pense que tu es dans un profond déni. Visiblement, la réalité, c'est que ça t'attriste qu'il existe des programmes informatiques qui défoncent allègrement tous les tests jamais imaginés pour définir une intelligence artificielle, alors tu préfères le nier. S'il était si évident que ces programmes n'étaient pas intelligents, il serait trivial de les mettre en défaut. Alors vas-y, juste pour vérifier : donne-nous un exemple, une tâche intellectuelle qui est à la portée de tout être humain pris au hasard dans la rue mais pas d'un LLM.
Ce qui me semble évident, c'est que si on tombait sur un extraterrestre qui interagissait avec nous comme le fait chatGPT, jamais il ne viendrait à l'esprit de quiconque de remettre en cause son intelligence. Donc questionner l'intelligence des LLM, c'est uniquement parce qu'on croit inférer de ce que l'on comprend de leur fonctionnement qu'ils ne peuvent que "simuler" l'intelligence. Mais c'est absude! Simuler l'intelligence est exactement la définition de l'IA.
[^] # Re: IA = code + données
Posté par arnaudus . En réponse à la dépêche Une intelligence artificielle libre est-elle possible ?. Évalué à 10 (+7/-0).
Ce que tu décris n'est qu'un cas extrême de choses qui arrivent tout le temps, je ne comprends pas pourquoi dans le cas d'une IA générative ça deviendrait immédiatement compliqué.
La situation où un exécutable libre ne produit de résultats exploitable que grâce à une base de données complexe et d'origine incertaine est assez fréquente. Tu peux par exemple prendre l'équilibrage d'un jeu vidéo, avec des centaines ou des milliers de paramètres qui sont réglés de manière à rendre le jeu intéressant, à faire en sorte qu'une partie dure plus ou moins longtemps, etc. Ça n'est pas propre aux jeux vidéo d'ailleurs, rien qu'au Monopoly tu as des centaines de paramètres (emplacement et prix des propriétés, prix des maisons, prix des loyers pour une, deux, trois quatre maisons et un hôtel, nombre et effet des cartes, etc. Tout ça vient dans un fichier "ruleset.txt" et tu n'as aucune idée de la manière dont il a été généré, sauf éventuellement si les concepteurs du jeu sont très transparents (et de toutes manières tu peux à peine vérifier). Pour moi, les poids pour une IA sont une version extrême du ruleset.txt : des centaines, milliers, millions de paramètres que le programme prend en entrée et qui le rendent utilisable. Tu peux changer les paramètres et vérifier que ça marche ou pas, mais tu n'as pas accès à la procédure (automatique, humaine, mixte, au pif, statistique…) qui a mené à l'établissement de cette base de données.
Ce qui est important, c'est que les données de poids des IA ne sont pas obfusquées : c'est réellement les données qui servent à paramétrer le modèle. Que tu considères qu'elles soient trop complexes pour toi ne change rien à l'affaire : elles sont en effet générées par un algorithme, mais c'est aussi le cas de dizaines de choses que tu utilises tous les jours (moteur de ta voiture, puces de ton ordinateur et de ton téléphone…).
Bien sûr, ce qui semble un peu bizarre c'est que pour un réseau de neurones, le programme en lui-même est une coquille vide (mais pas énormément plus qu'un moteur de jeu vidéo). Mais c'est déja le cas pour une quantité extraordinaire de logiciels. Un moteur de recherche est une coquille vide sans les données aspirées du web, un navigateur est une coquille vide sans les données des pages qu'il est censé afficher, un algorithme de bioinformatique est une coquille vide sans l'annotation du génome dans lequel il pioche les informations, etc. Mais personne n'irait jamais dire qu'un moteur de recherche sous GPL n'est pas libre parce qu'on peut télécharger le logiciel mais pas la base de données. La liberté du logiciel libre, ça ne concerne que le logiciel.
Je crois que tu te trompes de raisonnement. Le fait qu'un logiciel soit libre ne concerne que ce logiciel, pas ce qui arrive en amont ou en aval, et pas ce qui arrive à l'utilisateur. Ce que tu voudrais pouvoir appliquer à une IA générative va au-delà des libertés du logiciel libre, et j'irais même jusqu'à dire qu'un des critères (la possibilité d'étudier son fonctionnement) jour sur la polysémie du mot "pouvoir". Tu sembles exiger de pouvoir étudier son fonctionnement comme si tu exigeais de pouvoir courir le 100m en 8 secondes. Dans le logiciel libre, "pouvoir étudier le fonctionnement" doit se comprendre comme "avoir le droit d'essayer", pas "être en mesure de réussir". Avec les poids, tu as tout ce qu'il faut pour étudier le fonctionnement; tu peux essayer de réentrainer le modèle avec tes propres données, tu es libre, tu fais ce que tu veux. Le fait que tu ne saches pas le faire (parce que tu n'as pas les données ou parce que c'est trop complexe) ne change pas la licence du logiciel.
Mais sur le fond, je ne suis pas en désaccord. La dépêche est excellente, mais à mon avis elle montre qu'une IA peut être un logiciel libre, mais que c'est le genre de logiciel libre qui aurait aussi besoin de plus qu'être un logiciel libre : reposer sur des données ouvertes, être intégré dans une chaine de logiciels libres, reposer sur des principes d'ouverture scientifique, etc. Tout ça va bien au-delà de la licence du logiciel. Mais ça ne veut pas dire qu'il est légitime de dire que ces logiciels ne sont pas libres : ces logiciels sont parfaitement libres, mais la liberté des logiciels n'est probablement pas suffisante pour un contrôle citoyen efficace (tout comme un navigateur libre ne garantit pas du tout que les sites que tu visites ne truffent pas ton disque de cookies et de traqueurs).
[^] # Re: Condamnée à quoi ?
Posté par arnaudus . En réponse au lien La France condamnée par la Cour européenne des droits de l'homme pour violation du droit à la vie. Évalué à 3 (+0/-0). Dernière modification le 27 février 2025 à 16:14.
Pour être honnête, je ne suis pas sûr de comprendre exactement ce que le jugement dit. Il semble confirmer qu'il y a eu un usage abusif de la force, mais en même temps que l'enquête a été bien faite (alors que l'enquête n'a pas réussi à déterminer les responsabilités individuelles). Ça me semble assez paradoxal, non? Soit c'est la chaine de commandement qui a donné des consignes illégales (volontairement ou par manque de discernement quant à l'état de la situation), soit c'est quelqu'un localement qui a été au-delà des ordres (un gendarme ou un de ses responsables sur le terrain).
Ou alors, le jugement implique que le problème est au niveau de la loi (tout ce qui s'est passé est conforme à la loi française, mais du coup c'est la loi qui doit être changée parce qu'elle permet une violation des droits de l'Homme). Ça pourrait expliquer pourquoi l'État est condamné mais pas les individus… sauf que ma compréhension de l'article 2 de la convention EDH ne permet pas cette interprétation (on peut réprimer une émeute "conformément à la loi").
Les arrêts de la CEDH sont souvent obscurs, parce que les textes sont très vagues. Là, en l'occurrence, le texte de référence est l'article 2, qui dit "La mort n’est pas considérée comme infligée en violation de cet article dans les cas où elle résulterait d’un recours à la force rendu absolument nécessaire : […] pour réprimer, conformément à la loi, une émeute ou une insurrection.", donc si je comprends bien la totalité du débat porte sur le terme "absolument"? Je n'y connais rien en droit, mais j'aimerais bien qu'on m'explique comment des juges peuvent déterminer si l'article 2 est transgressé ou non. Après tout, il n'est jamais absolument nécessaire de réprimer une émeute, donc on va essayer de discuter des options laisser cramer / réprimer? Comment est-ce qu'on fait pour ne pas se retrouver avec une discussion de bistro?
# Kof kof
Posté par arnaudus . En réponse à la dépêche Une intelligence artificielle libre est-elle possible ?. Évalué à 9 (+6/-0). Dernière modification le 27 février 2025 à 14:46.
Ouhlala, quand même.
1) Le libre, c'est les 4 libertés. Donc BSD et WTFPL, c'est libre, et ça n'a jamais été ambigü, même pour la FSF (voir https://www.gnu.org/licenses/bsd.fr.html).
2) Les licences libres non-copyleft n'ont de sens que quand le code source est distribué. Ces licence libres couvrent des logiciels libres, la différence avec les licences copyleft est que le programme modifié n'a pas impérativement à être redistribué sous la même licence (donc BSD: obligation de distribuer le code source, mais pas de le redistribuer).
3) Un logiciel distribué sous licence libre est libre, il n'existe pas d'autre critère. Les concours de "pureté" se sont toujours mal terminés.
Indépendamment de ça, je pense que tu t'es trompé sur l'interprétation de la définition de l'IA OpenSource par l'OSI. Contrairement à ce que tu sembles suggérer, les données d'entrainement ne font pas partie de ce qui doit être fourni (c'est très clair dans la FAQ https://hackmd.io/@opensourceinitiative/osaid-faq). Bon, je trouve que la définition de l'OSI n'est pas terrible de toutes manières, mais si je comprends bien l'idée, c'est que tu dois fournir la recette, et notamment la description des données d'entrainement (du genre, j'imagine, le type de données et les métadonnées associées), en plus des poids et du logiciel (open source).
[^] # Re: IA = code + données
Posté par arnaudus . En réponse à la dépêche Une intelligence artificielle libre est-elle possible ?. Évalué à 6 (+3/-0).
La reproductibilité ou la transparence n'a pas grand chose à voir avec la licence du programme… J'ai l'impression qu'on mélange des concepts qui sont très distincts (Open source et Open data).
Sans compter que la procédure d'apprentissage implique souvent des interventions humaines, donc tu as là un problème de reproductibilité évident. Même si tu décris ta procédure et qu'elle implique 1000 africains payés 1$/h pendant 6 mois, je ne vois pas ce que ça apporte, même si tu faisais la même chose tu n'aurais pas le même résultat.
Et avec tout ça, le logiciel avec ses poids peut parfaitement être distribué sous une licence libre et entrer sans aucune ambiguité dans la définition d'un logiciel libre.
[^] # Re: IA = code + données
Posté par arnaudus . En réponse à la dépêche Une intelligence artificielle libre est-elle possible ?. Évalué à 4 (+1/-0).
Les humains ont conçu l'algorithme, ils ont aussi conçu le jeu d'échecs, ils ont conçu les ordinateurs sur lesquels le programme tourne… Je ne comprends pas trop où tu veux en venir.
Je ne pense pas qu'une extension de la liberté des logiciels aux données et aux procédés qui ont permis de calculer les données d'entrée du programme soit cohérente et souhaitable. Ça semble n'avoir aucune fin. Un programme informatique, c'est un truc exécutable qui prend des données en entrée et qui te sort d'autres données; il est très fréquent d'avoir besoin de plusieurs programmes informatiques pour effectuer une tâche (gimp pour créer une image, libre office pour la mettre en page sur une dispositive, la visionneuse pour la projeter, etc), et certains programmes de cette chaine peuvent être libre et d'autres non. Quand on parle de réseaux de neurones, on parle de deux programmes, P1 qui entraine le réseau qui qui détermine des poids P en partant d'un jeu de données d'entrainement D, et un programme P2 qui prend une requête R, et qui utilise P pour donner une réponse Q. Tu as donc D -> P1 -> P, et P + R -> P2 -> Q. Si tu distribues le programme P2, tu refiles P2 et P, l'utilisateur procure la requête R, et voila, c'est un programme tout comme n'importe quelle programme informatique. P2 ne devient pas "non libre" si tu ne fournis pas toute la chaine logicielle et humaine qui a servi à déterminer P. Comme je l'ai écris plus haut, refiler P sans permettre de reproduire le processus D -> P1 -> P n'est pas très transparent, mais pour moi c'est pareil que de mettre une image retouchée avec Photoshop dans LibreOffice, ça ne concerne pas la licence de LibreOffice.
On a le droit de trouver cette situation sous-optimale, et on peut probablement définir d'autres concepts pour définir à quelle point une IA est ouverte, mais je pense qu'essayer d'utiliser le concept du logiciel libre pour ça est une erreur qui ne peut pas mener bien loin, parce qu'il faudrait appliquer une logique absurde qui ne s'applique pas du tout aux autres programmes informatiques.
[^] # Re: IA = code + données
Posté par arnaudus . En réponse à la dépêche Une intelligence artificielle libre est-elle possible ?. Évalué à 5 (+2/-0).
Trop tard pour modifier, j'ai fais une erreur évidente : pour les "média" (style images), la GPL impose le format "préféré" pour la modification, donc mon exemple est confus, toutes mes excuses. J'aurais dû vouloir dire 1) le libre permet de distribuer des images sous format png (pas la GPL, mais la GPL est clairement une exception), et 2) ça ne s'applique au'aux média, et pas aux données de manière générale, même sous GPL.
Du coup, si les poids d'un réseau de neurones sont données dans un format natif (je ne sais pas en fait comment ces poids sont stockés en général, bases de données, fichiers texte, xml?), c'est clairement le format qui peut être importé ou exporté par l'algorithme d'entrainement, et j'ai l'impression que c'est exactement ce qui est demandé par la GPL.
[^] # Re: IA = code + données
Posté par arnaudus . En réponse à la dépêche Une intelligence artificielle libre est-elle possible ?. Évalué à 5 (+2/-0).
Mais pas sur des parties jouées par des humains, si je me rappelle bien. Donc il s'est "auto-entrainé".
[^] # Re: IA = code + données
Posté par arnaudus . En réponse à la dépêche Une intelligence artificielle libre est-elle possible ?. Évalué à 5 (+2/-0). Dernière modification le 27 février 2025 à 12:21.
Bof, est-ce que ça ne serait pas plutôt un jeu avec le moteur de jeu distribué sous GPL et les données distribuées dans un format exploitable (png, jpg, etc) mais pas dans le format natif (svg…)? Ou est-ce que toute analogie est incomplète et qu'il ne faut pas raisonner comme ça?
J'ai l'impression que l'application de la définition d'un logiciel libre suppose que tu doives disposer de toutes les informations nécessaires pour recréer l'exécutable sur ta machine, donc techniquement, le code source du réseau et les poids. Les poids ont été déterminés à partir d'une procédure d'entrainement, qui est quelque chose qui s'est déroulée en amont, qui a nécessité des données et d'autres logiciels, mais qui ne sont pas nécessaire à l'exécution du logiciel.
D'une manière générale, la GPL n'est pas transitive quand on parle de données. Tu peux par exemple créer des images avec Photoshop et d'inclure les png dans un jeu libre, ça ne contrevient pas à la GPL. Tu peux même ne rien dire sur la manière dont les png ont été générés, tu n'as pas à fournir ni le nom, ni les sources du logiciel que tu as utilisé.
Du coup, pour les poids d'un réseau de neurones, le respect de la GPL ne nécessite probablement pas d'expliquer d'où ils sortent: quel algorithme, quelles données d'entrainement, quelle procédure d'entrainement… Tout ça ne semble pas faire partie des informations requises par la GPL, parce qu'on parle de données d'entrée du programme, et pas du programme en lui-même.
Bien sûr, un tel réseau de neurones, distribué sous licence libre avec les poids mais sans information sur la procédure d'entrainement, ne serait pas transparent. Mais transparent et libre, ça n'est pas la même chose: tu peux être transparent et non-libre (par exemple si tu distribues les sources sous une licence qui ne permet pas la redistribution des versions modifiées), et tu peux être libre et non-transparent, par exemple des trucs dans l'esprit de
double expexpx(double x) { 11956.81*x-22295.44; } // This does the job
dans ton code (c'est l'extension linéaire de la fonction autour de x=2, mais si tu ne le sais pas tu ne peux pas deviner d'où viennent les coefficients).
Demander les données d'entrainement et l'algo sous licence libre, en prétendant qu'autrement c'est du faux libre, c'est aller plus loin que la définition du libre. On a le droit, bien sûr, de dire que les définitions actuelles du libre ne sont plus adaptées et qu'il faudrait une GPLv4 par exemple (y compris pour essayer de définir une licence pour ce qui sort des IA entrainées par des données libres), mais ça n'est pas la même chose.
Je me suis toujours méfié des discussions sur l'"esprit du libre". L'esprit du libre, c'est d'avoir un bugtracker, c'est d'avoir une communauté ouverte, c'est seulement le copyleft, c'est d'accepter les pull request… Rien dans le libre n'impose une quelconque "pureté", et cette course à la pureté finit toujours mal, parce qu'on trouve toujours des trucs qui ne sont pas assez purs (un logo ou une marque déposés, l'autorisation de plug-ins propriétaires, des blobs binaires dans les drivers…). Je n'ai rien contre un club des purs qui s'entre-écharpent pour savoir qui est le plus à même de représenter l'esprit de l'essence du libre, mais personne n'a la légitimité de prétendre qu'un truc qui respecte les quatre libertés et/ou une licence considérée comme libre n'est "pas libre".
[^] # Re: DaLinuxFrenchPage
Posté par arnaudus . En réponse au lien Cacher un message dans un emoji comme 🔥󠄴󠅑󠄼󠅙󠅞󠅥󠅨󠄶󠅢󠅕󠅞󠅓󠅘󠅀󠅑󠅗󠅕. Évalué à 7 (+4/-0).
Il ne faut pas le dire trop fort, parce que si Google commence à coller ça dans les trackers qu'il affiche sur 99% des pages internet, Firefox va tomber à 0.1% de part de marché en 1 semaine…
# Bug dans la norme?
Posté par arnaudus . En réponse au lien Cacher un message dans un emoji comme 🔥󠄴󠅑󠄼󠅙󠅞󠅥󠅨󠄶󠅢󠅕󠅞󠅓󠅘󠅀󠅑󠅗󠅕. Évalué à 9 (+6/-0).
Est-ce que cela a un sens d'autoriser une succession infinie de "variation selectors" pour chaque caractère?
Dans tous les cas, il semble assez facile pour une implémentation de couper la liste à un nombre raisonnable, pour au moins éviter les conséquences sur les perfs d'affichage.
[^] # Re: Après le point médian...
Posté par arnaudus . En réponse au lien Le Point applique les méthodes de l'extrême droite pour faire taire un contributeur de Wikipédia . Évalué à 4 (+5/-4).
le Point Godwin, en tout cas.
[^] # Re: L’imprégnation des esprits ?
Posté par arnaudus . En réponse au lien Debout pour les sciences, nécessité de défendre l’intégrité scientifique et combattre désinformation. Évalué à 0 (+0/-3).
Note que les 3% du PIB c'est pour la recherche totale (publique + privée). Quand tu regardes les statistiques au niveau Européen, la recherche publique en France est à peu près au niveau des autres pays (pas au-dessus, on est bien d'accord, 0.8% à 0.9% du PIB), c'est la recherche privée qui est en retard, malgré le CIR et les cadeaux fiscaux.
Pas toutes, et c'est caricatural de parler de démantèlement. La France a plein de problèmes avec ses institutions de recherche publiques, à la fois pratiques et idéologiques. Elle n'arrive pas à financer ses universités, elle n'arrive pas à leur donner le rôle qu'elles devraient avoir par rapport aux écoles d'ingénieur, elle n'arrive pas à décider quoi faire avec les what millions d'universités dans les villes moyennes qui ne pourront jamais mener une recherche efficace, elle n'arrive pas à intégrer les docteurs à la place qui leur revient sur le marché du travail, elle n'arrive pas à donner une ligne claire au CNRS, elle n'arrive pas à gérer la masse salariale (les chercheurs coûtent trop cher mais sont trop mal payés), ni la pyramide des âges (avec les décalages des départs en retraite), ni les carrières complexes (impossible de recruter un fonctionnaire après 40 ans), elle n'arrive pas à gérer l'enfer bureaucratique qu'elle a elle-même crée, elle n'arrive pas à simplifier le mille-feuille administratif, son traitement des fraudes scientifiques est moyen-âgeux, il n'y a aucun traitement des conflits d'intérêt… Il y a plein de problèmes dans la recherche, mais globalement, les indicateurs ne sont pas mauvais. La productivité est correcte, la formation universitaire est de bon niveau, certaines institutions phares sont très visibles, certaines disciplines (maths, pĥysique) sont à la pointe, les conditions de travail pour les chercheurs sont assez attractives pour les étrangers, on sort assez efficacement de la culture du mandarinat (notamment par l'attribution directe des financements aux chercheurs sans passer par les directeurs de labo), il y a en France des équipements de pointe et des projets d'équipements de pointe (surtout pour les physiciens, qui raffolent de ces gros équipements qui coûtent des milliards et que les politiques aiment bien inaugurer)… Bien sûr, quand un secteur comme ça évolue, il y a des perdants, des unités qui disparaissent, des secteurs peu performants qui sont abandonnés ou restructurés, ou redirigés vers des occuppations plus visibles (recherche appliquée, enseignement…), puisqu'une réforme à budget stable (ou en légère décroissance) ne va pas bénéficier à tout le monde. Dans tous les cas, l'idée d'une recherche publique "démantelée" me semble mal refléter la situation générale; si tu fais de la phyisque des particules ou de l'algorithmique en IA dans un grand établissement, tu n'es pas du tout démantelé. Si tu fais des sciences sociales à l'université de Trifouillis les Oies, par contre, oui, là c'est sûr que tu es démantelé.
[^] # Re: Equilibre
Posté par arnaudus . En réponse au journal Wikipédia:Lettre ouverte : non à l'intimidation des contributeurs bénévoles. Évalué à 4 (+2/-1).
Wikipédia n'a pas vocation à affirmer des vérités, mais à rapporter un point de vue neutre. Tu peux par exemple reprendre les éléments de langage du journal ("Il se qualifie comme conservateur et identitaire" par exemple, je ne suis pas très au fait du vocabulaire alternatif utilisé par l'extrême droite), en le pondérant par une phrase dans le style "mais sa ligne éditoriale est souvent qualifiée d'extrême droite, voire d'islamophobe, par d'autres médias", ou quelque chose d'équivalent.
Ça n'est pas un hasard si c'est dans les principes fondateurs de Wikipédia, c'est que si c'est écrit comme ça, il y a beaucoup moins de raisons de se plaindre.
[^] # Re: L’imprégnation des esprits ?
Posté par arnaudus . En réponse au lien Debout pour les sciences, nécessité de défendre l’intégrité scientifique et combattre désinformation. Évalué à 4 (+2/-1).
Mais non, mais c'est juste que je ne vois pas l'intérêt de s'offusquer pour le principe. À qui s'adressent ces documents? Les graphiques illustrent des choses qu'on sait très bien, mais ils les illustrent d'une manière que je ne trouve pas informative, et ça me gonfle. On ne peut pas se prétendre scientifique le jour, et militant le soir, en partant du principe que la rigueur du raisonnement, ça ne vaut pas pour les activités militantes.
Si tu veux parler de l'effort de recherche, alors tu dois regarder l'évolution des équivalents temps plein ou de la masse salariale, pas des seuls recrutements. C'est complètement trivial, tu peux réduire tes recrutements tout en augmentant ta masse salariale, ça dépend de la pyramide des ages, qui reste très déséquilibrée au CNRS. En fonction de la succession des gouvernements, tu as eu une alternance de périodes fastes et moins fastes, et donc la masse salariale fait le yoyo en fonction des départs à la retraite.
Tu peux aussi considérer la totalité de la masse salariale, et pas seulement cette des fonctionnaires. Parce que tu peux très bien augmenter ton personnel sans ouvrir de concours de fonctionnaire. Évidemment, idéologiquement, tu peux trouver ça bien ou mal, mais la question est assez indépendante de l'investissement dans la recherche (à moins d'imaginer par essence qu'un fonctionnaire est un meilleur chercheur, ce qui reste quand même assez douteux). Ce que le graphique montre, ce n'est pas une diminution de l'investissement public dans la recherche, c'est un changement progressif de modèle, avec une baisse du recrutement des cadres (fonctionnaires) de la recherche, qui vont chacun devoir financer leurs équipes par d'autres moyens (appels à projets, partenariats). À comparer par exemple avec le budget de l'ANR https://anr.fr/fileadmin/documents/2024/page-budget-2023-fig1.jpg
Au fond, quelle est la raison du changement de modèle? Bon, c'est évidemment multifactoriel, mais c'est principalement parce que l'État n'a pas confiance dans l'efficacité du modèle "traditionnel" de la recherche française. Pour plein de raisons plus ou moins idéologiques ou plus ou moins objectives, mais en gros, l'idée c'est que l'argent public serait mieux dépensé dans des groupes de recherche temporaires qui se concentreraient sur un projet scientifique pendant 4 ou 5 ans avant d'être refondu avec des contours différents pour un autre projet. Les labos et instituts de recherche seraient les hôtes de ces projets et leurs fourniraient les moyens de travailler, mais sans autre politique de recherche que de favoriser l'épanouissement scientifique des chercheurs pendant le temps de leur projet.
Sans surprise, c'est déja comme ça que fonctionnent les instituts scientifiques qui sont sur le devant de la scène (institut Pasteur, collège de France, etc). De nombreux chercheurs qui ont une activité scientifique soutenue n'ont pas de problèmes majeurs à être financés et à recruter les membres de leurs équipes selon leurs besoins au fil de leurs projets; ils ont par contre besoin d'un environnement scientifique (administration, locaux) et d'un accès à des équipements parfois coûteux; les enseignant-chercheurs cherchent à se débarrasser de leurs charges d'enseignement en les "rachetant" grâce au budget des projets, etc. Ce que ne dit pas par exemple les graphiques de RoguESR, c'est quelle part des chercheurs recrutés au CNRS ont déja tout ou partie de leur salaire de jeune chercheur financé par une source extérieure (typiquement, contrat européen). Ça doit énormément dépendre des sections du CNRS, mais je pense que la norme s'établit autour de 50%. Ce modèle définit un statut du chercheur plus proche d'une profession libérale que d'un statut de fonctionnaire.
Je comprends les critiques du modèle "moderne" de la recherche, mais je ne comprends pas quel modèle on propose à la place. Un monde où on recrute toujours plus, où tout le monde a des crédits pour fonctionner, où la recherche n'est évaluée ni en terme de productivité, ni en terme de retombées pour la société, où la liberté académique est totale… En gros, il faudrait que ça soit les chercheurs qui aient le contrôle du robinet du pognon, et qu'ils n'aient pas de comptes à rendre, parce que leur statut garantirait automagiquement à la société que ce que le chercheur veut, c'est ce qui est bon pour la société. À part donner envie aux dirigeants de restreindre encore plus les marges de manœuvre, je ne vois pas ce que ça peut apporter.
Ça parait tellement caricatural que je trouve ça contre-productif. Si on veut la la liberté académique, alors c'est normal de devoir négocier avec la société. Si on veut plus de PIB vers la recherche, c'est normal qu'il y ait des contreparties, notamment sur les retombées économiques. Si on veut des emplois sécurisés, alors c'est normal d'être évalués. C'est normal que le gouvernement et l'État aient le contrôle du robinet de pognon, c'est normal que la politique de la recherche dépende du résultat des élections. Ça ne fait pas forcément plaisir, mais c'est normal.