Sommaire
Hello,
Ceci est ma première tentative de journal, alors autant y aller franchement ;-P
La question me turlupine depuis un bon bout de temps et j'aimerais initier une discussion parce que je trouve que la communauté francophone reste encore très discrète sur ce sujet pourtant important. Je ne prétends évidemment pas répondre de façon définitive, mais juste indiquer où en est ma propre réflexion.
Ça a commencé fin novembre avec la keynote Libre, Open source: de VLC à l'IA, et futur de JB Kempf à Capitole du Libre où après une première partie amusante et agréable, JB s'est soudain mis à nous expliquer qu'il fallait que nous (les libristes) fassions de l'IA. Le problème avec JB c'est qu'on ne sait pas toujours lorsqu'il est sérieux ou pas, et qu'il s'en sort en nous laissant libres (!) d'interpréter ses propos : troll, il nous invite à dire qu'on fait de l'IA alors que ça n'en est pas vraiment, juste pour obtenir des subventions ; et il a dû bien s'amuser des réactions à l'annonce que VLC utiliserait désormais l'IA pour les sous-titres des vidéos. Mais beaucoup plus sérieusement, enfin moi j'ai vraiment pris ça sérieusement, il nous a aussi dit en gros la même chose que notre pénible résident : si on reste des herbivores, vous comprenez, les carnivores (ceux qui font de l'IA) gagneront.
Il y a eu ensuite les campagnes de dons de LQDN et de Framasoft autour de l'IA ; autant celle de La Quadrature était claire et nette, autant celle de Framasoft m'a assez perturbée : on informe sur l'IA mais on dit aussi qu'on va expérimenter l'IA "pour voir". Et aux personnes qui protestent on répond gentiment qu'on est bien au courant des problèmes et que c'est justement pour en discuter qu'on fait ça.
À noter que Framasoft comme VLC ont choisi de s'appuyer sur Whisper, d'OpenAI1. Pour rappel, OpenAI, actuellement, c'est à 49% Microsoft. Parmi les premiers promoteurs d'OpenAI, outre Sam Altman, il y a Elon Musk et Peter Thiel. Des techbros libertariens (si vous ne connaissez pas bien Peter Thiel ou plus généralement qui sont les techbros, je vous conseille Brotopia, c'est passionnant).
À une époque pas si lointaine, on nous expliquait que le Libre, c'est l'open source avec l'éthique (aka la Philosophie du Libre) en plus. J'ai l'impression que certains s'y retrouvent de moins en moins dans cette distinction.
Alors tentons de (re)poser rapidement quelques bases.
De quoi l'IA est-elle le nom
Dans la dénomination "Intelligence Artificielle", rien ne va.
Sauf peut-être si on prend l'adjectif "artificiel" dans le sens de "non authentique, de surface", et "intelligence" dans l'acception angloaméricaine utilisée dans l'acronyme CIA (Central Intelligence Agency) : quelque chose qui renseigne et contrôle.
Le souci, c'est que le pouvoir des mots est difficilement contournable. Et que même si on sait ce qu'il se cache derrière l'IA, le fait même d'utiliser le mot "intelligence" oriente notre pensée, nous amène à des associations biaisées. D'autant que le fantasme d'IA véritablement intelligente, consciente, à notre image, whatever, n'est jamais très loin. Même si on sait pertinemment que la mémoire d'un ordinateur n'a que peu de choses à voir avec la mémoire animale (la nôtre), ou que les réseaux neuronaux n'ont à peu près que le nom en commun avec l'entité constituée par nos propres réseaux de neurones (aka notre cerveau).
À la place, on pourrait parler de LLM, de perroquets stochastiques ou de SRAS (Systèmes Résultant d'Apprentissage Stochastique). Ce n'est pas le vocabulaire qui manque.
Et cela permettrait déjà de faire clairement la distinction entre les différentes formes de techniques qui se cachent derrière ce terme à la fois fourre-tout et fallacieux d'IA2.
Pour en revenir à la question
On l'aura compris, le fait même de parler d'IA dans un projet libre est pour moi déjà un problème.
Comme le dit Ali Alkhatib3 :
AI is an ideological project to shift authority and autonomy away from individuals, towards centralized structures of power. Projects that claim to "democratize" AI routinely conflate "democratization" with "commodification".
L'idéologie derrière l'acronyme IA, est exactement celle-là : nous ôter notre pouvoir de décision, nous déposséder de nos compétences décisionnelles, pour les confier à un SRAS (voire à un simple algorithme) via (très généralement) un SaaSS (Service as a Software Substitute)4
Cela me pose donc un gros problème que des structures en faveur du Libre cèdent à la facilité (au buzz ? à la provocation ?) de parler d'IA pour qualifier les outils qu'elles utilisent.
VLC n'utilise pas l'IA. Il utilise le logiciel open source Whisper, qui a été entraîné par des moyens, il me semble, inaccessibles à une personne lambda en termes de reproductibilité. Je ne connais pas les biais de Whisper. Reconnaît-il les voix féminines aussi bien que les masculines ? Les voix avec accent ? Quelles ont été les petites mains qui ont dû œuvrer (et qui œuvrent probablement encore) pour le corriger et l'amener aux niveaux de performance actuels ? Quels ressources énergétiques ont été nécessaires ?
Je comprends parfaitement l'utilité d'un tel logiciel pour permettre des traductions automatiques, je comprends tout particulièrement l'utilité en termes d'accessibilité, et je comprends qu'il n'existe pas vraiment d'alternative à la hauteur (à part peut-être le projet Scribe5, qui utilise Vosk6 : mieux ou pas mieux en termes d'éthique, je veux bien vos avis sur la question). Mais qu'on arrête de nous rouler dans la farine en parlant d'IA ou de Libre. Ce n'est pas libre, puisqu'on ne contrôle pas du tout la façon dont ce logiciel a été entraîné et qu'il est matériellement impossible (sauf à avoir les capacités de stockage et de calcul d'OpenAI) à reproduire soi-même.
En ce qui concerne Lokas de Framasoft (qui utilise aussi Whisper, donc) je suis encore plus perplexe car le rapport utilité/éthique de la proposition me paraît fortement questionnable. Même si je comprends que l'idée est de fournir un logiciel à peu près safe afin que les personnes qui auraient besoin d'un tel outil ne soient pas obligées d'y laisser toutes leurs données personnelles, je ne pense pas que développer un outil qui habitue à enregistrer l'intégralité de réunions via un smartphone soit une bonne idée.
En tout cas, ce n'est toujours ni libre, ni "de l'IA".
Parler d'IA, même au second degré, c'est dérouler le tapis rouge devant une idéologie qu'il faudrait au contraire dézinguer complètement.
Pour répondre à ce stade de ma réflexion à la question posée, l'IA ne peut pas être compatible avec le Libre, car ce n'est pas en soi une technologie, ni même un ensemble de techniques clairement définies. C'est une idéologie, en totale contradiction avec la philosophie du Libre.
À vous.
-
Ce n'est pas dit dans la page wikipédia française, mais si on consulte l'anglaise, on peut y lire ceci : According to a NYT report, in 2021 OpenAI believed they exhausted sources of higher-quality data to train their large language models and decided to complement scraped web text with transcriptions of YouTube videos and podcasts, and developed Whisper to solve this task. ↩
-
Pour un excellent historique et appréhender de façon à la fois pédagogique et détaillée les différentes formes d'IA, je conseille vivement la lecture de Melanie Mitchell - Artificial Intelligence: A Guide for Thinking Humans. J'ai également commencé ici une page regroupant des ouvrages et articles permettant d'outiller la réflexion au sujet de l'IA. ↩
-
On écoutera également avec intérêt l'épisode du podcast Tech Won't Save Us qui lui est consacré ↩
-
À ce sujet on relira avec profit cette page : Using SaaSS causes the same injustices as using a nonfree program: they are two paths to the same bad place. Take the example of a SaaSS translation service: The user sends text to the server, and the server translates it (from English to Spanish, say) and sends the translation back to the user. Now the job of translating is under the control of the server operator rather than the user. ↩
# différence moteur et finalité
Posté par BAud (site web personnel) . Évalué à 8 (+6/-0). Dernière modification le 20 janvier 2025 à 20:02.
Ce qui rend complexe le sujet des LLM1, c'est que oui c'est une branche de l'IA qui a le vent en poupe actuellement, malgré toutes ses casseroles^W hallucinations (dont beaucoup ne sont pas de son fait…).
L'IA c'est aussi pour certains enlever les yeux rouges d'une photo efficacement (cela s'appuie sur du traitement d'image trivial), des systèmes experts qui ont le mérite d'avoir une traçabilité du raisonnement — et le défaut d'être un peu trop manuel — et bien sûr utiliser des réseaux de neurones correspond à une autre branche de l'IA, et il y a encore d'autres branches.
Premier point.
L'IA dont tu parles, recouvre le service rendu. La partie libre ne couvre généralement que le moteur — que ce soit celui d'exécution ou celui d'apprentissage — pas le corpus de données ayant permis de l'entraîner, ni la manière de l'entraîner…
C'est un peu le même souci avec les jeux libres : s'il n'y a que le moteur de libre, tu as un moteur de jeu libre, pour les FPS tu trouves ioquake qui a permis de décliner Xonotic, Unvanquished, OpenArena qui ont libéré les cartes (donc des données + musiques + textures + modèles 3D des personnages) indispensables pour avoir un jeu libre (j'allais ajouter _entièrement) et dont on peut modifier toutes les sources en utilisant la meilleure origine possible (pour les modèles 3D, ce n'est pas le nuage de points résultant, c'est bien la modélisation d'origine).
Pour l'IA tu retrouves donc cette séparation moteur / données : À quoi s'applique le libre ? Pour moi la réponse est claire : tu as une IA^W LLM efficace libre si l'ensemble (moteurs + données + méthodologie d'apprentissage) est reproductible et libre.
Second point pour moi, ce serait le deuxième si j'avais envie d'élaborer :D
Donc bon, il y a plein d'autres points à soulever, factuellement, selon l'architecture de chacune de ces IA (si c'était un robot, ça nous emmènerait du côté de l'Open Hardware et là… donc bon autant rester factuel et se cantonner à des sujets précis :p)
surnommer les LLM de SRAS en français a une autre connotation, beau jeu de mot^W acronyme ;-) ↩
[^] # Re: différence moteur et finalité
Posté par Samuel (site web personnel) . Évalué à 8 (+7/-0).
À propos du terme "hallucinations", Thibault Prévost interrogé par Mediapart expose :
(source: Trumpisme, biais racistes et menace écologique : « L’IA n’est pas une technique, c’est une idéologie », 19/01/2025, article payant).
Actuellement, la bataille autour des mots semble gagnée par les bullshitters de tous poils, je rejoins l'auteur du post initial sur la nécessité de défendre des positions aussi sur ce plan là (même si nous sommes avons le sentiment d'être quasiment inaudibles aujourd'hui).
[^] # Re: différence moteur et finalité
Posté par vmagnin (site web personnel) . Évalué à 2 (+0/-0).
Oui, le terme hallucination sous-entend qu'il y a quelqu'un / quelque chose qui hallucine.
En fait, quand ça se produit, c'est plutôt l'utilisateur qui hallucine… :-)
# Toujours à vouloir limiter le libre...
Posté par Zenitram (site web personnel) . Évalué à 0 (+9/-11). Dernière modification le 20 janvier 2025 à 21:47.
Qui a dit que c'était en contradiction?
Et en réalité tu n'as pas démontré que c'est une idéologie ou du moins pas un idéologie différente du libre.
Je vais prendre un exemple d'il y a quelques temps : les jeu vidéos.
Il y a une une période où certains ont tenté de faire croire qu'ils faisaient des jeux libres.
Puis on a décortiqué, un jeu c'est :
- Un code
- Des "objets" (audio, vidéo, images, …)
Et la plupart des gens qui parlaient de jeux libre avaient libéré le truc le moins bankable (le code), alors que pour être libre il faut que 100% de l'oeuvre soit libre. OK, 99.999% pour inclure Firefox (à une époque l'outil de rapport de bug était non libre).
l'IA, c'est quoi?
- Un code
- Des "objets" (le corpus d’entraînement)
Si seulement le code est libre, l'IA n'est pas libre, si le code + le corpus sont libre ton IA est libre même si la finalité te déplaît (le libre n'interdit pas d'ôter un "pouvoir de décision", au contraire elle t'interdit de m'interdire d'utiliser ce que tu fais en libre pour ça), comme le libre est toujours libre même en SaaS (rappel : seul celui qui reçoit l'oeuvre a le source, donc si tu as que le résultat tu n'es pas forcément légitime à demander le source car tu n'es pas la cible du libre, seulement de l'AGPL).
Le libre offre sans doute plus de liberté que tu ne le voudrais, mais c'est justement pour éviter ton arbitraire que le libre est là.
Edit : j'aurais dû actualiser la page avant d'envoyer mon commentaire fait en 2 phases, BAud avait déjà sorti l'idée des jeux vidéos, zut, j'abonde donc.
[^] # Re: Toujours à vouloir limiter le libre...
Posté par BAud (site web personnel) . Évalué à 2 (+0/-0). Dernière modification le 20 janvier 2025 à 22:10.
moui, j'ai préféré dégainer avant toi :D
même si — ces derniers temps — tes commentaires deviennent moins agressifs ;-)
j'ai sous le coude en plus https://faq.tuxfamily.org/JeuLibre/Fr pour rester sur l'exemple des jeux ainsi que :
[^] # Re: Toujours à vouloir limiter le libre...
Posté par Khrys (site web personnel) . Évalué à 4 (+4/-0).
Je crois que tu te méprends profondément sur ma conception du libre :-)
(si tu lis ce que j'en dis à la fin de ma conf à Capitole du libre je crois que c'est assez clair)
[^] # Re: Toujours à vouloir limiter le libre...
Posté par Zenitram (site web personnel) . Évalué à -7 (+2/-11). Dernière modification le 21 janvier 2025 à 09:19.
Je note donc que tu dis tout et son contraire, c'est surtout ça qui est incompatible, il faudrait que tu clarifies dans ton esprit.
"Le mouvement du libre, c’est affirmer et lutter pour la liberté des utilisateurices, quelles qu’iels soient." est incompatible avec " l'IA ne peut pas être compatible avec le Libre", il te faut choisir car "IA" est un "quelles qu’iels soient".
(en pratique, l'IA est compatible avec le Libre car l'IA n'est rien d'autre qu'un programme comme un autre, et les données sont à part comme pour les jeux vidéos, les compresseurs vidéos, etc, qui peuvent aussi être libres, ha oui je te laisse le plaisir de voir dans le lien le nombre de personnes qui limitent le libre au logiciel libre et détestent le libre dès qu'on enlève le terme "logiciel", y compris, voir surtout, "à gauche", faut pas déconner avec le monopole d'usage de ses amis "artistes", si tu veux jouer la prochaine fois explicite que le libre sans "logiciel" ça inclut les morceaux de musique, le dernier roman ou la dernière BD des copains qu'on ne devrait pas limiter, avant d'attaquer le jeu de données de l'IA, car c'est assez impressionnant le nombre de "libristes de gauche" qui aiment ce qu'ont fait les autres mais pensent que ce que eux créent doit être non libre)
[^] # Re: Toujours à vouloir limiter le libre...
Posté par Eldermê (site web personnel) . Évalué à 6 (+7/-2).
Je suis allée lire le lien, je trouve que tu passes à côté d'un aspect qui selon moi fait une grosse différence entre l'art et le logiciel.
Lorsque je code, j'engage essentiellement mon intellect. Des fois je trouve que ce que j'ai fait est cracra et moche. Parfois, quand j'ai fait une architecture qui fonctionne bien et donne l'impression que tout est parfaitement là où ça doit être, je trouve que c'est beau. En général, c'est quelque part entre les deux. Si quelqu'un veut reprendre pour améliorer ou adapter à ses besoins, généralement je le verrai de façon positive, je trouverai ça flatteur pour mon travail.
Lorsque que je joue du piano, que je dessine ou que je fais de la peinture, il peut y avoir une part de réflexion en amont, mais j'y mets aussi mes émotions, ma sensibilité, "mes tripes". Des fois c'est moche et des fois c'est beau. C'est perfectible aussi (surtout que je ne crois pas vraiment que la notion de perfection ait du sens quand on parle d'art), mais je n'ai pas forcément envie que quelqu'un d'autre que moi y touche.
Cela ne veut pas dire qu'il m'est inenvisageable de faire de l'art libre, mais ce qui pour moi va de soi pour du logiciel ne va plus de soi pour de l'art. Ce n'est pas une question de mettre l'un sur un piédestal et l'autre pas, je ne mets pas de hiérarchie entre les deux. C'est simplement que l'un touche à quelque chose d'intime et l'autre pas.
[^] # Re: Toujours à vouloir limiter le libre...
Posté par Zenitram (site web personnel) . Évalué à -5 (+4/-11). Dernière modification le 21 janvier 2025 à 11:11.
Oui, bon, rien de nouveau donc, toujours une excuse pour soit et une insulte aux gens qui codent vu comme inférieurs (ils n'ont pas assez d'"intime" pour faire de l'art, les pauvres).
En vrai, c'est pareil, les 2 peuvent être améliorés mais des gens pensent que leur œuvre ne doit pas être modifiée car ils ont un égo démesuré (et rien d'autre, rien à voir avec l'intime vu que c'est public).
Ton discours est avancé par pas mal de monde pour les logiciels proprios mais c'est un détail, en fait c'est juste subjectif et très "les autres font mais pour ce que je fais c'est non".
Moi, c'est intime donc tu comprendras que je veux pas faire de libre. Ha, tiens, subjectif en fait.
Moi, c'est intellect et pas intime, du coup ton piano doit être libre.
Oui, en effet, mais en fait tu inverses. Ben oui, pourquoi ta façon de voir ce que je fais (tu m'insultes, au passage, à me voir comme pas intime en code là où tu l'es en piano) serait mieux que la mienne sur ton piano?
Merci d'avoir confirmé ce que j'écrivais, on est bien en sélectivité suivant ce qui te plaît, et le libre c'est justement passer au dessus de ton égo.
Rien de nouveau donc, mais l'art libre essaye d'exister malgré tout, même si il n'a pas encore pris autant que dans le logiciel libre, ça se fait un peu (d'ailleurs, amusant, tu insultes aussi ceux qui font de l'art libre en sous-entendant qu'ils y mettraient pas assez d'intime… Un autre détail). Et l'IA libre peut aussi exister.
[^] # Re: Toujours à vouloir limiter le libre...
Posté par Eldermê (site web personnel) . Évalué à 10 (+11/-1). Dernière modification le 21 janvier 2025 à 11:34.
Non, mon message ne t'insultait pas, ni toi ni personne. Je pensais suffisamment clair dans mon intervention qu'il s'agissait d'une vision personnelle sans jugement de valeur sur la vision des autres, laquelle peut être différente.
À aucun moment je n'ai sous-entendu qu'entre le développement et l'art l'un serait mieux que l'autre, et encore moins que les artistes seraient inférieurs aux développeurs. J'ai écrit au contraire que je ne mets pas de hiérarchie entre les deux. Cela n'a aucun sens pour moi de les hiérarchiser, ce n'est pas le même domaine.
En revanche, je considère ton message comme très désagréablement condescendant, tu interprètes sur mes propos du grand n'importe quoi que je ne pense pas. Je n'ai donc pas envie de poursuivre cet échange qui ne mènera vraisemblablement nulle part.
[^] # Re: Toujours à vouloir limiter le libre...
Posté par raphj . Évalué à 6 (+4/-0). Dernière modification le 21 janvier 2025 à 11:13.
On peut aussi argumenter sur le fait qu'on peux y mettre ses tripes et de l'émotion quand on programme.
Pour aller dans ton sens mais pour des raisons très différentes. Logiciel vs art : les conséquences ne sont pas les mêmes en termes de "droits fondamentaux". Dans le monde du logiciel, le libre est important pour pouvoir garder le contrôle son informatique. À mon avis, ça ne s'applique pas à l'art, potentiellement même quand il est utilisé comme assets d'un jeu vidéo. On n'a pas besoin d'étudier le fonctionnement, il n'y a pas de problématique d'interopérabilité, de fonctionnalité, etc.
Dans un cadre développement coopératif / collectif, en revanche, l'art libre a les mêmes avantages que l'open source logiciel. Ton argumentation sur l'aspect peut-être plus intime de l'art peut intervenir dans ce cadre : on peut argumenter que comme une œuvre d'art est l'expression très personnelle de l'artiste, elle est achevée et ne saurait voir de dérivé ou d'itération. Mais c'est un poil discutable, surtout pour des assets d'un jeu.
Bref, en résumé : pour moi, ça peut être cohérent de défendre le logiciel libre et pas forcément l'art libre. Ce n'est vraiment pas une question de "c'est important que ce soit libre sauf quand c'est moi qui fait". Mais ça dépend de quel aspect du libre nous intéresse.
[^] # Re: Toujours à vouloir limiter le libre...
Posté par Eldermê (site web personnel) . Évalué à 1 (+1/-1).
Je ne nie pas que des développeurs puissent mettre leurs tripes et de l'émotion quand ils programment, comme probablement dans n'importe quelle autre activité.
D'ailleurs on peut aussi mettre "ses tripes et de l'émotion" et accepter que ce soit libre, ce n'est pas incompatible. Je pense simplement que cela peut contribuer à rendre le choix d'une licence libre plus difficile.
Je te rejoins entièrement sur le reste.
[^] # Re: Toujours à vouloir limiter le libre...
Posté par raphj . Évalué à 4 (+2/-0).
Tout à fait ! Ça peut demander un certain détachement.
L'inverse aussi d'ailleurs (ouvrir son code à la lecture pour le montrer un peu par fierté), mais tu as spécifiquement parlé de licences libres… qui l'ouvrent à la modification.
[^] # Re: Toujours à vouloir limiter le libre...
Posté par Julien Jorge (site web personnel) . Évalué à 10 (+22/-2).
Salut Zenitram, comment ça va en ce moment ? Pas trop froid ? Moi ça va bof-bof, c'est gentil de demander.
J'étais tranquille en train de me satisfaire de ne pas recevoir de plaintes d'utilisateurs de LinuxFr quand soudain, une nouvelle plainte ! Pas de veine.
Remarque, je le sentais venir avec ces journaux et liens qui parlent de faire du libre restrictif, je sais bien que tu vas vouloir réagir :)
Alors dans le fond je suis plutôt d'accord avec toi et cette frange de libristes qui poussent à restreindre à coup de NC, ND, non-GAFAM, non-que-sais-je jouent à mon avis en notre défaveur. Ils veulent du libre mais pas du libre qui profite à des entités qui leur déplaisent (ou qui déplaisent au plus grand monde, ce n'est pas le problème), donc du libre restreint, donc du pas-libre.
Néanmoins, mets-y le ton nom d'une pipe en bois. Laisse refroidir et mesure ton propos. Tu ne vas convaincre personne à sauter à la gorge de tes interlocuteurs pour les tacler. « Là ! Une contradiction ! Paf ! Béquille, balayette ! Ah le nul t'as tord t'as tord t'as tord ! », voilà à quoi ça ressemble pour les spectateurs. Bonjour l'ambiance.
D'habitude la modération contacte les gens par e-mail, mais comme t'es un vieux de la vieille et qu'on t'a déjà critiqué sur ton comportement EOVERFLOW fois, que ce soit l'équipe de modération ou les usagers du site, je me permets de t'interpeler publiquement, que ce soit bien clair pour tout le monde que la modération n'apprécie pas non plus ce comportement et l'ambiance que ça entraîne.
[^] # Re: Toujours à vouloir limiter le libre...
Posté par Zenitram (site web personnel) . Évalué à -10 (+1/-19).
C'est gentil d'essayer de m'amadouer en me brossant dans le sens du poil mais ça me fait plutôt réagir qu'il faudrait peut-être écrire ça à plus nombreux quand une personne, pour montrer l'exemple surtout quand cette personne fait partie de la modération, sort des telles bêtises "la Terre est plate et ne me contredisez pas sinon je me plains" en défaveur du libre…
Il semble que le système de karma (sensé représenter le jugement du peuple local mais se refuse à me mettre en négatif malgré la "majorité" qui ne me supporterait pas, on a l'impression d'entendre certains au parlement national actuel) ainsi que les règles de modération (qui comme les 4 libertés du libre semblent en pratique interdire d'interdire quelque chose de non souhaité par certaines personnes) ne font pas ce qui est au fond souhaité par la modération, je vais donc me créer une règle d'exception, m'être juge en utilisant cette règle d'exception, et m'appliquer la sentence.
[^] # Re: Toujours à vouloir limiter le libre...
Posté par gUI (Mastodon) . Évalué à 6 (+7/-4). Dernière modification le 22 janvier 2025 à 08:23.
Oui si tu peux la fermer quelque temps ça fera des vacances à tout le monde. Merci d'avance. On en a ras la casquette de recevoir des plaintes (y compris en interne pour une partie de la modération).
Et à ton retour, essaie s'il-te-plaît d'arrêter les attaques systématiques personnelles. Tu passes ton temps à accuser tes contradicteurs d'idées supérieures qu'ils n'ont pas exprimé directement. Tu es soit extra-lucide, soit totalement borné.
Merci de ne pas répondre non plus à ce post.
En théorie, la théorie et la pratique c'est pareil. En pratique c'est pas vrai.
[^] # Re: Toujours à vouloir limiter le libre...
Posté par gUI (Mastodon) . Évalué à 6 (+3/-0).
Je me suis fait remonter les bretelles (à juste titre) pour le "la fermer", qui est déplacé. Je te présente mes excuses pour ce ton inapproprié.
En théorie, la théorie et la pratique c'est pareil. En pratique c'est pas vrai.
[^] # Re: Toujours à vouloir limiter le libre...
Posté par Pol' uX (site web personnel) . Évalué à 9 (+8/-1).
C'est bien la courtoisie. On apprécie ce que le zen y trame.
Adhérer à l'April, ça vous tente ?
[^] # Re: Toujours à vouloir limiter le libre...
Posté par Khrys (site web personnel) . Évalué à 3 (+5/-2). Dernière modification le 21 janvier 2025 à 22:04.
Oui je suis un peu bête et je ne comprends rien à ce que je dis, pardon :-)
Mais là, pour le coup, je crois que c'est toi qui n'as rien compris à ce que j'ai écrit.
# Energie
Posté par Nicolas Boulay (site web personnel) . Évalué à 1 (+6/-8).
On s'en fout un peu en fait. Si cela te pose problème, fait 100km de voiture de moins, cela sera beaucoup plus efficace.
https://andymasley.substack.com/p/individual-ai-use-is-not-bad-for
"La première sécurité est la liberté"
[^] # Re: Energie
Posté par Benoît Sibaud (site web personnel) . Évalué à 7 (+4/-0). Dernière modification le 21 janvier 2025 à 10:27.
ça ne prend en compte que l'utilisation, pas l'entraînement, qui lui utilise de nombreux CPU pendant de longues heures, et qui est plus ou moins permanent.
Exemple « Huggingface BLOOM. Yes it took 3.5 Months to train this data on 384 high end GPU's but running it can be done on a 'normal' computer. »
ou chiffres ChatGPT : "It is estimated that training the model took just 34 days." (d'un paquet de CPU…)
edit: Hmm pourtant le document original dit : « The ChatGPT number assumes 3 Wh per search multiplied by average emissions per Wh in the US. Including the cost of training would raise the energy used per search by about 10% to 3.3 Wh, which wouldn’t create a visible change on the graph. » surprenant.
[^] # Re: Energie
Posté par Benoît Sibaud (site web personnel) . Évalué à 5 (+2/-0).
[^] # Re: Energie
Posté par Nicolas Boulay (site web personnel) . Évalué à 5 (+2/-0).
L'entrainenement est très couteux, mais chatgpt est utilisé par des centaines de millions de personne, l'entrainement est réparti sur eux tous.
552 tonnes de CO2, c'est le bilan carbone de 50 français.
Les chiffres données sont aussi à comparer avec d'autres usages, et pourtant on en parle moins (vidéo).
"La première sécurité est la liberté"
[^] # Re: Energie
Posté par Benjamin Henrion (site web personnel) . Évalué à 1 (+1/-1).
L'empreinte carbone de l'IT est à 75% dans la production du matériel.
Les "552 tonnes de CO2" ne comprennent probablement pas la production du matériel, juste l'électricité nécessaire?
[^] # Re: Energie
Posté par Nicolas Boulay (site web personnel) . Évalué à 4 (+1/-0).
A part dans le ferroviaire, l'acv compte l'intégralité du cycle.
J'avais lu des études hitachi, qui parlait d'ACV PC et de disque dure. En gros, pour un HD, 50kg de CO2 à la production et 50 kg de CO2 à l'usage.
Mais en France on est entre 5 à 10x moins de CO2 que la moyenne mondial par kwh. Donc la partie usage de l'électronique devient anecdotique pour rapport à la fabrication.
"La première sécurité est la liberté"
# Je ne comprends pas cette position
Posté par fearan . Évalué à 8 (+7/-2).
Les générateurs de langages sont des outils; ils peuvent être libres.
Le code généré peut être libre si la base de connaissance elle même est libre (licence type bsd par exemple)
La seule restriction que je vois, et encore ça peut se discuter, c'est si le code généré est un travail dérivé ou pas, et dans ce cas le code généré ne peut être qu'une licence compatible avec le code d'apprentissage.
Si tu interdis un certain usage de ton code pour l'apprentissage les LLM, alors ton code lui n'est plus libre.
Bref, n'est-ce pas plutôt ton idéologie qui n'est pas compatible avec le libre?
Il ne faut pas décorner les boeufs avant d'avoir semé le vent
# Réflexions sur le sujets chez Debian
Posté par raphj . Évalué à 10 (+8/-0). Dernière modification le 21 janvier 2025 à 09:44.
C'est à l'état expérimental, mais j'aime bien les réflexions côté Debian sur la classifications des modèles IA : https://salsa.debian.org/deeplearning-team/ml-policy/-/blob/master/ML-Policy.rst
Faut lire en entier, mais voici un extrait clé pour donner envie :
Je pense que c'est une classification bien plus sensée que la définition de l'OSI qui me semble à côté de la plaque et pas très utile parce qu'elle ne place pas la barre très haute (il suffit d'être "ToxicCandy" pour être "open source" selon cette définition). (je note avec amusement qu'ils ont essayé de partir de la definition de Free software avec les 4 points "use, study, modify, share", plutôt que de l'open source definition avec ses 10 points - probablement parce qu'en vrai, la définition de free software est bien plus simple et fondamentale).
Me concernant, je pense qu'il ne faut pas mélanger les concepts :
[^] # Re: Réflexions sur le sujets chez Debian
Posté par Khrys (site web personnel) . Évalué à -1 (+1/-2).
Merci beaucoup pour cette référence, je vais regarder ça !
Il s'agit ici de critères pour le machine learning, qui est pour le coup une technique tout à fait identifiable et sur laquelle on peut effectivement réfléchir en termes de libre/non libre.
Contrairement à l'"IA" (que je ne qualifierais pas de domaine d'étude, à part peut-être en tant que concept idéologique).
Et bien sûr, libre≠vertueux.
En revanche, j'ai tendance à penser que vertueux => libre mais comme tu le dis, ça reste très subjectif ;-)
[^] # Re: Réflexions sur le sujets chez Debian
Posté par Pol' uX (site web personnel) . Évalué à 7 (+5/-0). Dernière modification le 21 janvier 2025 à 22:52.
Peut être que pour toi « l'IA » et « le libre » sont des concepts très précis et très clairs. Mais pour nourrir un débat public sur leur compatibilité respective, je pense que ça gagnerait à être explicité et résumé.
Adhérer à l'April, ça vous tente ?
[^] # Re: Réflexions sur le sujets chez Debian
Posté par raphj . Évalué à 3 (+1/-0).
C'est une formulation mathématique de ce que j'ai écrit en toutes lettres :-)
Pas d'accord. L'IA (on pourra critiquer le terme - mais faire rentrer le intelligence de CIA dans ce terme ou tordre le sens de articiel ne me parait pas très malin), pour moi, c'est un ensemble de techniques, concepts et d'implémentations pour réaliser ou simuler des tâches habituellement intellectuelles (réalisées par un cerveau, plus ou moins analogues à de la pensée, pas purement mécanique sinon n'importe quelle fonction de refactoring dans un éditeur de code serait de l'IA) en s'affranchissant des limitations liées à l'utilisation d'un cerveau "naturel". Ou quelque chose comme ça. Par exemple, des personnages virtuels dans les jeux vidéos, un programme qui joue aux échecs ou au go… Clairement, il ne serait pas opportun de vouloir cesser de parler d'IA et de parler plutôt de LLM : ce serait trop restrictif, les LLMs sont une seule des manières très récente et à la mode de faire de l'IA.
Pour moi, c'est bien un domaine technique / scientifique. Je ne vois pas de jugement dans cette définition. C'est voulu : on peut détester la chose, mais au moins on la déteste pour ce qu'elle est.
Et comme quasiment toute technique / tout domaine scientifique, il y a des aspects / répercutions / considération politiques, éthiques, philosophiques, sociales, sociétales, environnementales, …
C'est vrai par exemple aussi pour la physique nucléaire. C'est des questions très techniques sur le fonctionnement des atomes, mais ça a des répercussions géopolitiques, environnementales, …
Donc même si c'est "purement" technique, ça ne dispense pas de réfléchir à ce qu'on fait, évidemment. Mais ça me semble important de délimiter les sujets et de travailler avec des définitions claires et de ne pas essayer de tordre les définitions pour les faire coller avec des points de vue (même si les définitions sont rarement (jamais ?) neutre, il faut faire attention).
On pourra essayer de décrire ce qu'il se passe dans notre société, et constater par exemple que certaines entités cherchent à retirer du contrôle aux gens avec de l'IA et des manifestations concrètes comme les LLM. Je ne sais pas si c'est vrai (je serais plus enclin à dire que l'IA vient actuellement avec un risque de perte de contrôle parce que ses manifestations à la mode sont opaques comme des boites noires et contrôlées par de boites privées toutes puissantes, et qu'elles ont potentiellement un impact environnemental désastreux), mais tu as beaucoup plus de chance de tenir une réflexion claire, et présenter une démonstration claire, compréhensible et convaincante en travaillant avec des définitions simples.
Décrire les choses simplement et telles qu'elles sont pour mieux les critiquer :-)
Et d'ailleurs, en faisant ça, on se rend compte qu'on ne peut pas vraiment dire que l'IA est incompatible avec le libre parce qu'on a immédiatement des contres exemples : GNU chess est libre, et d'ailleurs je ne lui vois même pas de problèmes éthiques. C'est bien une IA, mais je ne vois pas le côté perte de contrôle ou renseignement, donc le intelligence de CIA ne s'applique vraiment pas, si le côté "de surface". Et ce c'est pas parce que c'est de l'IA que c'est mal.
Donc peut être que tu ne critiques pas réellement toute l'IA, mais juste une partie. Mais pas restreinte aux LLM, on peut souhaiter une réflexion plus générique / générale. On pourra aussi critiquer le fait que IA soit actuellement un buzzword.
Autre questionnement : si VLC utilise whisper, pourquoi ça ne serait pas de l'IA ? Comment definis-tu l'IA ?
Je pense qu'avec ton journal tu es sur une piste intéressante, mais ça mérite probablement de creuser plus.
[^] # Re: Réflexions sur le sujets chez Debian
Posté par Khrys (site web personnel) . Évalué à 2 (+2/-0).
Bah oui je sais :-)
Mon propos est précisément de dire qu'il faut arrêter d'utiliser ce terme fourre-tout d'IA, qui peut désigner un peu tout et n'importe quoi, d'un truc basique comme ELIZA aux trucs d'aujourd'hui en passant par les systèmes experts des années 80.
Je ne vais donc PAS donner une définition de ce que j'entends par IA parce que PERSONNE N'EN A, et c'est bien ça le problème. On pourrait trouver des contre-exemples assez facilement à ta propre tentative de définition (sauf si on décide de n'appeler IA que les trucs d'aujourd'hui, mais alors, autant les appeler SRAS ce sera moins trompeur).
J'invite à lire ce que dit Ali Alkhatib à ce propos.
Or moi, ça me pose un gros problème de définir un domaine d'étude sur un sujet que l'on ne parvient pas bien à définir et qui désigne plus un résultat (ou une absence de connaissances face à un résultat) qu'un ensemble clair de techniques (cf ELIZA). Sauf, comme je le disais, à l'étudier en tant que concept idéologique.
Car l'IA pour moi, si c'est quelque chose, ce n'est pas une technique. C'est un ensemble d'idées, de croyances, d'envies, une façon de voir le monde (bref, une idéologie) consistant à dire qu'il est possible de remplacer l'intelligence humaine par des machines et qu'il est bon de le faire. Qu'il faut le faire.
[^] # Re: Réflexions sur le sujets chez Debian
Posté par raphj . Évalué à 2 (+0/-0). Dernière modification le 22 janvier 2025 à 11:14.
Non, parce que toutes les IA n'en sont pas. Par exemple GNU Chess, que j'ai fait exprès de citer pour cette raison.
Je sais que ma définition est incomplète et imparfaite. Mon but n'était pas de donner une définition définitive. L'IA évolue, c'est normal que les définitions soient révisées. C'est normal pour tout domaine qui évolue.
Plus généralement, hors des mathématiques, c'est normal de n'avoir que des définitions imparfaites à notre disposition. Rien n'est clairement et définitivement défini. Quand on écrit un papier de recherche, on est d'ailleurs obligé·e de dédier une introduction pour présenter un point de vue en particulier du domaine dans lequel le papier s'inscrit, voire une section définition pour cadrer le papier.
Je viens de le faire, ça ressemble à ta présentation dans le journal, et je n'adhère vraiment pas du tout à ce mode de réflexion. Ça ne colle juste pas. Je ne comprends pas de quoi on parle, ce qu'on critique vraiment, etc.
Je ne vois pas de problème à décrire une idéologie liée à l'IA, ou (puisque c'est ça dont il a l'air de s'agir) même plus généralement à critiquer la pensée libertarienne ou le capitalisme ou le libéralisme, ou d'argumenter sur le fait que certaines manifestations liées à l'IA sont des conséquences ou des symptômes de ces idéologies.
Par ailleurs, je ne suis pas convaincu du tout que la définition "technique" de l'IA devrait être remplacée par une définition idéologique. L'article n'en donne d'ailleurs pas. C'est ok, c'est peut-être un début de réflexion, mais du coup il manque la pièce centrale pour travailler sur quelque chose de concret. On peut bien sûr définir des bases pour ensuite poser une réflexion bien carrée (d'ailleurs c'est un peu obligatoire), mais je ne repère pas trop ça dans l'article. On n'a pas d'ailleurs besoin d'une définition si on ne s'en sert pas dans une argumentation plus tard.
Il y a ça dans l'article :
Ça ressemble à une définition mais ça n'en est pas une. C'est une qualification. Et je ne pense pas que ça soit une qualification fidèle, ni même correcte. De tout le mal que je pense de l'IA aujourd'hui, je ne pense pas que l'objectif des gens qui bossent sur l'IA soit de limiter l'autorité ou l'autonomie des individus, ni de pousser vers des structures centralisées de pouvoir. Ça serait peut-être plutôt des conséquences de certaines manifestations de l'IA parce qu'elle vit dans l'idéologie dominante qui a tendance à avoir ces travers. Elles ne sont pas non plus spécifiques à l'IA. Ça peut s'appliquer à chacun des GAFAM, même dans leurs activités non IA, et ce depuis longtemps. Et d'un tas d'autres trucs.
Mon point de vue :
[^] # Re: Réflexions sur le sujets chez Debian
Posté par raphj . Évalué à 2 (+0/-0). Dernière modification le 22 janvier 2025 à 11:32.
Pour moi, c'est jeter le bébé avec l'eau du bain.
Penser qu'un outil peut assister l'humain n'est pas nouveau, et on n'arrête pas de le faire pour absolument tout. Ça a rarement été remis en cause, voire le fonctionnement de notre espèce repose sur ce principe.
Mais comme tout outil, il peut être mal utilisé, utilisé pour nuire, peux avoir des effets secondaires néfastes, etc. Je sens qu'on touche le cœur du problème : identifier ces occurrences pour mieux les combattre me parait intéressant.
À mon avis il ne faudrait pas faire de "On ne devrait pas remplacer l'intelligence humaine par un outil" un dogme, ou rejeter l'idée par principe. C'est une impasse, et ça ne convaincra que les personnes déjà convaincues. Cherchons plutôt dans quels cas concrets il ne faut pas le faire, pourquoi il ne faut pas le faire, etc.
Perso, si on arrive à remplacer mon travail intellectuel par un outil, très bien, ça me libère potentiellement du temps pour m'adonner à des activités potentiellement plus fondamentales ou plaisantes. Encore faut-il une organisation sociétale qui permet ça. Ça malheureusement j'en doute fort, et il faudrait s'attaquer à ça.
# L'IA est-elle compatible avec le Libre ?
Posté par Breizhux . Évalué à 2 (+2/-0).
Il y a des éléments de réflexion intéressante.
Mais l'IA reste avant tout technique. Malheureusement, il est tout à fait certain que cette technique s'accompagne d'une idéologie dont il faut se débarasser : le transhumanisme.
Les médias gardent un flou volontaire autour de la notion d'IA. Il est urgent de reprendre les bases populaires de ce qu'est cette technique. Il faut qu'on grandisse tous sur ce qu'on a devant nous avant de l'utiliser ! Personne ne devrait utiliser l'IA sans savoir un minimum quels sont les principes fondamentaux à mon sens.
Sur Whisper. Si, c'est une IA, si on part du principe qu'une IA est un logiciel qui apprend. Il a bien eu une phase d'apprentissage.
La solution est libre. Le code pour effectuer l'apprentissage est libre. D'ailleurs, quelques jours/semaines après sa mise en open source, le code a été entièrement réécrit en C++ pour le rendre plus rapide, ce qui a donné whipsercpp. Et un autre code a été écrit plus tard pour donner faster-whisper en se basant sur la technologie CTranslate.
Le code est donc maitrisé par la communauté du libre.
Pour ce qui est de l'apprentissage, il est vrai que je ne connais pas grand monde qui ait réentraîné des modèles dans leur coin. Ce coût aurait été inutile puisque les modèles d'openai étaient déjà disponible. Cependant, si cet entraînement à un coup, il reste accessible, moyennant un peu de matériel et des compétences, et du temps. Mais c'est comme toute technologie : le développement de logiciel n'est pas accessible à tous sans matériel. L'IA restreint la communauté et l'accessibilité pour des coûts matériels et des compétences techniques évidentes. Cela se régulera dans le temps, je n'y vois pas un problème.
Vosk, j'ai voulu l'utiliser. Il y a des choses intéresantes, mais est largement en deça des capacités de Whisper : beaucoup de fautes par rapport à la taille du modèle et sa consommation en ressources, aucune ponctuation. J'ai été obligé de l'abandonner alors que j'y mettais pas mal d'espoir il y a quelques années.
L'IA n'est pas aussi accessible à la communauté, et c'est naturel. Mais ce n'est pas anti-éthique. Ce qui est anti-éthique, c'est de ne pas former les gens sur ce qu'est l'IA, ses principes de fonctionnement, et sur la moralité des usages.
Je publierai peut-être une réflexion. Mais il me semble qu'il y a une limite morale sur l'IA sur tout ce qui touche à la génération de contenu : nouvelle réflexion, nouveau texte, nouvelle image, à partir d'un simple prompt. Pour moi, l'acte de créer devrait être proprement humain. La réflexion doit encore faire un bout de chemin ;)
[^] # Re: L'IA est-elle compatible avec le Libre ?
Posté par raphj . Évalué à 2 (+0/-0).
Si tu fais ça, j'ai des questions :
Qu'est-ce que créer ? Pourquoi le réserver à un humain ?
En tout cas merci à toi, à Khrys et aux autres dans les commentaires pour les réflexions, c'est intéressant et important.
# Un ptit ajout à propos du sous-titrage dans VLC
Posté par Titi . Évalué à 0 (+0/-0).
Journal intéressant !
Ca soulève plusieurs questionnement…
Le biais / la neutralité d'une technologie. Son aspect ouvert/open-source/libre. Son utilité par rapport à sa consommation de ressource.
Pour faire du sous-titrage automatisé en français aujourd'hui, librement utilisable, il y a vosk/kaldi et maintenant Whisper (avec plein de variantes).
Les deux sont "openweight" dans le sens que les modèles sont libre d'être modifié. Il y a des variantes de Whisper "distillé" pour mieux fonctionner sur le français par exemple. A l'opposé des modèles de Google ou Microsoft dont on ne connaît rien.
Par contre on ne sait pas comment Whisper a été entraîné, ni sur quel données (bien que l'on se doute qu'OpenAI a scrappé youtube). Pour les modèles Kaldi, on a un peu plus idée sur quelles données ça a été entraîné (pas sur que toute les données soit libre, et que ce soit reproductible néanmoins).
Concernant les biais, d'un coté Kaldi retranscrit texto le son en phonème puis les phonèmes en mot. De l'autre whisper c'est plus une boite noir qui a été entraîné pour sous-titré des vidéos, donc il va retranscrire les onomatopé, il va sauter certains mots qui ne se disent qu'à l'oral mais pas à l'écrit, voir parfois halluciner et faire n'importe quoi (afficher du texte entre crochet aux moments des silence).
A la fin, Whisper transcrit mieux que kaldi, en échange d'un puissance de calcul décuplé (kaldi peux tourner sur une rasperry pi en direct, les modèles "normaux" de whisper il vaut mieux une carte graphique récente pour transcrire en direct).
Du coup, mitigé à propos du sous-titrage dans VLC, à la fois je suis ravi que tout un chacun puisse profiter de cette technologie qui fonctionne agréablement bien. Mais n'aurait il pas fallu attendre qu'un vrai modèle libre de Speech-to-text moderne voie le jour ?
Envoyer un commentaire
Suivre le flux des commentaires
Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.