Journal L'IA est-elle compatible avec le Libre ?

35
20
jan.
2025

Sommaire

Hello,

Ceci est ma première tentative de journal, alors autant y aller franchement ;-P

La question me turlupine depuis un bon bout de temps et j'aimerais initier une discussion parce que je trouve que la communauté francophone reste encore très discrète sur ce sujet pourtant important. Je ne prétends évidemment pas répondre de façon définitive, mais juste indiquer où en est ma propre réflexion.

Ça a commencé fin novembre avec la keynote Libre, Open source: de VLC à l'IA, et futur de JB Kempf à Capitole du Libre où après une première partie amusante et agréable, JB s'est soudain mis à nous expliquer qu'il fallait que nous (les libristes) fassions de l'IA. Le problème avec JB c'est qu'on ne sait pas toujours lorsqu'il est sérieux ou pas, et qu'il s'en sort en nous laissant libres (!) d'interpréter ses propos : troll, il nous invite à dire qu'on fait de l'IA alors que ça n'en est pas vraiment, juste pour obtenir des subventions ; et il a dû bien s'amuser des réactions à l'annonce que VLC utiliserait désormais l'IA pour les sous-titres des vidéos. Mais beaucoup plus sérieusement, enfin moi j'ai vraiment pris ça sérieusement, il nous a aussi dit en gros la même chose que notre pénible résident : si on reste des herbivores, vous comprenez, les carnivores (ceux qui font de l'IA) gagneront.

Il y a eu ensuite les campagnes de dons de LQDN et de Framasoft autour de l'IA ; autant celle de La Quadrature était claire et nette, autant celle de Framasoft m'a assez perturbée : on informe sur l'IA mais on dit aussi qu'on va expérimenter l'IA "pour voir". Et aux personnes qui protestent on répond gentiment qu'on est bien au courant des problèmes et que c'est justement pour en discuter qu'on fait ça.

À noter que Framasoft comme VLC ont choisi de s'appuyer sur Whisper, d'OpenAI1. Pour rappel, OpenAI, actuellement, c'est à 49% Microsoft. Parmi les premiers promoteurs d'OpenAI, outre Sam Altman, il y a Elon Musk et Peter Thiel. Des techbros libertariens (si vous ne connaissez pas bien Peter Thiel ou plus généralement qui sont les techbros, je vous conseille Brotopia, c'est passionnant).

À une époque pas si lointaine, on nous expliquait que le Libre, c'est l'open source avec l'éthique (aka la Philosophie du Libre) en plus. J'ai l'impression que certains s'y retrouvent de moins en moins dans cette distinction.

Alors tentons de (re)poser rapidement quelques bases.

De quoi l'IA est-elle le nom

Dans la dénomination "Intelligence Artificielle", rien ne va.

Sauf peut-être si on prend l'adjectif "artificiel" dans le sens de "non authentique, de surface", et "intelligence" dans l'acception angloaméricaine utilisée dans l'acronyme CIA (Central Intelligence Agency) : quelque chose qui renseigne et contrôle.

Le souci, c'est que le pouvoir des mots est difficilement contournable. Et que même si on sait ce qu'il se cache derrière l'IA, le fait même d'utiliser le mot "intelligence" oriente notre pensée, nous amène à des associations biaisées. D'autant que le fantasme d'IA véritablement intelligente, consciente, à notre image, whatever, n'est jamais très loin. Même si on sait pertinemment que la mémoire d'un ordinateur n'a que peu de choses à voir avec la mémoire animale (la nôtre), ou que les réseaux neuronaux n'ont à peu près que le nom en commun avec l'entité constituée par nos propres réseaux de neurones (aka notre cerveau).

À la place, on pourrait parler de LLM, de perroquets stochastiques ou de SRAS (Systèmes Résultant d'Apprentissage Stochastique). Ce n'est pas le vocabulaire qui manque.

Et cela permettrait déjà de faire clairement la distinction entre les différentes formes de techniques qui se cachent derrière ce terme à la fois fourre-tout et fallacieux d'IA2.

Pour en revenir à la question

On l'aura compris, le fait même de parler d'IA dans un projet libre est pour moi déjà un problème.

Comme le dit Ali Alkhatib3 :

AI is an ideological project to shift authority and autonomy away from individuals, towards centralized structures of power. Projects that claim to "democratize" AI routinely conflate "democratization" with "commodification".

L'idéologie derrière l'acronyme IA, est exactement celle-là : nous ôter notre pouvoir de décision, nous déposséder de nos compétences décisionnelles, pour les confier à un SRAS (voire à un simple algorithme) via (très généralement) un SaaSS (Service as a Software Substitute)4

Cela me pose donc un gros problème que des structures en faveur du Libre cèdent à la facilité (au buzz ? à la provocation ?) de parler d'IA pour qualifier les outils qu'elles utilisent.

VLC n'utilise pas l'IA. Il utilise le logiciel open source Whisper, qui a été entraîné par des moyens, il me semble, inaccessibles à une personne lambda en termes de reproductibilité. Je ne connais pas les biais de Whisper. Reconnaît-il les voix féminines aussi bien que les masculines ? Les voix avec accent ? Quelles ont été les petites mains qui ont dû œuvrer (et qui œuvrent probablement encore) pour le corriger et l'amener aux niveaux de performance actuels ? Quels ressources énergétiques ont été nécessaires ?

Je comprends parfaitement l'utilité d'un tel logiciel pour permettre des traductions automatiques, je comprends tout particulièrement l'utilité en termes d'accessibilité, et je comprends qu'il n'existe pas vraiment d'alternative à la hauteur (à part peut-être le projet Scribe5, qui utilise Vosk6 : mieux ou pas mieux en termes d'éthique, je veux bien vos avis sur la question). Mais qu'on arrête de nous rouler dans la farine en parlant d'IA ou de Libre. Ce n'est pas libre, puisqu'on ne contrôle pas du tout la façon dont ce logiciel a été entraîné et qu'il est matériellement impossible (sauf à avoir les capacités de stockage et de calcul d'OpenAI) à reproduire soi-même.

En ce qui concerne Lokas de Framasoft (qui utilise aussi Whisper, donc) je suis encore plus perplexe car le rapport utilité/éthique de la proposition me paraît fortement questionnable. Même si je comprends que l'idée est de fournir un logiciel à peu près safe afin que les personnes qui auraient besoin d'un tel outil ne soient pas obligées d'y laisser toutes leurs données personnelles, je ne pense pas que développer un outil qui habitue à enregistrer l'intégralité de réunions via un smartphone soit une bonne idée.

En tout cas, ce n'est toujours ni libre, ni "de l'IA".

Parler d'IA, même au second degré, c'est dérouler le tapis rouge devant une idéologie qu'il faudrait au contraire dézinguer complètement.

Pour répondre à ce stade de ma réflexion à la question posée, l'IA ne peut pas être compatible avec le Libre, car ce n'est pas en soi une technologie, ni même un ensemble de techniques clairement définies. C'est une idéologie, en totale contradiction avec la philosophie du Libre.

À vous.


  1. Ce n'est pas dit dans la page wikipédia française, mais si on consulte l'anglaise, on peut y lire ceci : According to a NYT report, in 2021 OpenAI believed they exhausted sources of higher-quality data to train their large language models and decided to complement scraped web text with transcriptions of YouTube videos and podcasts, and developed Whisper to solve this task. 

  2. Pour un excellent historique et appréhender de façon à la fois pédagogique et détaillée les différentes formes d'IA, je conseille vivement la lecture de Melanie Mitchell - Artificial Intelligence: A Guide for Thinking Humans. J'ai également commencé ici une page regroupant des ouvrages et articles permettant d'outiller la réflexion au sujet de l'IA. 

  3. On écoutera également avec intérêt l'épisode du podcast Tech Won't Save Us qui lui est consacré 

  4. À ce sujet on relira avec profit cette page : Using SaaSS causes the same injustices as using a nonfree program: they are two paths to the same bad place. Take the example of a SaaSS translation service: The user sends text to the server, and the server translates it (from English to Spanish, say) and sends the translation back to the user. Now the job of translating is under the control of the server operator rather than the user. 

  5. https://scribe.cemea.org/ 

  6. https://alphacephei.com/vosk/ 

  • # différence moteur et finalité

    Posté par  (site web personnel) . Évalué à 8 (+6/-0). Dernière modification le 20 janvier 2025 à 20:02.

    Ce qui rend complexe le sujet des LLM1, c'est que oui c'est une branche de l'IA qui a le vent en poupe actuellement, malgré toutes ses casseroles^W hallucinations (dont beaucoup ne sont pas de son fait…).

    L'IA c'est aussi pour certains enlever les yeux rouges d'une photo efficacement (cela s'appuie sur du traitement d'image trivial), des systèmes experts qui ont le mérite d'avoir une traçabilité du raisonnement — et le défaut d'être un peu trop manuel — et bien sûr utiliser des réseaux de neurones correspond à une autre branche de l'IA, et il y a encore d'autres branches.

    Premier point.

    L'IA dont tu parles, recouvre le service rendu. La partie libre ne couvre généralement que le moteur — que ce soit celui d'exécution ou celui d'apprentissage — pas le corpus de données ayant permis de l'entraîner, ni la manière de l'entraîner…

    C'est un peu le même souci avec les jeux libres : s'il n'y a que le moteur de libre, tu as un moteur de jeu libre, pour les FPS tu trouves ioquake qui a permis de décliner Xonotic, Unvanquished, OpenArena qui ont libéré les cartes (donc des données + musiques + textures + modèles 3D des personnages) indispensables pour avoir un jeu libre (j'allais ajouter _entièrement) et dont on peut modifier toutes les sources en utilisant la meilleure origine possible (pour les modèles 3D, ce n'est pas le nuage de points résultant, c'est bien la modélisation d'origine).
    Pour l'IA tu retrouves donc cette séparation moteur / données : À quoi s'applique le libre ? Pour moi la réponse est claire : tu as une IA^W LLM efficace libre si l'ensemble (moteurs + données + méthodologie d'apprentissage) est reproductible et libre.

    Second point pour moi, ce serait le deuxième si j'avais envie d'élaborer :D

    Donc bon, il y a plein d'autres points à soulever, factuellement, selon l'architecture de chacune de ces IA (si c'était un robot, ça nous emmènerait du côté de l'Open Hardware et là… donc bon autant rester factuel et se cantonner à des sujets précis :p)


    1. surnommer les LLM de SRAS en français a une autre connotation, beau jeu de mot^W acronyme ;-) 

    • [^] # Re: différence moteur et finalité

      Posté par  (site web personnel) . Évalué à 8 (+7/-0).

      malgré toutes ses casserolesW hallucinations (dont beaucoup ne sont pas de son fait…).

      À propos du terme "hallucinations", Thibault Prévost interrogé par Mediapart expose :

      Dans une tentative de dépolitiser le problème, la Silicon Valley essaye de redéfinir les erreurs de l’IA comme des « hallucinations », en nous obligeant à une forme de tendresse par rapport aux machines, qu’il faudrait éduquer. Je suis absolument contre l’usage de ce terme : il s’agit d’erreurs de calcul, de désinformation, intrinsèques au modèle.

      (source: Trumpisme, biais racistes et menace écologique : « L’IA n’est pas une technique, c’est une idéologie », 19/01/2025, article payant).

      Actuellement, la bataille autour des mots semble gagnée par les bullshitters de tous poils, je rejoins l'auteur du post initial sur la nécessité de défendre des positions aussi sur ce plan là (même si nous sommes avons le sentiment d'être quasiment inaudibles aujourd'hui).

  • # Toujours à vouloir limiter le libre...

    Posté par  (site web personnel) . Évalué à 0 (+9/-11). Dernière modification le 20 janvier 2025 à 21:47.

    C'est une idéologie, en totale contradiction avec la philosophie du Libre.

    Qui a dit que c'était en contradiction?
    Et en réalité tu n'as pas démontré que c'est une idéologie ou du moins pas un idéologie différente du libre.

    Je vais prendre un exemple d'il y a quelques temps : les jeu vidéos.
    Il y a une une période où certains ont tenté de faire croire qu'ils faisaient des jeux libres.
    Puis on a décortiqué, un jeu c'est :
    - Un code
    - Des "objets" (audio, vidéo, images, …)
    Et la plupart des gens qui parlaient de jeux libre avaient libéré le truc le moins bankable (le code), alors que pour être libre il faut que 100% de l'oeuvre soit libre. OK, 99.999% pour inclure Firefox (à une époque l'outil de rapport de bug était non libre).

    l'IA, c'est quoi?
    - Un code
    - Des "objets" (le corpus d’entraînement)
    Si seulement le code est libre, l'IA n'est pas libre, si le code + le corpus sont libre ton IA est libre même si la finalité te déplaît (le libre n'interdit pas d'ôter un "pouvoir de décision", au contraire elle t'interdit de m'interdire d'utiliser ce que tu fais en libre pour ça), comme le libre est toujours libre même en SaaS (rappel : seul celui qui reçoit l'oeuvre a le source, donc si tu as que le résultat tu n'es pas forcément légitime à demander le source car tu n'es pas la cible du libre, seulement de l'AGPL).

    Le libre offre sans doute plus de liberté que tu ne le voudrais, mais c'est justement pour éviter ton arbitraire que le libre est là.

    Edit : j'aurais dû actualiser la page avant d'envoyer mon commentaire fait en 2 phases, BAud avait déjà sorti l'idée des jeux vidéos, zut, j'abonde donc.

    • [^] # Re: Toujours à vouloir limiter le libre...

      Posté par  (site web personnel) . Évalué à 2 (+0/-0). Dernière modification le 20 janvier 2025 à 22:10.

      Edit : j'aurais dû actualiser la page avant d'envoyer mon commentaire fait en 2 phases, BAud avait déjà sorti l'idée des jeux vidéos, zut, j'abonde donc.

      moui, j'ai préféré dégainer avant toi :D
      même si — ces derniers temps — tes commentaires deviennent moins agressifs ;-)

      j'ai sous le coude en plus https://faq.tuxfamily.org/JeuLibre/Fr pour rester sur l'exemple des jeux ainsi que :

      • la reconnaissance de la parole vu que Khrys< a un bon exemple avec vosk / alphacephei.com, beau projet (et avec des corpus vocaux libres / non-libres en exemple)
      • les messageries instantanées comme Telegram non libres vu qu'on ne peut pas s'instancier de serveur :/
      • un parallèle avec l'art libre (ça je le garde pour la fin :D)
    • [^] # Re: Toujours à vouloir limiter le libre...

      Posté par  (site web personnel) . Évalué à 4 (+4/-0).

      Le libre offre sans doute plus de liberté que tu ne le voudrais, mais c'est justement pour éviter ton arbitraire que le libre est là.

      Je crois que tu te méprends profondément sur ma conception du libre :-)

      (si tu lis ce que j'en dis à la fin de ma conf à Capitole du libre je crois que c'est assez clair)

      • [^] # Re: Toujours à vouloir limiter le libre...

        Posté par  (site web personnel) . Évalué à -7 (+2/-11). Dernière modification le 21 janvier 2025 à 09:19.

        (si tu lis ce que j'en dis à la fin de ma conf à Capitole du libre je crois que c'est assez clair)

        Je note donc que tu dis tout et son contraire, c'est surtout ça qui est incompatible, il faudrait que tu clarifies dans ton esprit.

        "Le mouvement du libre, c’est affirmer et lutter pour la liberté des utilisateurices, quelles qu’iels soient." est incompatible avec " l'IA ne peut pas être compatible avec le Libre", il te faut choisir car "IA" est un "quelles qu’iels soient".

        (en pratique, l'IA est compatible avec le Libre car l'IA n'est rien d'autre qu'un programme comme un autre, et les données sont à part comme pour les jeux vidéos, les compresseurs vidéos, etc, qui peuvent aussi être libres, ha oui je te laisse le plaisir de voir dans le lien le nombre de personnes qui limitent le libre au logiciel libre et détestent le libre dès qu'on enlève le terme "logiciel", y compris, voir surtout, "à gauche", faut pas déconner avec le monopole d'usage de ses amis "artistes", si tu veux jouer la prochaine fois explicite que le libre sans "logiciel" ça inclut les morceaux de musique, le dernier roman ou la dernière BD des copains qu'on ne devrait pas limiter, avant d'attaquer le jeu de données de l'IA, car c'est assez impressionnant le nombre de "libristes de gauche" qui aiment ce qu'ont fait les autres mais pensent que ce que eux créent doit être non libre)

        • [^] # Re: Toujours à vouloir limiter le libre...

          Posté par  (site web personnel) . Évalué à 6 (+7/-2).

          Je suis allée lire le lien, je trouve que tu passes à côté d'un aspect qui selon moi fait une grosse différence entre l'art et le logiciel.

          Lorsque je code, j'engage essentiellement mon intellect. Des fois je trouve que ce que j'ai fait est cracra et moche. Parfois, quand j'ai fait une architecture qui fonctionne bien et donne l'impression que tout est parfaitement là où ça doit être, je trouve que c'est beau. En général, c'est quelque part entre les deux. Si quelqu'un veut reprendre pour améliorer ou adapter à ses besoins, généralement je le verrai de façon positive, je trouverai ça flatteur pour mon travail.

          Lorsque que je joue du piano, que je dessine ou que je fais de la peinture, il peut y avoir une part de réflexion en amont, mais j'y mets aussi mes émotions, ma sensibilité, "mes tripes". Des fois c'est moche et des fois c'est beau. C'est perfectible aussi (surtout que je ne crois pas vraiment que la notion de perfection ait du sens quand on parle d'art), mais je n'ai pas forcément envie que quelqu'un d'autre que moi y touche.

          Cela ne veut pas dire qu'il m'est inenvisageable de faire de l'art libre, mais ce qui pour moi va de soi pour du logiciel ne va plus de soi pour de l'art. Ce n'est pas une question de mettre l'un sur un piédestal et l'autre pas, je ne mets pas de hiérarchie entre les deux. C'est simplement que l'un touche à quelque chose d'intime et l'autre pas.

          • [^] # Re: Toujours à vouloir limiter le libre...

            Posté par  (site web personnel) . Évalué à -5 (+4/-11). Dernière modification le 21 janvier 2025 à 11:11.

            une grosse différence

            Oui, bon, rien de nouveau donc, toujours une excuse pour soit et une insulte aux gens qui codent vu comme inférieurs (ils n'ont pas assez d'"intime" pour faire de l'art, les pauvres).

            En vrai, c'est pareil, les 2 peuvent être améliorés mais des gens pensent que leur œuvre ne doit pas être modifiée car ils ont un égo démesuré (et rien d'autre, rien à voir avec l'intime vu que c'est public).

            mais je n'ai pas forcément envie que quelqu'un d'autre que moi y touche.

            Ton discours est avancé par pas mal de monde pour les logiciels proprios mais c'est un détail, en fait c'est juste subjectif et très "les autres font mais pour ce que je fais c'est non".

            Lorsque je code, j'engage essentiellement mon intellect.

            Moi, c'est intime donc tu comprendras que je veux pas faire de libre. Ha, tiens, subjectif en fait.

            Lorsque que je joue du piano, que je dessine ou que je fais de la peinture, il peut y avoir une part de réflexion en amont

            Moi, c'est intellect et pas intime, du coup ton piano doit être libre.

            C'est simplement que l'un touche à quelque chose d'intime et l'autre pas.

            Oui, en effet, mais en fait tu inverses. Ben oui, pourquoi ta façon de voir ce que je fais (tu m'insultes, au passage, à me voir comme pas intime en code là où tu l'es en piano) serait mieux que la mienne sur ton piano?
            Merci d'avoir confirmé ce que j'écrivais, on est bien en sélectivité suivant ce qui te plaît, et le libre c'est justement passer au dessus de ton égo.

            Rien de nouveau donc, mais l'art libre essaye d'exister malgré tout, même si il n'a pas encore pris autant que dans le logiciel libre, ça se fait un peu (d'ailleurs, amusant, tu insultes aussi ceux qui font de l'art libre en sous-entendant qu'ils y mettraient pas assez d'intime… Un autre détail). Et l'IA libre peut aussi exister.

            • [^] # Re: Toujours à vouloir limiter le libre...

              Posté par  (site web personnel) . Évalué à 10 (+11/-1). Dernière modification le 21 janvier 2025 à 11:34.

              Non, mon message ne t'insultait pas, ni toi ni personne. Je pensais suffisamment clair dans mon intervention qu'il s'agissait d'une vision personnelle sans jugement de valeur sur la vision des autres, laquelle peut être différente.

              À aucun moment je n'ai sous-entendu qu'entre le développement et l'art l'un serait mieux que l'autre, et encore moins que les artistes seraient inférieurs aux développeurs. J'ai écrit au contraire que je ne mets pas de hiérarchie entre les deux. Cela n'a aucun sens pour moi de les hiérarchiser, ce n'est pas le même domaine.

              En revanche, je considère ton message comme très désagréablement condescendant, tu interprètes sur mes propos du grand n'importe quoi que je ne pense pas. Je n'ai donc pas envie de poursuivre cet échange qui ne mènera vraisemblablement nulle part.

          • [^] # Re: Toujours à vouloir limiter le libre...

            Posté par  . Évalué à 6 (+4/-0). Dernière modification le 21 janvier 2025 à 11:13.

            On peut aussi argumenter sur le fait qu'on peux y mettre ses tripes et de l'émotion quand on programme.

            Pour aller dans ton sens mais pour des raisons très différentes. Logiciel vs art : les conséquences ne sont pas les mêmes en termes de "droits fondamentaux". Dans le monde du logiciel, le libre est important pour pouvoir garder le contrôle son informatique. À mon avis, ça ne s'applique pas à l'art, potentiellement même quand il est utilisé comme assets d'un jeu vidéo. On n'a pas besoin d'étudier le fonctionnement, il n'y a pas de problématique d'interopérabilité, de fonctionnalité, etc.

            Dans un cadre développement coopératif / collectif, en revanche, l'art libre a les mêmes avantages que l'open source logiciel. Ton argumentation sur l'aspect peut-être plus intime de l'art peut intervenir dans ce cadre : on peut argumenter que comme une œuvre d'art est l'expression très personnelle de l'artiste, elle est achevée et ne saurait voir de dérivé ou d'itération. Mais c'est un poil discutable, surtout pour des assets d'un jeu.

            Bref, en résumé : pour moi, ça peut être cohérent de défendre le logiciel libre et pas forcément l'art libre. Ce n'est vraiment pas une question de "c'est important que ce soit libre sauf quand c'est moi qui fait". Mais ça dépend de quel aspect du libre nous intéresse.

            • [^] # Re: Toujours à vouloir limiter le libre...

              Posté par  (site web personnel) . Évalué à 1 (+1/-1).

              Je ne nie pas que des développeurs puissent mettre leurs tripes et de l'émotion quand ils programment, comme probablement dans n'importe quelle autre activité.

              D'ailleurs on peut aussi mettre "ses tripes et de l'émotion" et accepter que ce soit libre, ce n'est pas incompatible. Je pense simplement que cela peut contribuer à rendre le choix d'une licence libre plus difficile.

              Je te rejoins entièrement sur le reste.

              • [^] # Re: Toujours à vouloir limiter le libre...

                Posté par  . Évalué à 4 (+2/-0).

                Je pense simplement que cela peut contribuer à rendre le choix d'une licence libre plus difficile.

                Tout à fait ! Ça peut demander un certain détachement.

                L'inverse aussi d'ailleurs (ouvrir son code à la lecture pour le montrer un peu par fierté), mais tu as spécifiquement parlé de licences libres… qui l'ouvrent à la modification.

        • [^] # Re: Toujours à vouloir limiter le libre...

          Posté par  (site web personnel) . Évalué à 10 (+22/-2).

          Salut Zenitram, comment ça va en ce moment ? Pas trop froid ? Moi ça va bof-bof, c'est gentil de demander.

          J'étais tranquille en train de me satisfaire de ne pas recevoir de plaintes d'utilisateurs de LinuxFr quand soudain, une nouvelle plainte ! Pas de veine.

          Remarque, je le sentais venir avec ces journaux et liens qui parlent de faire du libre restrictif, je sais bien que tu vas vouloir réagir :)

          Alors dans le fond je suis plutôt d'accord avec toi et cette frange de libristes qui poussent à restreindre à coup de NC, ND, non-GAFAM, non-que-sais-je jouent à mon avis en notre défaveur. Ils veulent du libre mais pas du libre qui profite à des entités qui leur déplaisent (ou qui déplaisent au plus grand monde, ce n'est pas le problème), donc du libre restreint, donc du pas-libre.

          Néanmoins, mets-y le ton nom d'une pipe en bois. Laisse refroidir et mesure ton propos. Tu ne vas convaincre personne à sauter à la gorge de tes interlocuteurs pour les tacler. « Là ! Une contradiction ! Paf ! Béquille, balayette ! Ah le nul t'as tord t'as tord t'as tord ! », voilà à quoi ça ressemble pour les spectateurs. Bonjour l'ambiance.

          D'habitude la modération contacte les gens par e-mail, mais comme t'es un vieux de la vieille et qu'on t'a déjà critiqué sur ton comportement EOVERFLOW fois, que ce soit l'équipe de modération ou les usagers du site, je me permets de t'interpeler publiquement, que ce soit bien clair pour tout le monde que la modération n'apprécie pas non plus ce comportement et l'ambiance que ça entraîne.

          • [^] # Re: Toujours à vouloir limiter le libre...

            Posté par  (site web personnel) . Évalué à -10 (+1/-19).

            Ils veulent du libre mais pas du libre qui profite à des entités qui leur déplaisent

            C'est gentil d'essayer de m'amadouer en me brossant dans le sens du poil mais ça me fait plutôt réagir qu'il faudrait peut-être écrire ça à plus nombreux quand une personne, pour montrer l'exemple surtout quand cette personne fait partie de la modération, sort des telles bêtises "la Terre est plate et ne me contredisez pas sinon je me plains" en défaveur du libre…

            on t'a déjà critiqué sur ton comportement EOVERFLOW fois,

            Il semble que le système de karma (sensé représenter le jugement du peuple local mais se refuse à me mettre en négatif malgré la "majorité" qui ne me supporterait pas, on a l'impression d'entendre certains au parlement national actuel) ainsi que les règles de modération (qui comme les 4 libertés du libre semblent en pratique interdire d'interdire quelque chose de non souhaité par certaines personnes) ne font pas ce qui est au fond souhaité par la modération, je vais donc me créer une règle d'exception, m'être juge en utilisant cette règle d'exception, et m'appliquer la sentence.

            • [^] # Re: Toujours à vouloir limiter le libre...

              Posté par  (Mastodon) . Évalué à 6 (+7/-4). Dernière modification le 22 janvier 2025 à 08:23.

              m'être juge en utilisant cette règle d'exception, et m'appliquer la sentence.

              Oui si tu peux la fermer quelque temps ça fera des vacances à tout le monde. Merci d'avance. On en a ras la casquette de recevoir des plaintes (y compris en interne pour une partie de la modération).

              Et à ton retour, essaie s'il-te-plaît d'arrêter les attaques systématiques personnelles. Tu passes ton temps à accuser tes contradicteurs d'idées supérieures qu'ils n'ont pas exprimé directement. Tu es soit extra-lucide, soit totalement borné.

              Merci de ne pas répondre non plus à ce post.

              En théorie, la théorie et la pratique c'est pareil. En pratique c'est pas vrai.

        • [^] # Re: Toujours à vouloir limiter le libre...

          Posté par  (site web personnel) . Évalué à 3 (+5/-2). Dernière modification le 21 janvier 2025 à 22:04.

          Je note donc que tu dis tout et son contraire, c'est surtout ça qui est incompatible, il faudrait que tu clarifies dans ton esprit.

          Oui je suis un peu bête et je ne comprends rien à ce que je dis, pardon :-)

          "Le mouvement du libre, c’est affirmer et lutter pour la liberté des utilisateurices, quelles qu’iels soient." est incompatible avec " l'IA ne peut pas être compatible avec le Libre", il te faut choisir car "IA" est un "quelles qu’iels soient".

          Mais là, pour le coup, je crois que c'est toi qui n'as rien compris à ce que j'ai écrit.

  • # Energie

    Posté par  (site web personnel) . Évalué à 1 (+6/-8).

    "Quels ressources énergétiques ont été nécessaires ?"

    On s'en fout un peu en fait. Si cela te pose problème, fait 100km de voiture de moins, cela sera beaucoup plus efficace.

    Consommation comparée des services numériques

    https://andymasley.substack.com/p/individual-ai-use-is-not-bad-for

    "La première sécurité est la liberté"

    • [^] # Re: Energie

      Posté par  (site web personnel) . Évalué à 7 (+4/-0). Dernière modification le 21 janvier 2025 à 10:27.

      ça ne prend en compte que l'utilisation, pas l'entraînement, qui lui utilise de nombreux CPU pendant de longues heures, et qui est plus ou moins permanent.

      Exemple « Huggingface BLOOM. Yes it took 3.5 Months to train this data on 384 high end GPU's but running it can be done on a 'normal' computer. »

      ou chiffres ChatGPT : "It is estimated that training the model took just 34 days." (d'un paquet de CPU…)

      edit: Hmm pourtant le document original dit : « The ChatGPT number assumes 3 Wh per search multiplied by average emissions per Wh in the US. Including the cost of training would raise the energy used per search by about 10% to 3.3 Wh, which wouldn’t create a visible change on the graph. » surprenant.

      • [^] # Re: Energie

        Posté par  (site web personnel) . Évalué à 5 (+2/-0).

        The power needed to train and deploy a model like OpenAI’s GPT-3 is difficult to ascertain. In a 2021 research paper, scientists from Google and the University of California at Berkeley estimated the training process alone consumed 1,287 megawatt hours of electricity (enough to power about 120 average U.S. homes for a year), generating about 552 tons of carbon dioxide.
        https://news.mit.edu/2025/explained-generative-ai-environmental-impact-0117

        ChatGPT produces CO2 equivalent of over 250 transatlantic flights monthly, study finds
        ChatGPT only produces 1.59 grams of CO2 per page view
        https://www.emergingtechbrew.com/stories/2025/01/16/chatgpt-co2-knownhost-study

        Les émissions de CO2 causées par les centres de données aux États-Unis ont triplé entre 2018 et 2024. La proportion de cette augmentation qu’on doit à l’IA? On l’ignore, ce qui inquiète ceux qui observent la croissance rapide ce secteur.
        https://www.sciencepresse.qc.ca/actualite/2025/01/10/2025-empreinte-environnementale-croissante-ia

        • [^] # Re: Energie

          Posté par  (site web personnel) . Évalué à 5 (+2/-0).

          L'entrainenement est très couteux, mais chatgpt est utilisé par des centaines de millions de personne, l'entrainement est réparti sur eux tous.

          552 tonnes de CO2, c'est le bilan carbone de 50 français.

          Les chiffres données sont aussi à comparer avec d'autres usages, et pourtant on en parle moins (vidéo).

          "La première sécurité est la liberté"

          • [^] # Re: Energie

            Posté par  (site web personnel) . Évalué à 1 (+1/-1).

            L'empreinte carbone de l'IT est à 75% dans la production du matériel.

            Les "552 tonnes de CO2" ne comprennent probablement pas la production du matériel, juste l'électricité nécessaire?

            • [^] # Re: Energie

              Posté par  (site web personnel) . Évalué à 4 (+1/-0).

              A part dans le ferroviaire, l'acv compte l'intégralité du cycle.

              J'avais lu des études hitachi, qui parlait d'ACV PC et de disque dure. En gros, pour un HD, 50kg de CO2 à la production et 50 kg de CO2 à l'usage.

              Mais en France on est entre 5 à 10x moins de CO2 que la moyenne mondial par kwh. Donc la partie usage de l'électronique devient anecdotique pour rapport à la fabrication.

              "La première sécurité est la liberté"

  • # Je ne comprends pas cette position

    Posté par  . Évalué à 8 (+7/-2).

    Les générateurs de langages sont des outils; ils peuvent être libres.
    Le code généré peut être libre si la base de connaissance elle même est libre (licence type bsd par exemple)

    La seule restriction que je vois, et encore ça peut se discuter, c'est si le code généré est un travail dérivé ou pas, et dans ce cas le code généré ne peut être qu'une licence compatible avec le code d'apprentissage.

    Si tu interdis un certain usage de ton code pour l'apprentissage les LLM, alors ton code lui n'est plus libre.

    Bref, n'est-ce pas plutôt ton idéologie qui n'est pas compatible avec le libre?

    Il ne faut pas décorner les boeufs avant d'avoir semé le vent

  • # Réflexions sur le sujets chez Debian

    Posté par  . Évalué à 10 (+8/-0). Dernière modification le 21 janvier 2025 à 09:44.

    C'est à l'état expérimental, mais j'aime bien les réflexions côté Debian sur la classifications des modèles IA : https://salsa.debian.org/deeplearning-team/ml-policy/-/blob/master/ML-Policy.rst

    Faut lire en entier, mais voici un extrait clé pour donner envie :

    Serialized Model

    In terms of software freedom and information security, the pre-trained machine learning models can be divided into the following non-overlapping categories:

    • Free Model is a model satisfying ALL the following conditions:

      1. The model itself is FOSS-Licensed & DFSG-compliant;
      2. trained from explicitly FOSS-licensed & DFSG-compliant datasets (e.g. for supervised or unsupervised learning) or simulators (e.g. for reinforcement learning), and the dataset is publicly available to anonymous users;
      3. corresponding training program is present and complete;
    • ToxicCandy Model is a model satisfying ALL the following conditions:

      1. The model itself is FOSS-Licensed & DFSG-compliant;
      2. trained from unknown, private, or non-free datasets or simulators;
      3. corresponding training program or script is present and complete;
    • NonFree Model is a model satisfying ANY of the following conditions:

      1. The model itself is non-free licensed or doesn't comply with DFSG;
      2. corresponding training program or script is absent or incomplete;
      3. unusable without non-free software (including but not limited to drivers and libraries);
      4. cannot be categorized as anyone other type;

    Generated Artifacts

    Artifacts (generally medias) produced by the machine learning models and optional raw data, such as images, videos, audios and even fonts generated by the models, should automatically inherit the property of the model itself and the original raw data if applicable.

    • Free Artifact is an artifact produced by Free Model, and it must satisfy all the following conditions:

      1. The original raw data, if there is any, used for generating the artifact is FOSS-Licensed & DFSG-compliant;
      2. The source code for creating such artifact is publically available and DFSG-compliant.
    • NonFree Artifact is and artifact produced by ToxicCandy Model or NonFree Model. Artifacts that cannot be categorised into other types should be deemed as NonFree Artifact.

    Je pense que c'est une classification bien plus sensée que la définition de l'OSI qui me semble à côté de la plaque et pas très utile parce qu'elle ne place pas la barre très haute (il suffit d'être "ToxicCandy" pour être "open source" selon cette définition). (je note avec amusement qu'ils ont essayé de partir de la definition de Free software avec les 4 points "use, study, modify, share", plutôt que de l'open source definition avec ses 10 points - probablement parce qu'en vrai, la définition de free software est bien plus simple et fondamentale).

    Me concernant, je pense qu'il ne faut pas mélanger les concepts :

    • l'IA en général, effectivement, ne peut pas être classifiée libre ou pas, comme les mathématiques : c'est un domaine d'étude
    • Une implémentation en particulier peut être libre. Encore faut-il travailler avec des définitions censées
    • Libre ≠ vertueux. Au mieux on pourra éventuellement dire que quand ça s'applique, libre est nécessaire mais non suffisant pour être vertueux. Vertueux rentre dans le domaine du subjectif donc ça ne peut pas être absolu et universel, c'est un point de vue.
    • [^] # Re: Réflexions sur le sujets chez Debian

      Posté par  (site web personnel) . Évalué à -1 (+1/-2).

      Merci beaucoup pour cette référence, je vais regarder ça !

      Il s'agit ici de critères pour le machine learning, qui est pour le coup une technique tout à fait identifiable et sur laquelle on peut effectivement réfléchir en termes de libre/non libre.

      Contrairement à l'"IA" (que je ne qualifierais pas de domaine d'étude, à part peut-être en tant que concept idéologique).

      Et bien sûr, libre≠vertueux.
      En revanche, j'ai tendance à penser que vertueux => libre mais comme tu le dis, ça reste très subjectif ;-)

      • [^] # Re: Réflexions sur le sujets chez Debian

        Posté par  (site web personnel) . Évalué à 7 (+5/-0). Dernière modification le 21 janvier 2025 à 22:52.

        Peut être que pour toi « l'IA » et « le libre » sont des concepts très précis et très clairs. Mais pour nourrir un débat public sur leur compatibilité respective, je pense que ça gagnerait à être explicité et résumé.

        Adhérer à l'April, ça vous tente ?

      • [^] # Re: Réflexions sur le sujets chez Debian

        Posté par  . Évalué à 3 (+1/-0).

        vertueux => libre

        C'est une formulation mathématique de ce que j'ai écrit en toutes lettres :-)

        à part peut-être en tant que concept idéologique

        Pas d'accord. L'IA (on pourra critiquer le terme - mais faire rentrer le intelligence de CIA dans ce terme ou tordre le sens de articiel ne me parait pas très malin), pour moi, c'est un ensemble de techniques, concepts et d'implémentations pour réaliser ou simuler des tâches habituellement intellectuelles (réalisées par un cerveau, plus ou moins analogues à de la pensée, pas purement mécanique sinon n'importe quelle fonction de refactoring dans un éditeur de code serait de l'IA) en s'affranchissant des limitations liées à l'utilisation d'un cerveau "naturel". Ou quelque chose comme ça. Par exemple, des personnages virtuels dans les jeux vidéos, un programme qui joue aux échecs ou au go… Clairement, il ne serait pas opportun de vouloir cesser de parler d'IA et de parler plutôt de LLM : ce serait trop restrictif, les LLMs sont une seule des manières très récente et à la mode de faire de l'IA.

        Pour moi, c'est bien un domaine technique / scientifique. Je ne vois pas de jugement dans cette définition. C'est voulu : on peut détester la chose, mais au moins on la déteste pour ce qu'elle est.

        Et comme quasiment toute technique / tout domaine scientifique, il y a des aspects / répercutions / considération politiques, éthiques, philosophiques, sociales, sociétales, environnementales, …

        C'est vrai par exemple aussi pour la physique nucléaire. C'est des questions très techniques sur le fonctionnement des atomes, mais ça a des répercussions géopolitiques, environnementales, …

        Donc même si c'est "purement" technique, ça ne dispense pas de réfléchir à ce qu'on fait, évidemment. Mais ça me semble important de délimiter les sujets et de travailler avec des définitions claires et de ne pas essayer de tordre les définitions pour les faire coller avec des points de vue (même si les définitions sont rarement (jamais ?) neutre, il faut faire attention).

        On pourra essayer de décrire ce qu'il se passe dans notre société, et constater par exemple que certaines entités cherchent à retirer du contrôle aux gens avec de l'IA et des manifestations concrètes comme les LLM. Je ne sais pas si c'est vrai (je serais plus enclin à dire que l'IA vient actuellement avec un risque de perte de contrôle parce que ses manifestations à la mode sont opaques comme des boites noires et contrôlées par de boites privées toutes puissantes, et qu'elles ont potentiellement un impact environnemental désastreux), mais tu as beaucoup plus de chance de tenir une réflexion claire, et présenter une démonstration claire, compréhensible et convaincante en travaillant avec des définitions simples.

        Décrire les choses simplement et telles qu'elles sont pour mieux les critiquer :-)

        Et d'ailleurs, en faisant ça, on se rend compte qu'on ne peut pas vraiment dire que l'IA est incompatible avec le libre parce qu'on a immédiatement des contres exemples : GNU chess est libre, et d'ailleurs je ne lui vois même pas de problèmes éthiques. C'est bien une IA, mais je ne vois pas le côté perte de contrôle ou renseignement, donc le intelligence de CIA ne s'applique vraiment pas, si le côté "de surface". Et ce c'est pas parce que c'est de l'IA que c'est mal.

        Donc peut être que tu ne critiques pas réellement toute l'IA, mais juste une partie. Mais pas restreinte aux LLM, on peut souhaiter une réflexion plus générique / générale. On pourra aussi critiquer le fait que IA soit actuellement un buzzword.

        Autre questionnement : si VLC utilise whisper, pourquoi ça ne serait pas de l'IA ? Comment definis-tu l'IA ?

        Je pense qu'avec ton journal tu es sur une piste intéressante, mais ça mérite probablement de creuser plus.

        • [^] # Re: Réflexions sur le sujets chez Debian

          Posté par  (site web personnel) . Évalué à 2 (+2/-0).

          C'est une formulation mathématique de ce que j'ai écrit en toutes lettres :-)

          Bah oui je sais :-)

          si VLC utilise whisper, pourquoi ça ne serait pas de l'IA ? Comment definis-tu l'IA ?

          Mon propos est précisément de dire qu'il faut arrêter d'utiliser ce terme fourre-tout d'IA, qui peut désigner un peu tout et n'importe quoi, d'un truc basique comme ELIZA aux trucs d'aujourd'hui en passant par les systèmes experts des années 80.

          Je ne vais donc PAS donner une définition de ce que j'entends par IA parce que PERSONNE N'EN A, et c'est bien ça le problème. On pourrait trouver des contre-exemples assez facilement à ta propre tentative de définition (sauf si on décide de n'appeler IA que les trucs d'aujourd'hui, mais alors, autant les appeler SRAS ce sera moins trompeur).

          J'invite à lire ce que dit Ali Alkhatib à ce propos.

          Or moi, ça me pose un gros problème de définir un domaine d'étude sur un sujet que l'on ne parvient pas bien à définir et qui désigne plus un résultat (ou une absence de connaissances face à un résultat) qu'un ensemble clair de techniques (cf ELIZA). Sauf, comme je le disais, à l'étudier en tant que concept idéologique.

          Car l'IA pour moi, si c'est quelque chose, ce n'est pas une technique. C'est un ensemble d'idées, de croyances, d'envies, une façon de voir le monde (bref, une idéologie) consistant à dire qu'il est possible de remplacer l'intelligence humaine par des machines et qu'il est bon de le faire. Qu'il faut le faire.

          • [^] # Re: Réflexions sur le sujets chez Debian

            Posté par  . Évalué à 2 (+0/-0). Dernière modification le 22 janvier 2025 à 11:14.

            autant les appeler SRAS ce sera moins trompeur

            Non, parce que toutes les IA n'en sont pas. Par exemple GNU Chess, que j'ai fait exprès de citer pour cette raison.

            Je sais que ma définition est incomplète et imparfaite. Mon but n'était pas de donner une définition définitive. L'IA évolue, c'est normal que les définitions soient révisées. C'est normal pour tout domaine qui évolue.

            Plus généralement, hors des mathématiques, c'est normal de n'avoir que des définitions imparfaites à notre disposition. Rien n'est clairement et définitivement défini. Quand on écrit un papier de recherche, on est d'ailleurs obligé·e de dédier une introduction pour présenter un point de vue en particulier du domaine dans lequel le papier s'inscrit, voire une section définition pour cadrer le papier.

            J'invite à lire ce que dit Ali Alkhatib à ce propos.

            Je viens de le faire, ça ressemble à ta présentation dans le journal, et je n'adhère vraiment pas du tout à ce mode de réflexion. Ça ne colle juste pas. Je ne comprends pas de quoi on parle, ce qu'on critique vraiment, etc.

            Je ne vois pas de problème à décrire une idéologie liée à l'IA, ou (puisque c'est ça dont il a l'air de s'agir) même plus généralement à critiquer la pensée libertarienne ou le capitalisme ou le libéralisme, ou d'argumenter sur le fait que certaines manifestations liées à l'IA sont des conséquences ou des symptômes de ces idéologies.

            Par ailleurs, je ne suis pas convaincu du tout que la définition "technique" de l'IA devrait être remplacée par une définition idéologique. L'article n'en donne d'ailleurs pas. C'est ok, c'est peut-être un début de réflexion, mais du coup il manque la pièce centrale pour travailler sur quelque chose de concret. On peut bien sûr définir des bases pour ensuite poser une réflexion bien carrée (d'ailleurs c'est un peu obligatoire), mais je ne repère pas trop ça dans l'article. On n'a pas d'ailleurs besoin d'une définition si on ne s'en sert pas dans une argumentation plus tard.

            Il y a ça dans l'article :

            AI is an ideological project to shift authority and autonomy away from individuals, towards centralized structures of power

            Ça ressemble à une définition mais ça n'en est pas une. C'est une qualification. Et je ne pense pas que ça soit une qualification fidèle, ni même correcte. De tout le mal que je pense de l'IA aujourd'hui, je ne pense pas que l'objectif des gens qui bossent sur l'IA soit de limiter l'autorité ou l'autonomie des individus, ni de pousser vers des structures centralisées de pouvoir. Ça serait peut-être plutôt des conséquences de certaines manifestations de l'IA parce qu'elle vit dans l'idéologie dominante qui a tendance à avoir ces travers. Elles ne sont pas non plus spécifiques à l'IA. Ça peut s'appliquer à chacun des GAFAM, même dans leurs activités non IA, et ce depuis longtemps. Et d'un tas d'autres trucs.

            Mon point de vue :

            • cette qualification sent la théorie du complot. Comme s'il y avait quelques grands acteurs qui se coordonnaient dans l'ombre pour prendre le pouvoir grâce à l'IA. Ça me pose problème pour plusieurs raisons, au moins celles-là :
              • en fait, les grands acteurs de ce monde ont déjà le pouvoir et n'ont pas attendu l'IA pour ça
              • ils ne se coordonnent pas vraiment, ils se font plutôt la compétition
              • ça ne me parait pas être la description la plus simple de ce qu'il se passe (rasoir d'Ockham)
            • l'auteur s'oppose en fait au capitalisme / libertarianisme / libéralisme économique. On dirait qu'il découvre les problèmes de ces idéologies avec l'IA pour une raison que je ne comprends pas. Et il passe complètement à côté d'une analyse plus utile, générale, et actionnable en se concentrant sur l'IA. L'IA vie dans l'idéologie dominante, et donc en montre des symptômes et des problèmes, mais comme beaucoup d'autres trucs.
            • OpenAI et ses copains et leurs modes opératoires sont des artefacts du système économique actuel… qui a une tendance à retirer le pouvoir aux individus et à produire des mégas structures avec des mégas pouvoir. Ça a été vrai depuis des années et l'IA n'est pas un élément nécessaire pour analyser cela. Au mieux, il est intéressant d'analyser ces jeux de pouvoirs à travers les manifestations actuelless de l'IA.
          • [^] # Re: Réflexions sur le sujets chez Debian

            Posté par  . Évalué à 2 (+0/-0). Dernière modification le 22 janvier 2025 à 11:32.

            Mon propos est précisément de dire qu'il faut arrêter d'utiliser ce terme fourre-tout d'IA, qui peut désigner un peu tout et n'importe quoi

            Pour moi, c'est jeter le bébé avec l'eau du bain.

            • Si tu as besoin d'un terme précis pour t'exprimer, il vaut mieux utiliser ce terme. Il existe.
            • Si tu as besoin de l'idée fourre-tout générique, pourquoi ne pas utiliser "IA" ? Je pense que ce besoin existe quand tu n'as pas besoin d'être précis.
            • Il est vrai qu'on sert l'IA à toutes les sauces, en mode bullshit, mais pour moi, c'est ça qu'il faut critiquer.

            qu'il est possible de remplacer l'intelligence humaine par des machines et qu'il est bon de le faire. Qu'il faut le faire.

            Penser qu'un outil peut assister l'humain n'est pas nouveau, et on n'arrête pas de le faire pour absolument tout. Ça a rarement été remis en cause, voire le fonctionnement de notre espèce repose sur ce principe.

            Mais comme tout outil, il peut être mal utilisé, utilisé pour nuire, peux avoir des effets secondaires néfastes, etc. Je sens qu'on touche le cœur du problème : identifier ces occurrences pour mieux les combattre me parait intéressant.

            À mon avis il ne faudrait pas faire de "On ne devrait pas remplacer l'intelligence humaine par un outil" un dogme, ou rejeter l'idée par principe. C'est une impasse, et ça ne convaincra que les personnes déjà convaincues. Cherchons plutôt dans quels cas concrets il ne faut pas le faire, pourquoi il ne faut pas le faire, etc.

            Perso, si on arrive à remplacer mon travail intellectuel par un outil, très bien, ça me libère potentiellement du temps pour m'adonner à des activités potentiellement plus fondamentales ou plaisantes. Encore faut-il une organisation sociétale qui permet ça. Ça malheureusement j'en doute fort, et il faudrait s'attaquer à ça.

  • # L'IA est-elle compatible avec le Libre ?

    Posté par  . Évalué à 2 (+2/-0).

    Il y a des éléments de réflexion intéressante.

    Mais l'IA reste avant tout technique. Malheureusement, il est tout à fait certain que cette technique s'accompagne d'une idéologie dont il faut se débarasser : le transhumanisme.
    Les médias gardent un flou volontaire autour de la notion d'IA. Il est urgent de reprendre les bases populaires de ce qu'est cette technique. Il faut qu'on grandisse tous sur ce qu'on a devant nous avant de l'utiliser ! Personne ne devrait utiliser l'IA sans savoir un minimum quels sont les principes fondamentaux à mon sens.

    Sur Whisper. Si, c'est une IA, si on part du principe qu'une IA est un logiciel qui apprend. Il a bien eu une phase d'apprentissage.
    La solution est libre. Le code pour effectuer l'apprentissage est libre. D'ailleurs, quelques jours/semaines après sa mise en open source, le code a été entièrement réécrit en C++ pour le rendre plus rapide, ce qui a donné whipsercpp. Et un autre code a été écrit plus tard pour donner faster-whisper en se basant sur la technologie CTranslate.
    Le code est donc maitrisé par la communauté du libre.
    Pour ce qui est de l'apprentissage, il est vrai que je ne connais pas grand monde qui ait réentraîné des modèles dans leur coin. Ce coût aurait été inutile puisque les modèles d'openai étaient déjà disponible. Cependant, si cet entraînement à un coup, il reste accessible, moyennant un peu de matériel et des compétences, et du temps. Mais c'est comme toute technologie : le développement de logiciel n'est pas accessible à tous sans matériel. L'IA restreint la communauté et l'accessibilité pour des coûts matériels et des compétences techniques évidentes. Cela se régulera dans le temps, je n'y vois pas un problème.

    Vosk, j'ai voulu l'utiliser. Il y a des choses intéresantes, mais est largement en deça des capacités de Whisper : beaucoup de fautes par rapport à la taille du modèle et sa consommation en ressources, aucune ponctuation. J'ai été obligé de l'abandonner alors que j'y mettais pas mal d'espoir il y a quelques années.

    L'IA n'est pas aussi accessible à la communauté, et c'est naturel. Mais ce n'est pas anti-éthique. Ce qui est anti-éthique, c'est de ne pas former les gens sur ce qu'est l'IA, ses principes de fonctionnement, et sur la moralité des usages.
    Je publierai peut-être une réflexion. Mais il me semble qu'il y a une limite morale sur l'IA sur tout ce qui touche à la génération de contenu : nouvelle réflexion, nouveau texte, nouvelle image, à partir d'un simple prompt. Pour moi, l'acte de créer devrait être proprement humain. La réflexion doit encore faire un bout de chemin ;)

    • [^] # Re: L'IA est-elle compatible avec le Libre ?

      Posté par  . Évalué à 2 (+0/-0).

      Je publierai peut-être une réflexion

      Si tu fais ça, j'ai des questions :

      Pour moi, l'acte de créer devrait être proprement humain

      Qu'est-ce que créer ? Pourquoi le réserver à un humain ?

      En tout cas merci à toi, à Khrys et aux autres dans les commentaires pour les réflexions, c'est intéressant et important.

  • # Un ptit ajout à propos du sous-titrage dans VLC

    Posté par  . Évalué à 0 (+0/-0).

    Journal intéressant !

    Ca soulève plusieurs questionnement…

    Le biais / la neutralité d'une technologie. Son aspect ouvert/open-source/libre. Son utilité par rapport à sa consommation de ressource.

    Pour faire du sous-titrage automatisé en français aujourd'hui, librement utilisable, il y a vosk/kaldi et maintenant Whisper (avec plein de variantes).

    Les deux sont "openweight" dans le sens que les modèles sont libre d'être modifié. Il y a des variantes de Whisper "distillé" pour mieux fonctionner sur le français par exemple. A l'opposé des modèles de Google ou Microsoft dont on ne connaît rien.

    Par contre on ne sait pas comment Whisper a été entraîné, ni sur quel données (bien que l'on se doute qu'OpenAI a scrappé youtube). Pour les modèles Kaldi, on a un peu plus idée sur quelles données ça a été entraîné (pas sur que toute les données soit libre, et que ce soit reproductible néanmoins).

    Concernant les biais, d'un coté Kaldi retranscrit texto le son en phonème puis les phonèmes en mot. De l'autre whisper c'est plus une boite noir qui a été entraîné pour sous-titré des vidéos, donc il va retranscrire les onomatopé, il va sauter certains mots qui ne se disent qu'à l'oral mais pas à l'écrit, voir parfois halluciner et faire n'importe quoi (afficher du texte entre crochet aux moments des silence).

    A la fin, Whisper transcrit mieux que kaldi, en échange d'un puissance de calcul décuplé (kaldi peux tourner sur une rasperry pi en direct, les modèles "normaux" de whisper il vaut mieux une carte graphique récente pour transcrire en direct).

    Du coup, mitigé à propos du sous-titrage dans VLC, à la fois je suis ravi que tout un chacun puisse profiter de cette technologie qui fonctionne agréablement bien. Mais n'aurait il pas fallu attendre qu'un vrai modèle libre de Speech-to-text moderne voie le jour ?

Envoyer un commentaire

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.