Misc a écrit 6371 commentaires

  • [^] # Re: une liste des films

    Posté par  (site web personnel) . En réponse au journal Alison Bechdel sur France culture. Évalué à 4 (+1/-0).

    En fait, le souci n'est pas de dire que Brokeback Mountain n'est pas un film féministe, car c'est clairement pas son but.

    C'est de supposer que ce qui n'est pas féministe serait forcément mauvais car non féministe.

    Des tests comme ça, y en a des tonnes. Par exemple, je peux citer le test de Vito Russo pour rester sur les représentations LGBT, mais Wikidata en liste des dizaines.

  • [^] # Re: Je contre

    Posté par  (site web personnel) . En réponse au journal Alison Bechdel sur France culture. Évalué à 4 (+1/-0).

    Donc avec ce test, les monologues du vagin serait mal écrit (car bon, si il y a qu'une personne, ça loupe la première étape) ? Ou Flow (vu que les personnages ne parlent pas, et ne sont pas genré) ?

    Je pense qu'il faut quand même nuancé un peu l'usage des tests avec le contexte.

  • # Un article LWN sur le sujet

    Posté par  (site web personnel) . En réponse au lien Apparently chardet got Claude to rewrite the entire codebase from LGPL to MIT?. Évalué à 3 (+0/-0).

  • # Un lien de SFC

    Posté par  (site web personnel) . En réponse au lien les œuvres qui ne sont pas générées par un humain ne sont pas sujettes au copyright états-unien. Évalué à 3 (+0/-0).

  • # C'est fou

    Posté par  (site web personnel) . En réponse au lien Les traductions par LLM rajoutent des hallucinations à Wikipédia. Évalué à 6 (+3/-0).

    Même les trolls, les faux nez et les pénibles se font remplacer par l'IA.

  • [^] # Re: L'auteur originel

    Posté par  (site web personnel) . En réponse au lien Apparently chardet got Claude to rewrite the entire codebase from LGPL to MIT?. Évalué à 4 (+2/-1).

    Utiliser un LLM pour faire une réimplémentation clean room d'un code qui a été publié sur internet, ça me parait délicat. Pour moi, ce n'est pas possible. Ce n'est pas 100% clean.

    C'est délicat, mais tu as juste besoin de convaincre le juge et/ou un jury, mais ça va dans les 2 sens.

    Le souci, c'est que même si ça te semble être impossible de faire du 100%, il faut le prouver. Par exemple, trouver un exemple de code qui soit une copie suffisamment similaire, suffisamment substantielle (pour éviter de tomber dans un cas trivial), et dans ce cas précis, du code qui ne soit pas du code écrit par le mainteneur (vu que le gars qui a réécrit est aussi celui qui maintient le code depuis 12 ans). C'est chaud quand même.

    Et faut faire ça avant d'arriver devant un jury, parce que seul la personne lésée peut porter plainte.

    Et ensuite se pose la question de savoir si quelqu'un veut vraiment jouer le rôle d'Oracle dans "Google contre Oracle".

    Le mainteneur indique que son but, c'est de pousser chardet dans Python, ce qui me semble quand même un but louable, et que la LGPL bloque ça.

    Bien sur, ce qui va arriver en pratique, c'est que tout le monde va venir donner son avis sur Github, que le mainteneur va sans doute claquer la porte (car j'imagine qu'il y tot ou tard des gens qui vont aller plus loin que "tu aurais du démissionner") et on aura gagné d'avoir un mainteneur bénévole de moins sur un truc utilisé par pas mal de gens.

    Un plan sans accroc, et encore une victoire du logiciel libre.

  • [^] # Re: Pourquoi ?

    Posté par  (site web personnel) . En réponse au lien Apparently chardet got Claude to rewrite the entire codebase from LGPL to MIT?. Évalué à 3 (+0/-0).

    Potentiellement pour pouvoir l'envoyer upstream dans Python, cf le bug posté plus haut (car la LGPL aurait sans doute rendu ça problématique).

  • # Alors...

    Posté par  (site web personnel) . En réponse au lien les œuvres qui ne sont pas générées par un humain ne sont pas sujettes au copyright états-unien. Évalué à 10 (+14/-0).

    Le titre est correct, mais il faut comprendre les détails.

    Le cas en question est passé par tout l'appareil judiciaire. Le plaignant, Dr Thaler a tenté de déposer une image au Copyright Office, une administration américaine qui dépend du Congrès qui a refusé. Il a donc porté plainte, un-e juge a dit "le Copyright office a raison", il a fait appel devant la cour d'appel du circuit fédéral (vu que Washington D.C ou se trouve le copyright office dépend de ce circuit d'appel), qui a dit que "le Copyright Office a raison". Puis il a fait une demande à la Cour Suprême (petition for certiorari, ou cert petition) qui peut choisir ou pas de regarder le cas suivant sa liste de cas (docket), et qui a décidé de ne pas regarder.

    Stephen Thaler n'est pas à son coup d'essai. Il a tenté d'enregistrer un brevet entièrement généré par une machine (pas "assisté par une machine", il a vraiment voulu listé le programme qu'il a écrit sur la paperasse), dans l'affaire Thaler v. Vidal en 2022. Le Patent and Trademark Office (le PTO, un peu l'équivalent de l'INPI) a dit non, et pareil, ça a fait tout le chemin.

    Il a aussi tenté de faire ça au Royaume Uni, avec le même résultat, et en Inde, en Allemagne et sans doute ailleurs (j'ai cru voir la suisse et le japon, mais bon, je vais pas tiré la pelote entière).

    La, il a tenté pareil avec une image, et pas de dire "j'ai fait ça avec l'IA, mais l'IA a fait ça sans moi de façon autonome". Pourquoi, je ne sais pas, mais il y a que le Royaume Uni ou ça pourrait passer, vu que le dit pays a un régime qui permet à une personnalité juridique d'obtenir divers droits en matière de brevets ou de copyrights, ouvrant la porte à ce que Thaler semble vouloir.

    Il faut bien voir que c'est le cas ou un humain insiste pour dire qu'il a rien fait. Un humain qui va dire avoir fait quelque chose va avoir plus de chances d'obtenir gain de cause. Par exemple, c'est arrivé en Chine et aux USA sous certaines conditions. Il y a un débat assez large dans les milieux académiques, avec des gens qui pondent des pâtés immenses sur le sujet (genre 3 à 4 fois la taille d'un article académique standard).

    Et il faut bien voir qu'en application de la convention de 1886 de Berne (que les USA appliquent depuis 1988, je crois), la protection est normalement automatique sans passer devant le Copyright Office (ou son équivalent). Le principal avantage d'un enregistrement devant le CO, c'est pour obtenir des dommages et intérêts forfaitaires au lieu de devoir évaluer le préjudice finement. En d'autre termes, si je me fait attaquer pour une violation de copyright (genre un album de musique), si la partie plaignante a déposé l’œuvre devant le CO, le juge va dire "ok, on file entre 750 et 30 000$ par œuvre"
    (la question de savoir ce qui compte exactement comme œuvre, "works" dans le texte de la loi, dépend du cadrage (framing), et ça aussi, c'est compliqué ). Sans ça, la partie plaignante va devoir dire "bah, on a perdu sans doute le prix de la chanson sur Itunes", et c'est moins que 750$.

    Mais le dépôt, ça coûte de l'argent, donc les libristes ne le font pas que je sache (en plus du probléme des œuvres composites ou équivalent en droit US, etc, etc).

    Et même si la, le cas était prévu pour (je pense) pousser la jurisprudence, ça pose des vraies questions.

    Par exemple, si je filme un jeu vidéo, qui a les droits ? En Afrique du Sud, un jeu vidéo compte comme… un film donc sans doute la boite qui produit le jeu (alors que les programmes sont dans une catégorie à part par elle même (sui generis, pour briller dans les cocktail mondians du PMU) en droit sud africain). Mais on pourrait aussi argumenter qu'un jeu vidéo, c'est l'équivalent d'un programme comme Photoshop, et que c'est la personne qui dirige le personnage qui va avoir les droits, surtout que Paint.exe et Photosophop, c'est pareil, et mettre Mario sur Paint dans Mario Paint, ça reste Paint.

    Mais quid d'un jeu autonome sans intervention humaine, voir même pas un jeu ? Quid d'un jeu multijoueur ?

    C'est compliqué, et pour en revenir sur le cas en question, je pense que le fait d'utiliser une IA, pour peu qu'on puisse démontrer un minimum d'intervention humaine, n'est sans doute pas disqualifiant pour bénéficier d'une protection, au contraire d'insister pour mettre un programme comme auteur exclusif, ce que pas grand monde fait en pratique.

    Un autre truc a rappeler, c'est que les décisions US ne s'appliquent que la bas. Si j’obtiens le copyright sur un truc dans un pays, par la magie des textes internationaux, il est valable ailleurs sans avoir besoin de faire la moindre chose. C'est la théorie, la pratique a sans doute des subtilités. Par exemple, je sais pas encore par quel mécanisme des choses peuvent être dans le domaine publique dans un pays et pas dans l'autre, mais je pense que c'est des restes d'une époque ou il n'y avait pas d'accord international applicable, sans compter que les courts peuvent aussi prendre des latitudes sur des textes pour divers raisons (voir que la loi peut changer).

    En pratique bien sur, c'est pas la loi qui compte mais ce que les gens pensent que la loi dit, et j'imagine que la, tout le monde va oublier les détails et que les USA sont un pays, pas le monde entier.

  • [^] # Re: On n'est jamais mieux servi que par soi même

    Posté par  (site web personnel) . En réponse au lien Une ex-lobbyiste de Meta en charge du droit du numérique européen. Évalué à 6 (+3/-0).

    Ou juste supposer que lobbyiste, c'est un job, tout comme fonctionnaire européen.

    Je sais pas exactement comment font certaines font pour réconcilier l'idée que d'un coté, les avocats n'auraient aucun scrupule et seraient juste des mercenaires, et que de l'autre, les mêmes avocats seraient totalement dévoués corps et âme à la cause d'un employeur même après leur départ, et comme par par hasard quand ça tombe sur une boite qu'on aime pas.

    C'est en fait un peu déshumanisant de projeter des modes de pensées sur les autres qui reflètent une vision manichéenne du monde.

  • # L'inspiration

    Posté par  (site web personnel) . En réponse au lien MALUS - Thank You for Your Service: On the Obsolescence of Open Source. Évalué à 6 (+3/-0). Dernière modification le 02 mars 2026 à 17:15.

  • [^] # Re: Fake

    Posté par  (site web personnel) . En réponse au lien MALUS - Thank You for Your Service: On the Obsolescence of Open Source. Évalué à 6 (+3/-0).

    Quoi, le post de blog qui dit en bas qu'il est inspiré d'un talk du FOSDEM serait une parodie :p ?

  • [^] # Re: Transfert entre particuliers

    Posté par  (site web personnel) . En réponse au journal Transactions financières, secteur associatif, et vie privée. Évalué à 10 (+7/-0).

    Je ne sais pas qui tu es, mais tant que tu n'as pas été lésé tu ne peux pas faire de procès

    Alors dans un cas normal, sans doute.

    Mais pas ici, et je vais le montrer en musique.

    Tu parles de "trucs médicaux comme les allergies", ce sont des données de santé, donc ça tomberais sous le coup de l'article 9 du RGPD. Je rappelle que pour la CJUE, il faut interpréter l'article 9 de façon large (cf l'affaire Lindenapotheke, partie iii.2). La légalité du traitement est donc déterminé par les cas d'exceptions du paragraphe 2. À vue de nez, il y a soit le a) "consentement explicite" ou le d) "groupe politique/religieuse/syndicale pour la gestion de ses membres". Le reste s'applique pas.

    Tu parles de sport, donc je suppose que l'exception "d" est out, sauf si ton club de sport est un club de danse pour derviches tourneurs, car ça rentrerais dans "association religieuse". Mais même la, ça ne veut pas dire que tu peux traiter n'importe quoi.

    Donc il ne resterait que l'exception "a", à savoir s'assurer que le consentement est explicite, et de ce que tu dis, ça n'a pas l'air d'être le cas (et tu as raison de leur dire).

    Il y a peut être des trucs dans le code du sport, mais je pense pas.

    Mais bon, tout ça, ça ne marche que si quelqu'un se plaint, et en effet, il faut être impacté pour se plaindre sous le régime du RGPD, et sans m'inscrire, j'ai pas de qualité à agir.

    Tu mentionnes qu'il faut passer par une assoce comme Anticor. Anticor ne peux pas faire grand chose, son agrément ne lui donne le droit d'ester en justice sur des histoires de corruption, et ça s'applique pas à ce que tu dis.

    Il y a bien les actions de groupe, mais la seule assoce que je connais est NOYB et c'est une assoce de droit autrichien, c'est sans doute compliqué.

    Mais…

    (changement de musique)

    Le droit français a une surprise en plus du RGPD, c'est l'article 226-19 du code pénal, l'interdiction de faire des listes basées sur les données sensibles, et ça comprends les données de santé.

    Pour ce délit, une association peut se porter partie civile aux conditions décrites dans les articles du code de procédure pénal 2-1 (226-19 est explicitement mentionné) ou 2-17 (226-19 est dans le range 226-1 à 226-23), ou L1225-3.

    Mousse, citée plus haut, ne rentre pas précisément dans le cadre de l'article 2-1, ni celui de L1225-3 (assez curieusement), mais pourrait peut être via le 2-17, et de toute façon, ne s'occupe pas des trucs de santé, donc ne ferait rien en pratique, car pas le temps. Des assoces comme Amnesty International pourraient plus facilement tomber dans les 3 articles, mais pareil, n'ont sans doute pas que ça à faire.

    Donc c'est sans doute aussi mort.

    Sauf que …. en dehors de ces 2 cas (association adéquate, ou être personnellement lésé), il reste une 3eme possibilité !

    (changement de musique)

    Car quand j'ai dit que Mousse ne rentre pas dans le cadre du 2-1, du 2-17 ou du L1225-3, c'est parce que j'ai regardé. Et j'ai regardé parce que Mousse a porté plainte spécifiquement contre la SG sur la base de l'article 226-19, sans que je comprenne pourquoi. Et j'ai fini par trouver.

    Car l'article 226-19 du code pénal, il est… dans le code pénal.

    Et comme tout ce qui est dans le code pénal, un particulier peut faire un signalement au Procureur de la République au titre de l'article 40 du code de procédure pénal.

    Donc pas besoin d'être lésé ou d'être une assoce, il faut juste ressortir les vielles enveloppes jaunies du grenier, rayer l'adresse préremplie de la Kommandantur, mettre celle du Procureur, et paf, une bonne dénonciation des familles.

    Et sauf erreur de ma part, ce dernier a obligation de répondre sous (je crois) 3 mois. Ou 6 semaines. Enfin, il y a une obligation de faire quelque chose.

    Bien sur, en pratique, la réponse du procureur, ça peut être "non". En fait, ça va sans doute être "lol non, on a pas le temps", ou "on a fait suivre à la CNIL" qui va s'en foutre mettre le dossier sur la pile "à regarder après 2035".

    Il y a sans doute aucun risque d'aller devant un tribunal en pratique.

    Mais ça, tu es pas obligé de le dire si tu veux convaincre les gens de respecter la loi.

    Et j'ai regardé, le délai de prescription est de 6 ans) car c'est un délit, et ça commence à courir à la disparition du fichier car c'est un délit continu d'après un arrêt de la Cour de Cassation de 1997.

    Je ne sais pas qui tu es

    Comme tu peux le voir, clairement quelqu'un avec aucune vie, un sens de l'humour douteux et beaucoup trop de temps libre :(

  • [^] # Re: Commentaire sur HN

    Posté par  (site web personnel) . En réponse au lien Dette cognitive : quand l'IA ne permet pas de comprendre intimement le code produit. Évalué à 3 (+0/-0).

    Et même la, il n'y a pas tout.

    D'une part, l'intro le dit "This list of prompts is not 100% comprehensive"

    D'autre part, y a des prompts qui parlent de fichier de log (004a.md) ou de captures d'écrans (004.md) qui ne sont pas dans le dépôt.

    Et il y a des fonctionnalités qui sont apparus de nulle part, genre le geyser mentionnait dans les prompts.

    Ceci dit, ça ressemble plus à des trucs qui iraient dans un système de suivi de bug, ou dans la discussion autour d'une PR/MR.

    Mais j'ai peur que demander à une IA de se taper Jira soit le chemin le plus rapide vers Skynet.

  • [^] # Re: J'ai eu un problème similaire avec le Frido (livre de math)

    Posté par  (site web personnel) . En réponse au journal Recrudescence de contributions générées par IA. Évalué à 6 (+4/-1).

    ils cachent toujours des informations importantes pour conclure, comme par hasard…

    Alors, pour avoir été dans des réunions sur le sujet avec un client et ses fournisseurs, c'est aussi parce que c'est complexe.

    Je vais prendre l'exemple de l'usage de l'eau. Je gère un cluster Openshift de quelques noeuds sur AWS. À l'époque, pour éviter d'être en panne comme tout le monde, j'ai pas pris un déploiement sur la zone us-east-1 (Virginie), mais j'ai choisi de mettre tout sur us-west-2 qui est en Oregon (c'était aussi un peu moins cher).

    Le DC est sur OSM, et en cherchant des articles pour préparer les dites réunions que j'ai cité, je suis tombé sur une enquête dans Rolling Stone qui parle exactement du DC. L'url cite Amazon, le chapeau cite Amazon, le titre parle des datacenters.

    Mais quand on lit l'article, on voit que le souci vient pas de l'usage de l'eau en tant que tel, mais du fait que l'évaporation augmente le niveau de nitrates dans l'eau qui n'est pas évaporé, que le niveau de nitrate est haut à cause des installations agricoles, que l'eau n'est pas correctement recyclé et tout un tas de magouille entre les entrepreneurs locaux et les pouvoirs politiques. Y a de tout, des intimidations par les entrepreneurs locaux, du népotisme, de l'insider trading, etc. Notablement, les habitants ont essayés de retarder l'intervention des autorités de l'Oregon et de l'état fédéral.

    Je vais pas dire que Amazon est 100% innocent, mais si tu peux pas faire confiance à l'état pour faire son taf et à aux partenaires industrielles (en l'occurrence Windwave/Inland), et que c'est la volonté clairement exprimé des habitants (70% de vote pour les républicains en 2020, 72M en 2024) ç'est quand même un challenge.

    Et aucune publication de données ne va changer ça.

    On peut prendre un autre exemple, le Chili. Il y a eu un documentaire sur Arte sur le sujet (avec un peu d'imprécision parce que y a quand même plus de DC au Brésil qu'au Chili), et des articles dans la presse sur la construction d'un DC par Google. Le cas est allé devant la justice, qui a bloqué le projet.

    Je parle pas suffisamment espagnol pour tout comprendre mais de la page 60 à 69, ça parle du fait que l'évaluation par les autorités était foireuse.

    Quand on regarde la presse, il est assez rarement fait mention d'une part de la constitution de 1980 qui a permis ça, un héritage de la dictature de Pinochet. Et on parle rarement du fait que le gouvernement pousse à avoir des datacenters, ni qui est au pouvoir à ce moment. Par exemple, Google a déposé une demande en juillet 2019, et eu son permis en février 2020, le président en fonction à l'époque était le fondateur du RN (pour Rénovation National, un parti de droite. Il y a eu une alternance, mais le prochain président est littéralement fils d'un nazi et d’extrême droite.

    Encore une fois, c'est assez difficile d'argumenter que les électeurs n'ont pas fait le choix explicite de ce qui va arriver, parce que 58% de vote pour Kast, c'est assez confortable (même si Santiago semble voter plus à gauche que le reste du pays).

    Et personne dans la presse n'a fait mention du DC de Microsoft à coté, alors que ça aurait pu aussi être une cible médiatique. Et personne ne connaît les noms des autres boites comme Ascenty, Cirion, Sonda, donc je suppose que personne ne va en parler.

    Je dit pas que tout les DCs consomment autant de flotte, mais quand on regarde la carte, le déroulement de l'affaire et le contexte, c'est pas plus d'info qui va changer grand chose si les autorités ne font pas leur travail.

    À chaque fois, on peut quand même relier ça à une volonté politique qui aboutit à la dérégulation et moins de contrôle.

    Savoir combien d'eau est utilisé, ça sert à pas grand chose si tu sais pas d’où vient l'eau, ou va l'eau, et à quoi sert le DC, et dans quels conditions.

    Sur le papier, le DC en Oregon réutilise de l'eau agricole, et l'eau est recyclé pour arroser encore des plantes après, c'est au bord d'une rivière. En théorie, tu es censé avoir des autorités indépendantes qui vérifient la pollution.

    Mais malgré tout ça qui semble correct sur le papier, c'était la catastrophe. La publication d'info au niveau du DC n'aurait rien changé à ce niveau, et les solutions comme avoir une gouvernance non corrompu n'implique pas de publier des tas de données, mais surtout d'avoir des autorités qui font leur taf.

    Et ça, c'est sans parler des sujets qui fâchent comme le chômage, etc. Les DCs autour de Paris sont pas mal en Seine St Denis qui aussi un des départements les plus pauvres de France.

    C'est comme les émissions de carbone, on peut balancer les chiffres d'une industrie, mais ça donne pas d'info utile pris de façon isolé, et on peut pas faire confiance à son intuition (exemple, les liseuses).

  • [^] # Re: Transfert entre particuliers

    Posté par  (site web personnel) . En réponse au journal Transactions financières, secteur associatif, et vie privée. Évalué à 4 (+1/-0).

    le RGPD les gens s'en cognent comme l'an 40

    N'hésite pas à filer le nom de l'asso, on peut sans aucun souci s'arranger pour leur faire un procès pour non respect du principe de minimisation comme c'est arrivé à la SNCF :p .

  • [^] # Re: SPSPL

    Posté par  (site web personnel) . En réponse au journal Projet qui vient de sortir. Évalué à 5 (+2/-0).

    Je pense que l'AGPL ne changera rien sur ce genre de logiciel pour les entreprises.

    Oui, l'histoire de l'AGPL comme repoussoir des hyperscalers, c'est un peu de la propagande du à Google, et tout le monde suit sans trop réfléchir.

    En pratique, je ne pense pas qu'on puisse dire qu'il y a plus de souci avec l'AGPL ou la GPL surtout si tu ne modifies rien (comme la majorité des gens en pratique), et les contentieux en France sur le logiciel libre sont quand même rare (4 ou 5 depuis l'existence de la GPL si je me souviens bien, donc ça fait grosso modo 1 tout les 10 ans en moyenne même si en pratique, c'est plus sur les 20 dernières années que les 20 premières).

  • [^] # Re: SPSPL

    Posté par  (site web personnel) . En réponse au journal Projet qui vient de sortir. Évalué à 4 (+1/-0).

    Certains "gros" que je connais voudraient l'utiliser sans aucune contre partie.

    Je sais pas de qui tu parles, mais les gros en question dont on parle en général dans le contexte de la SSPL ont déjà ce genre de service. Par exemple, AWS a 2 services de VPN intégré avec IAM, Azure a un produit Azure VPN Gateway, GCP propose Cloud VPN. Donc je doute fort que ces gros la se préoccupent de ton logiciel, et j'ai toujours trouvé cet argument pour la SSPL comme assez proche d'une illusion de grandeur de la part des créateurs de logiciels (je suppose que ça va avec la création d'entreprise).

    Et la SSPL pose aussi des tas de soucis. Il y a les questions de confusions dont je parle dans un billet (enfin la, c'est pour la BSL), mais aussi des trucs tout cons, comme ne pas pouvoir utiliser les services pour les projets libres (exemple, Open Collective, ou divers outils intégrés dans Github), et surtout devoir appliquer le CRA en entier comme un projet proprio et pas les trucs simplifiés des articles 24/25 comme les logiciels libres. C'est loin d'être négligeable à mon avis.

  • [^] # Re: Qui veut de l'IA, qui n'en veut pas

    Posté par  (site web personnel) . En réponse au lien The Generative AI Policy Landscape in Open Source. Évalué à 4 (+1/-0).

    Bon, y a la liste des documents sur le tableau à la fin (et je l'avais vu), mais du coup, on voit que ça mélange quand même pas mal de type de document différents. Pour musl, il y a un debut de discussion sur une mailling list, pour l'Open Source Foundation, c'est une page web dans le contexte de la création d'une définition d'une "IA opensource".

    Et pour certains, je pense en effet que le classement est discutable. De plus, grouper "ethique" sous une seule étiquette (badum tss) ne précise pas spécialement ce qu'on mets dedans.

    Par exemple, la question de l'annotation des données est noté dans le document de Gotosocial, mais pas les questions environnementales.

    À contrario, les questions d'éthiques dans la discussion pour le projet Gnome Loupe ne parle pas de ces questions d'exploitations, et d'ailleurs n'indique pas ça dans le document qui sert de reférence. Malgré ça, c'est listé comme "high".

    Donc bon, y a clairement une bonne part de pifomètre à ce niveau, et on peut quand même classifier ça en 3 groupes parmi les groupes listant l'éthique en "High":

    • les groupes qui sont pas la pour produire du code avant tout (EFF, OSI, SFC), ou qui produisent du code, mais qui font pas mal de plaidoyer (FSF, Wikimedia, Mozilla Foundation)

    • les groupes qui produisent du code, mais en petit groupe, et qui pour divers raisons, veulent apparaître vertueux (Gotosocial, Loupe)

    • Et Gentoo.

    Du coup, j'ai été voir la discussion, et sans surprise, la partie sur l'éthique fait un peu polémique, comme on le voit ici sur le manque de condamnation de la Russie en 2022, ici sur le coté épineux du sujet, ici sur la question des ressources dans le contexte de Gentoo. Mais clairement, ça semble rentrer dans la catégorie "les gens ont un avis, mais pas assez d'avis pour le retirer", vu que la majeur partie de la discussion, c'est surtout sur "ça va donner du taf pour revoir le travail, et pis, y a des questions de copyright".

    Donc dire que c'est "high" me semble pas dire grand chose sur la communauté à part "quelqu'un l'a mis dans le document et basta".

  • [^] # Re: Qui veut de l'IA, qui n'en veut pas

    Posté par  (site web personnel) . En réponse au lien The Generative AI Policy Landscape in Open Source. Évalué à 4 (+1/-0).

    Je trouve la classification intéressante, mais c'est superficielle et ça juge quand même un peu. Le manque de lien vers les documents en question, la non prise en compte des discussions, et aucune analyse temporel ou d'héritage entre les documents fait qu'on va astreindre des valeurs à un groupe de gens la ou il y a sans doute autre chose.

    Par exemple, si la communauté A reprends le document de la communauté B tel quel par facilité, par manque de familiarité, ou à cause d'une perception erroné des impacts légaux, le document peut mettre en avant des choses à un niveau qui ne corresponds pas à ce que la communauté pense.

    De la même façon, une communauté peut avoir un document qui indique que les raisons éthiques sont hautes sans que ça soit vraiment partagé, parce que la majorité s'en fout.

    Je pense qu'au mieux, ça donne juste une idée de ce qu'une partie de la communauté pense être l'argument qui va convaincre les autres, ou les arguments qui ont le plus été mis en avant à un moment donnée, voir simplement les plus facile à démontrer. C'est pas comme si les questions d'éthiques étaient trivial, tout comme les questions de copyright (alors que l'idée d'avoir du code de qualité reste quelque chose de consensuel dans le milieu du libre).

    Au passage, une autre liste sur les IA génératives se trouvent dans ce dépôt, je vais ouvrir un bug pour dire de mettre en lien vers celui que tu as donné.

  • [^] # Re: Un article bien creux

    Posté par  (site web personnel) . En réponse au lien L’IA est conçue pour terminer le travail, pas pour le commencer. Évalué à 3 (+0/-0).

    ah oui, c'est p.6 en fait de l'étude académique

    Ouais, il y a le numéro de page du document (en bas, le 6), le numéro de page dans le lecteur de pdf (ici, 8) et le fait que ça soit la 10eme page sur 58 dans le document.

  • [^] # Re: Un article bien creux

    Posté par  (site web personnel) . En réponse au lien L’IA est conçue pour terminer le travail, pas pour le commencer. Évalué à 9 (+6/-0).

    Mais même l'étude sur le site de BCG est trop simplifié pour juger, il faut aller chercher le papier académique.

    Et il y a quelques soucis dans l'étude. Pour commencer, page 8, "on a filé un bonus pour s'assurer que tout le monde termine comme il faut, avec un bonus en plus pour les plus rapides et plus efficace". Ça, c'est déjà quand même un souci pour moi.

    L'étude se consacre sur la rapidité à faire une tache spécifique, mais quand on voit que l'usage classique d'un consultant de BCG, c'est soit de servir de fusible, soit de faire des réunions, je pense qu'il faut aussi pondérer la productivité totale avec le pourcentage de rapport à faire. L'étude semble aussi dire (page 9) que l'étude ne fait pas confiance à des métriques auto annoncés, mais c'est ce qui a été utilisé pour choisir l'échantillon, et ça me semble un probléme.

    Et je pense qu'il faut aussi garder la figure 7 en tête, celle qui mentionne que les consultants font des taches plus vite, mais moins corrects. Le temps passé pour corriger n'est pas pris en compte, ce qui me semble un probléme méthodologique sur l'évaluation de la productivité, et ceci sans présumer du fait que ça fasse ou pas gagner du temps (car bon, si tu mets 50 minutes + 5, 10 ou 15 minutes de correction, ça change beaucoup).

    Donc bon, c'est une étude de 2023, utilisé dans un article de 2026 avec des soucis, c'est bof.

  • [^] # Re: ensemble

    Posté par  (site web personnel) . En réponse au journal Les "fachos", fascistes, nazis et autres intolérants sont-ils tolérés sur linuxfr.org ?. Évalué à 4 (+1/-0).

    En effet, je pensais pas qu'avec mes presque 14 000 points de karma, j’étais dans le 1.6% des plus riches en karma du coin.

    Mais ça ne fait qu'un gain moyen de 2 points de karma par commentaire, j'ai pas le sentiment que ça soit un exploit vu la longévité moyenne des comptes.

  • # Un article bien creux

    Posté par  (site web personnel) . En réponse au lien L’IA est conçue pour terminer le travail, pas pour le commencer. Évalué à 8 (+5/-0).

    L'analyse me semble quand même assez foireuse, parce que quand on dit "l'IA générative", c'est assez rarement détaillé. Vu qu'on mets de l'IA partout, je pense que c'est quand même important de savoir de quoi on parle.

  • # Un résumé des différentes politiques sur le sujet

    Posté par  (site web personnel) . En réponse au lien postmarketOS interdit toute contribution contenant du code généré par LLM. Évalué à 4 (+1/-0).

    Certains de mes collègues qui travaillent avec le projet Chaoss m'ont pointé vers ce dépôt, ce qui permet de centraliser les liens vers les textes:

    https://github.com/chaoss/wg-ai-alignment

  • [^] # Re: ensemble

    Posté par  (site web personnel) . En réponse au journal Les "fachos", fascistes, nazis et autres intolérants sont-ils tolérés sur linuxfr.org ?. Évalué à 4 (+1/-0).

    C'est une bonne remarque, je sais pas si on un graph du karma moyen.

    Ensuite, j'ai aussi en tête la chute du karma de papap depuis 2020, et comment le système immunitaire de Linuxfr a réagi in situ.

    Le compte a été fermé, je ne sais ni quand (après juillet 2024), ni par qui, mais on a encore les traces de tout les commentaires à moins plein de points sur des mois, voir des années.