arnaudus a écrit 5402 commentaires

  • [^] # Re: Je me demande

    Posté par  . En réponse au journal npm et badaboum. Évalué à 3 (+0/-0).

    Peut-être que tu as eu de la chance d'avoir eu la bonne réponse, mais faut se méfier quand même

    Qui a prétendu qu'il fallait avaler les sorties de ChatGPT comme de l'eau bénite?

    Est-ce que tu ne te méfies pas quand tu trouves une réponse toute faite dans un forum?

    Et donc il y a des chances que l'IA te propose un dépannage complètement à coté de la plaque

    Tu évoques une sorte de risque théorique, qui est réel, mais qui ressemble à une sorte de fantasme bien éloigné des capacités des LLM modernes. Est-ce que chatGPT peut en théorie se mélanger les pinceaux entre les codes d'erreur des sèche-linge Bosch et des lave-linge Brandt? En théorie, oui, bien sûr, le fonctionnement d'un LLM ne peut pas te garantir que c'est impossible. Mais en pratique? Quelle est la chance que ça arrive? 1%? 0.1%? 0.0001%? C'est ça le problème, c'est ça d'écouter des prophètes débiles qui racontent n'importe quoi à longueur de journée, on devient un pédant théorique qui pense que tout ce qui sort d'un LLM est une hallucination potentielle, et on se repâit de quelques prompts bien travaillés qui poussent les modèles aux limites de leurs possibilités. Mais en réalité, ces trucs marchent. C'est une réalité qui ne plait pas à tout le monde, mais c'est comme ça, ça marche.

    Donc voici un cas concret : je dis à chatGPT "J'ai un code E17 sur mon lave linge", il me répond: "Le code erreur E17 sur un lave-linge (selon la majorité des modèles de Bosch / Siemens et d’autres marques du même groupe) signifie généralement : ⚠️ Problème d’arrivée d’eau (l’appareil ne parvient pas à se remplir dans le délai prévu) // Si tu veux, je peux te dire précisément ce que signifie E17 pour ton modèle exact (car cela varie légèrement selon les marques) — veux-tu me donner la marque et le modèle de ton lave-linge ?"

    On peut raconter ce qu'on veut avec des exemples "à peine exagérés". Oui, les LLM peuvent faire des erreurs, oui ils sont limités par la qualité de leurs données d'entrainement, oui tu peux facilement mettre en défaut un LLM dans un domaine où tu es spécialiste, mais 1) le niveau des réponses reste globalement satisfaisant dans un très grand éventail de cas, 2) je ne vois pas l'intérêt de passer sa vie à essayer de mettre en défaut les LLM, puisqu'à moins d'être payé pour les améliorer ça ne fait que confirmer ce que tout le monde sait déja, 3) il est assez évident qu'il est peu utile de demander quelque chose à un LLM quand on a déja trouvé un document adapté—par exemple les instructions du constructeur pour démonter une pièce, et encore plus si on a raison de penser que ce document est meilleur que les données d'entrainement du LLM.

    De toutes manières, comme tu en fais toi-même le constat, les LLM donnent maintenant la plupart du temps des réponses meilleures que le reste des documents déja faits qu'on peut trouver sur Internet. Autrement dit, il devient difficile de remplacer un LLM par une recherche approfondie. Tu peux penser qu'il s'est passé quelque chose et que le web est maintenant vide, mais je crois que c'est faux, les informations de qualité ont toujours été rares. Pour la réparation d'appareils, typiquement, la notice officielle ne mentionne que des cas débiles, genre "la lumière ne fonctionne plus -> remplacer l'ampoule", "l'appareil ne s'allume pas -> vérifier qu'il est bien branché", "l'appareil est branché et ne s'allume pas -> contacter le service après-vente". C'est ça, l'information qu'on a toujours eu, de la m***. Pour obtenir les données techniques, il fallait contacter le fabriquant et espérer sa bonne volonté, ou bien payer pour accéder aux protocoles de réparation destinés aux professionnels. Bref, je ne crois pas du tout au monde idyllique d'avant les LLM où il était facile de trouver des informations de qualité sur n'importe quel sujet, je crois que c'est un monde fantasmé.

    (dans tous les cas, ça ne change pas que de remplir le web avec des sorties de LLM c'est débilissime, c'est aussi con que de remplir des pages automatiquement avec le résultat de requêtes Google).

  • [^] # Re: Je me demande

    Posté par  . En réponse au journal npm et badaboum. Évalué à 3 (+1/-1).

    C'est marrant, tout cela ne fait qu'augmenter une impression de supériorité que je ressents depuis longtemps

    Je crois que malheureusement, ça ne fait surtout que montrer que tu n'as pas la moindre idée de ce dont sont capables les LLM modernes.

    Après, entendons-nous bien : il est tout à fait légitime d'avoir les loisirs qu'on veut. On peut par exemple aimer passer son temps libre à faire des divisions ou calculer des racines carrées à la main. On peut même prétendre que c'est bon d'entrainer son esprit sur des exercices de ce style (c'est discutable, mais pourquoi pas). Par contre, on est bien d'accord que c'est absurde de prétendre qu'une division faite à la main est mieux faire qu'à la calculatrice? Parce que c'est en effet complètement faux. Dans n'importe quel cadre sérieux, donc hors loisirs, quand le temps passé ou la précision du résultat sont importants, alors il n'y a pas d'alternative : on doit utiliser une machine pour calculer.

    Je ressens pourtant la même chose avec ton approche des LLM. Tu tentes de justifier un savoir ou un savoir-faire que tu as en prétendant que tu fais mieux que la machine, et que c'est "mieux" de manière absolue, avec une menace en arrière-plan sur l'idée que le jour où tu n'auras pas de machine sous la main tu seras bien embêté. Mais quelqu'un qui sait calculer les racines carrées à la main pourrait sortir les mêmes arguments, pourtant, je n'ai jamais eu besoin de calculer une racine carrée à la main, c'est une compétence inutile pour moi, et j'ai bien fait de toujours confier ce travail à une machine, et à investir le temps que j'ai gagné à autre chose.

    Au final, ton dénigrement des LLM, des gens qui utilisent les LLM, et ta prédiction de la fin des LLM, tout ça est cohérent : si les LLM étaient en effet bidons et qu'ils étaient amenés à disparaitre, alors tu aurais en effet des compétences que les autres n'auraient pas, et tu pourrais apparaitre comme une sorte de dieu hyper-compétent dans une telle société, qui achèterait tes services à prix d'or. Mais il y a une faille dans ton raisonnement, c'est que pour que ça marche il faut que les prémisses soient vraies, ce qui n'est probablement pas le cas. Il me semble donc malheureusement assez vraisemblable que tes compétences dont tu es si fier finissent comme celles du type qui sait calculer les racines carrées à la main : elles ne sont valorisables ni socialement, ni économiquement, ni professionnellement, et ne consistent au mieux qu'en une curiosité. Et ton destin dans un tel monde sera d'être éternellement aigri, est-ce que c'est ce que tu souhaites?

  • [^] # Re: Je me demande

    Posté par  . En réponse au journal npm et badaboum. Évalué à 4 (+1/-0). Dernière modification le 18 septembre 2025 à 10:15.

    Si google avait gardé un algo performant, je dis pas

    Ça n'est pas mon genre de défendre Google, mais il faut quand même avouer que de maintenir un algo performant dans un écosystème où des milliards de $ sont dépensés chaque année pour développer des stratégies visant à biaiser les résultats de ton moteur n'est pas forcément un tâche aisée. Sans compter que tes ressources ne viennent pas du service rendu aux utilisateurs mais de la publicité (donc des gens qui te payent pour que tu biaises toi-même les résultats de ton moteur). Disons que les planètes ne sont pas alignées pour maintenir la qualité des résultats des requêtes.

    Mais autrement, je suis d'accord. Beaucoup de requêtes dans les moteurs de recherche sont en fait des requêtes qu'un LLM traiterait bien mieux qu'un moteur de recherche, donc la bascule vers un LLM est complètement naturelle. Avec le gros point d'interrogation du business model, évidemment.

  • [^] # Re: Je me demande

    Posté par  . En réponse au journal npm et badaboum. Évalué à 4 (+3/-2).

    Je suis ouvert à la discussion sur les IA génériques et gratuites, même si j'ai du mal à imaginer comment leur intégration aux moteurs de recherche pourrait revenir en arrière—de facto, il y a deux sortes de recherches dans un moteur; 1) quand on recherche un site en particulier, pour faire de l'auto-complétion d'URL ou pour pallier les défaillances des moteurs de recherche internes aux sites, qui peuvent en effet se passer d'IA, et 2) quand on recherche une information sans savoir où on va la trouver, auquel cas ce qu'on veut en réalité, c'est un LLM et pas des sites qui ont des éléments en commun avec la requête.

    J'intègre les LLM à mes méthodes de travail en fonction de ce qu'ils peuvent apporter. Ils excellent dans les tâches de type "résumé" (résumé en 250 mots, en 1000 caractères, en anglais, en utilisant un langage profane…), je les trouve également très utiles pour le dépannage ("ma machine à laver dit E:27"). Ça va être comme tout, on va comprendre les limites de ces trucs, et on va profiter de leurs points forts.

    Rapidement également, on va (j'espère) arrêter d'utiliser les trucs grand public sans aucune confidentialité pour les tâches professionnelles, et les employeurs (publics et privés) vont raquer pour le coût réel de ces outils, ce qui éclairera le business model et calmera le flot insensé de centaines de milliards d'investissement. Quand il faudra réellement payer 1000€ par mois pour créer des vidéos tiktok pour les copains, ça calmera les ardeurs.

    Par contre, je ne vois pas comment éviter qu'une interaction avec un humain devienne progressivement un luxe. C'est certain que les clients de HSBC vont continuer à avoir un vrai interlocuteur au téléphone, mais quand tu vas appeler pour savoir combien tu as sur ton livret A au crédit agricole, tu vas avoir un robot au bout du fil. Après, ce n'est pas forcément une catastrophe, se taper 1h de Vivaldi à chaque fois que tu appelles la sécu ou la CAF, ça gonfle tout le monde (sans compter que la qualité des réponses des opérateurs humains dans ces organismes reste assez aléatoire).

  • [^] # Re: Je me demande

    Posté par  . En réponse au journal npm et badaboum. Évalué à 3 (+2/-2).

    Tant mieux ! Je serais ravi de voir le ramdam autour de l'IA éclater comme une bulle,

    Je n'arrive pas à comprendre la logique du raisonnement. Comme un futur sans IA n'existe pas (on ne peut pas les "désinventer"), tu préfèrerais un futur où les IA font de la m***de plutôt que de devenir des outils pertinents?

  • [^] # Re: Je me demande

    Posté par  . En réponse au journal npm et badaboum. Évalué à 7 (+4/-0).

    Après si c'est une règle, elle était implicite et je ne l'ai jamais lu explicitement ici.

    Y a-t'il réellement besoin d'une règle pour quelque chose d'aussi évident? Les gens qui posent des questions sur un forum souhaitent des réponses de vrais gens, s'ils voulaient une réponse de LLM ils demanderaient à un LLM. Copier une question dans ChatGPT ne demande aucune compétence, et le faire à la place de l'OP ne fournit aucune plus-value. Si vous ne savez pas répondre, pas de problème, il suffit de ne pas répondre.

  • [^] # Re: Je me demande

    Posté par  . En réponse au journal npm et badaboum. Évalué à 10 (+11/-1).

    Mais honnêtement pour moi, elle a été pertinente.

    Il est hyper important d'avoir des endroits du web préservés des sorties de LLM, ça inclut Wikipédia, et divers forums d'aide comme celui-ci. Les LLM ne pourront plus progresser s'ils bootstrappent sur leurs propres sorties, donc merci de préserver des espaces dépollués.

    La consultation de LLM est devenue standard, à peu près autant qu'une recherche dans un moteur. Quand quelqu'un répond dans un forum STFW, il donne la bonne info : tu trouveras des réponses intéressantes sur Google. Tu peux faire pareil, indiquer qu'il suffit de demander à chatGPT pour avoir des réponses intéressantes à la question. Mais personne ne recopie les sorties de Google dans un forum, et de la même manière personne ne devrait utiliser des octets des disques de linuxfr pour y stocker les sorties d'un autre site, fussent-elles librement recopiables.

  • [^] # Re: souci systémique ?

    Posté par  . En réponse au lien Op@le, le logiciel comptable qui rend fou. Évalué à 7 (+4/-0).

    Je suis d'accord, ça n'est pas techniquement impossible, mais il faut juste 15 ans et des milliers d'heures de travail, une volonté politique forte, l'implication de gens compétents… C'est quand même un repoussoir.

    Les catastrophes logicielles ne font que démontrer que ces incohérences peuvent être gérées par des humains, mais pas par des algorithmes. Un exemple frappant est le logiciel de paye des armées, qui n'a en réalité jamais fonctionné.

    La raison pour laquelle le prestataire accepte de passer ces outils en prod m'échappe, par contre. Il faut forcément la complicité des incapables qui ont établi le cahier des charges, qui doivent sentir que ça va chauffer pour leurs fesses si quelqu'un s'intéresse à la raison pour laquelle le prestataire ne livre pas à temps. Mais rien n'est pire que de passer en prod un logiciel qui ne passe pas les tests, qui peut s'imaginer que ça va bien se passer? Sauf à partir à la retraite dans le mois qui suit, on doit bien se douter que ça va remonter, non?

  • [^] # Re: souci systémique ?

    Posté par  . En réponse au lien Op@le, le logiciel comptable qui rend fou. Évalué à 9 (+6/-0). Dernière modification le 15 septembre 2025 à 16:22.

    Je doute qu'il s'agisse uniquement de ratages imputables aux prestataires.

    Ça m'étonnerait qu'il y ait une cause unique, mais il semble impossible de sortir de tels logiciels si le cahier des charges était bien fait. Un des problèmes est que les règles à implémenter dans ce genre de logiciels sont souvent absurdes et incohérentes (parce que fonction publique). Par exemple, une validation par un n+1 alors que tout le monde n'a pas de n+1. Quand c'était géré à la main, un agent prenait l'habitude de forcer la validation quand la situation l'exigeait, sans que les grands pontes sachent que cette situation existait. Donc évidemment, quand la règle est implémentée sans cette connaissance, bah le système devient complètement grippé.

    En fait, plus concrètement, les règles de gestion dans la fonction publique sont fixées par la loi et par ses décrets d'application. Dans n'importe quelle structure privée, quand on s'aperçoit que le logiciel n'arrive pas à gérer une situation, on va modifier légèrement les règles pour que ça passe. Mais c'est totalement impossible dans la fonction publique car une telle décision mettrait celui qui la prend sous la menace d'une sanction; si la règle dit que les facturettes papier doivent être collectées et stockées après avoir été scannées, les reçus électroniques vont devoir être imprimés, stockés, et les versions papier de ces reçus imprimés vont devoir être re-scannés pour rentrer dans le système. Tout le monde est conscient que c'est débile, mais personne n'a le pouvoir de changer.

    Les prestataires ne sont pas payés pour vérifier la cohérence des règles. On leur file un cahier des charges absurdes, avec des gros trucs bloquants à chaque étape (genre validation du changement du jour de télétravail par le président de la République dont le cahier des charges fournit l'adresse email en dur), ils les implémentent, et après ça ne fonctionne pas, évidemment. Ils doivent bien se marrer (ou pleurer quand ils comprennent que c'est leurs impôts qui partent en fumée).

  • [^] # Re: Ma vie en électrique

    Posté par  . En réponse au lien Les hybrides rechargeables émettent cinq fois plus de CO2 que ce que prétendent les tests officiels. Évalué à 3 (+0/-0).

    La marge pour les transports en commun, c'est surtout le niveau national et européen. Si tu fais Paris-Madrid en train plutôt qu'en avion, tu sauves un max de CO2. Coller 2 bus par jour entre Trifouillis-les-oies et Tartempion-sur-Fleurette, ça va mobiliser un bus, un chauffeur, du diesel, des subventions publiques, et ça ne va jamais remplacer les véhicules personnels (au mieux, ça offira un moyen de transport à des gens qui n'en avaient pas).

    D'ailleurs, il est régulièrement montrés qu'il y a peu de report bagnole -> transports lors de la mise en place de nouvelles lignes. Les utilisateurs des transports sont des gens qui profitent de la nouvelle ligne pour raccourcir un trajet, prendre un boulot dans une zone auparavant inaccessible, ou ne plus prendre le vélo.

  • [^] # Re: Ma vie en électrique

    Posté par  . En réponse au lien Les hybrides rechargeables émettent cinq fois plus de CO2 que ce que prétendent les tests officiels. Évalué à 4 (+1/-0).

    La meilleure solution écologique c'est de ne pas utiliser d'énergie. Les transports en commun ne sont pas écologiques (ni économiques) dans les zones à faible densité (un bus qui roule à vide consomme plus qu'une voiture individuelle). Il existe des chiffrages assez précis de la rentabilité écologique et économique des transports en commun en fonction de la densité de population (à partir de quand tu peux avoir un train, un tram, un bus, etc), et la très grande majorité du territoire français n'est pas couvrable par des transports en commun.

  • [^] # Re: Voitures thermique déguisées

    Posté par  . En réponse au lien Les hybrides rechargeables émettent cinq fois plus de CO2 que ce que prétendent les tests officiels. Évalué à 4 (+1/-0).

    notamment sur l'autonomie

    Je suis paumé par le raisonnement. L'autonomie d'une hybride est forcément réduite, puisque 1) tu dois te trimballer un moteur thermique et du carburant partout (donc à batteries égales l'autonomie serait plus faible), 2) le moteur thermique prend la place des batteries, et 3) le poids des batteries diminue d'autant le rendement du moteur thermique. Donc il n'y a aucune solution, c'est évident qu'une hybride consomme plus de kWh/km qu'une électrique et que son autonomie est plus réduite, et qu'elle consomme également plus de L/100km qu'une hybride non-rechargeable (qui n'a que des petites batteries). Par sa conception même, une hybride rechargeable est donc moins performante qu'une hybride non-rechargeable et qu'une électrique. Ce sont des contraintes physiques, qu'aucune R&D ne pourraient magiquement retirer.

  • [^] # Re: Voitures thermique déguisées

    Posté par  . En réponse au lien Les hybrides rechargeables émettent cinq fois plus de CO2 que ce que prétendent les tests officiels. Évalué à 4 (+1/-0).

    Oui, mais je vais contribuer à "construire une nouvelle électrique".

    Honnêtement, je crois que l'argument est faux. Si tu balances ta thermique à la casse, oui, le bilan écologique de la construction de ta nouvelle électrique va devoir être pris en compte. Mais si tu revends ta thermique, alors elle va remplacer une bagnole qui part à la casse et qui aurait dû être remplacée de toutes manières, donc le bilan écologique de ton électrique ne vient pas en plus.

    Prenons un bilan fabrication de 10tEqCO2 pour une électrique contre 5tEqCO2 pour une thermique (c'est volontairement exagéré), et 1tEQCO2/an pour une électrique contre 4tEqCO2/an pour une thermique (c'est grosso-modo le calcul ici: https://www.quechoisir.org/actualite-voitures-electriques-sont-elles-vraiment-ecologiques-n103891/).

    Disons que ta thermique a 10 ans, et qu'elle est très fiable et bien entretenue, elle peut donc durer 10 ans de plus.

    Scénario 1: tu gardes ta thermique. Sur la période 2015-2025 tu as dépensé 40t (4t x 10 ans), sur la période 2025 - 2035 tu as dépensé 40t également, donc sur 20 ans 5t pour la fabrication et 80t d'utilisation, donc 85t/20 = 4.25t / an.

    Scénario 2: tu achètes une électrique en 2025. Tu as donc dépensé 40t sur la période 2015-2025, et 10t (1 x 10 ans) sur la période 2025 - 2035. Vient ensuite le coût des constructions. Si tu balances ta thermique à la casse en 2025, tu ajoutes donc 5t pour la thermique et 10t pour l'electrique en 20 ans, soit un total de 65t sur 20 ans, donc 3t25/an. Au passage, tu vois qu'avec des chiffres réalistes et avec le scénario le plus pessimiste, ton bilan écologique est quand même meilleur que si tu avais conservé ta thermique (parce qu'il ne faut que 3 ans pour une électrique pour rattraper le retard dû au coût de fabrication).

    Scénario 3: tu revends ta thermique, qui sert 10 ans de plus à un autre quidam. La dépense totale est de 5t (fabrication de la thermique) + 20 x 4t (utilisation de la thermique) + 10t (fabrication de l'électrique) + 10 x 1t (utilisation de l'électrique) = 105 t. Sauf que pendant 10 ans le bilan est à diviser en deux personnes! Donc tu as dépensé 4.25t/an entre 2015 et 2025, et 2t/an entre 2025 et 2035, alors que le gusse qui t'a acheté ta thermique a dépensé 4.25t/an entre 2025 et 2035. S'il ne l'avait pas acheté, il aurait acheté une voiture neuve, donc tu ne peux pas compter son utilisation dans ton bilan. Au final, sur 20 ans, ton bilan moyen est de 3.125t/an, encore meilleur que le scénario 2 (parce que tu partage l'amortissement de la thermique avec la personne à qui tu l'as revendue).

    Dans tous les cas, garder sa thermique a un coût écologique. Et si tu trouves que les chiffres sont bidons, que tu roules moins, etc., alors dans tous les cas le scénario 3 est mathématiquement toujours meilleur que le scénario 1, quelle que soit ta consommation (parce que l'acheteur consomme de toutes manières ce que tu aurais consommé). Au final, s'il y a un marché de l'occasion et que personne ne balance des objets qui fonctionnent à la poubelle, alors il n'y a pas de coût écologique à renouveler un équipement. Le raisonnement fonctionne également avec les téléphones.

  • [^] # Re: Voitures thermique déguisées

    Posté par  . En réponse au lien Les hybrides rechargeables émettent cinq fois plus de CO2 que ce que prétendent les tests officiels. Évalué à 3 (+0/-0).

    J'imagine qu'il voulait dire "thermiques", et c'est un argument permanent des anti-électrique qui n'arrivent pas à imaginer que les gains de rendement à espérer sur les moteurs thermiques sont rikikis parce qu'on n'est pas loin des limites physiques. Les moteurs thermiques brûlent du carburant, et la chaleur est de l'énergie merdique à transformer en une autre forme d'énergie. Donc rendements pourris, par le principe même du moteur thermique.

  • [^] # Re: Voitures thermique déguisées

    Posté par  . En réponse au lien Les hybrides rechargeables émettent cinq fois plus de CO2 que ce que prétendent les tests officiels. Évalué à 3 (+1/-1).

    Il tient encore la route et je ne vais pas ajouter une voiture sur Terre tant que je peux ne pas le faire

    Dans la mesure où le marché de l'occasion est très développé pour les bagnoles (y compris à l'export), c'est quand même pas très fort comme argument. Tu ne vas pas déposer ta voiture qui marche à la casse comme on le fait avec une TV cathodique, tu vas la revendre et elle continuera à rouler.

    Je ne suis pas proprio d'une maison

    L'installation de bornes de recharge dans les parkings collectifs n'est quand même pas anecdotique. Le seul problème réel est celui des gens qui n'ont pas de place de parking privé, ce qui est une situation qui (de mon point de vue) n'est de toutes manières pas socialement acceptable (depuis quand a-t-on le droit de stocker des biens privés en permanence sur la voie publique? C'est au mieux une tolérance, et elle peut très bien disparaitre).

    Le cas des batteries est quand même un peu flou (durée de vie, coût en bout de vie, recyclage, etc.)

    Recyclage c'est en effet flou, par contre pour la durée de vie les études récentes sont très claires et très rassurantes, avec une longévité supérieure aux estimations. D'ailleurs, la location de batteries a complètement disparu du marché parce que les batteries récentes ont une durée de vie (hors accident) supérieure à la durée de vie de la voiture. Il serait peut-être temps d'abandonner l'argument du coût de changement de batterie en cours de vie du véhicule, parce qu'en pratique ça n'est pas nécessaire.

    J'ai pas 20 000 euros à mettre dans une voiture bas de gamme (mais attention, électrique !)

    20 000 euros pour l'entrée de gamme, c'est le prix d'une thermique :-) Les voitures électriques ne sont pas si chères par rapport aux thermiques, c'est juste le prix des voitures neuves qui est démentiel. Par ailleurs, le marche de l'occasion devient intéressant pour les électriques, le parc est suffisamment vieux pour commencer à voir des modèles d'occasion à des prix bien plus abordables.

    Si t'es à moins de 10000, c'est compensé par les coûts de l'assurance (plus chères sur les électriques). En gros, on s'enrichira pas, hein.

    Si tu roules moins de 10000km, de toutes manières, ton prix au km est monopolisé par le coût d'achat de la voiture. Et puis la quasi-absence d'entretien sur une électrique (pas de vidange, pas de joint de culasse, pas de distribution…) compense largement dans le prix de l'assurance. En gros, en terme de budget, si tu compares une citadine électrique avec une twingo de 2015, c'est clair que niveau budget la vielle voiture revient à beaucoup moins cher. Mais avec une essence récente? Ça n'est pas si évident. Mais de toutes manières personne ne s'enrichit en achetant une bagnole, électrique ou pas.

  • [^] # Re: Voitures thermique déguisées

    Posté par  . En réponse au lien Les hybrides rechargeables émettent cinq fois plus de CO2 que ce que prétendent les tests officiels. Évalué à 3 (+1/-1).

    Oui c'est la liberté d'expression de raconter de la merde pour tromper le chaland !

    Je ne comprends vraiment pas où tu veux en venir. Les gens ne veulent pas acheter des voitures électriques parce qu'ils ont peur que le manque d'autonomie change leurs habitudes et leurs occasionne des galères, des pannes, ou des retards. Pourquoi cette peur? Je n'en sais rien, parce qu'ils ne connaissent pas (peur de l'inconnu), parce qu'ils rationalisent le fait d'avoir racheté une voiture thermique neuve, parce que les vendeurs de grosses voitures thermiques communiquent là-dessus, et parce qu'il y a un fond de vérité, tout ça mélangé. Bref on s'en fout, l'autonomie est un frein à l'achat d'une voiture électrique, donc les publicitaires qui vendent des électriques ne communiquent que sur l'autonomie, et les publicitaires qui vendent des hyrbides communiquent sur le fait qu'on ne peut pas tomber en panne de batterie avec une hybride. Voila, il n'y a ni vente de merde, ni tromperie, et il est probable que d'ici quelques années avec la démocratisation de l'électrique cette peur diminuera et d'autres arguments seront utilisés pour vendre des voitures.

    Et puis, vendre de l'autonomie, ça évite aussi de parler du prix et de la réparabilité. Quand tu veux vendre quelque chose tu communiques aussi sur ce que tu peux, tu ne vas pas dire "Achetez une petite citadine 40k€, elle partira à la casse dès le premier accrochage".

  • [^] # Re: Voitures thermique déguisées

    Posté par  . En réponse au lien Les hybrides rechargeables émettent cinq fois plus de CO2 que ce que prétendent les tests officiels. Évalué à 7 (+5/-1).

    Forcément si c'est vendu et donc utilisé comme ça, on tombe sur ces chiffres.

    C'est quand même aussi la preuve que l'essence n'est pas assez chère. Si les gens arbitrent en faveur de l'essence parce qu'ils ont la flemme de brancher une prise, c'est qu'ils n'ont pas de problème de pouvoir d'achat (ni pas assez de pression sociale).

    Elle entretient l'anxiété de l'autonomie.

    Tu ne peux pas reprocher aux publicitaires de jouer sur les arguments qui bloquent les ventes. Ce n'est pas les publicités qui sont anxiogènes, c'est les inquiétudes des consommateurs qui sont irrationnelles.

    Par contre la stupidité des réseaux de recharge

    D'une manière plus générale, il y a certainement une reflexion législative à faire sur les méthodes de fidélisation des clients. Normalement, la concurrence libre et non-faussée est prioritaire sur la liberté du marché en Europe, et on laisse pourtant les entreprises fausser la concurrence en imposant des formes d'exclusivité, c'est anormal et ça veut dire que l'esprit des réglements européens est trop facilement contournable.

  • [^] # Re: quel connerie

    Posté par  . En réponse au journal Anthropic accepte de payer $1.5 milliard pour atteinte au droit d'auteur. Évalué à 4 (+1/-0). Dernière modification le 10 septembre 2025 à 11:02.

    Bah du coup, je ne comprends pas sur quel point on n'est pas d'accord.

    1) Un LLM qui n'aurait pas une grande partie de la littérature scientifique dans ses données d'entrainement ne serait pas pertinent
    2) La littérature scientifique est pour une grande partie produite par des chercheurs payés ou subventionnés par les États ou des structures publiques
    3) Une partie substantielle de la littérature scientifique est publiée dans des journaux détenus par des acteurs privés qui détiennent les droits par des accords de transferts de propriété intellectuelle avec les auteurs
    4) Une fraction de la littérature scientifique récente est disponible sous des licences moins restrictives, soit parce que les publications sont en open access, soit que des versions préliminaires ont été diffusées sous forme de "pre-print". Mais rien de ceci n'existait avant le XXIe siècle, et il existe encore beaucoup d'articles qui ne sont disponibles que sur le site de l'éditeur
    5) Une autre fraction de la littérature est publiée dans des ouvrages édités, et pour ceux-là même les auteurs font tout pour ne pas le rendre disponible sous licence moins restrictive (typiquement, dans certains champs scientifiques, et en particuliers dans les sciences sociales, ces ouvrages sont considérés comme des compléments de revenus pour les chercheurs).
    6) Factuellement, une grande partie de la littérature (sauf les ouvrages) est disponible illégalement sur des plate-formes de type sci-hub (dont le financement et la pérénnité ne sont pas garantis, évidemment)

    Donc les LLM ont actuellement la possibilité de manger la littérature scientifique en aspirant sci-hub. Mais si les procès dont on parle vont jusqu'au bout et que le fair-use n'est pas reconnu pour l'entrairement des LLM, alors il faudra soit payer des milliards aux éditeurs scientifiques pour entrainer un LLM, soit ne l'entrainer que sur un corpus Open Access (souvent sous des licences CC-BY ou plus restrictives, CC-BY-NC ou CC-BY-ND).

    On ne parle pas de légitimité, là (je suis personnellement convaincu qu'en effet, les publications scientifiques devraient toutes légalement être légalement diffusables—peut-être pas modifiables, mais c'est discutable). Le fait est que dans le monde réel, elles ne le sont pas, et que le refus du fait-use pour les LLM engendrerait l'impossibilité d'intégrer le savoir scientifique dans les données d'entrainement. Je ne vois pas qui souhaiterait ça à part les éditeurs prédateurs, mais c'est un fait.

  • [^] # Re: quel connerie

    Posté par  . En réponse au journal Anthropic accepte de payer $1.5 milliard pour atteinte au droit d'auteur. Évalué à 2 (+4/-5). Dernière modification le 09 septembre 2025 à 18:12.

    C'est beaucoup trop long pour répondre à tout, et je ne relèverai même pas les arguties absurdes sur la signification de 'sous droit d'auteur'. Mais au moins:

    Ainsi OpenAI a déclaré qu'ils essaient de faire passer l'entraînement AI dans le "fair use" américain (qui jusqu'ici concerne plutôt l'usage de très courts extraits, etc. Notons comme on passe de "courts extraits" à "l'intégralité de l'œuvre" mais dans leurs esprits tordus par les gros sous, ça passe crême).

    C'est clairement faux. Le fair-use n'est pas restreint au droit de citation, et comparer le fair use aux exceptions du droit français ne va nul part.

    Le droit US donne plusieurs critères à considérer pour le fair-use:

    (1) L'objectif et la nature de l'usage, notamment s'il est de nature commerciale ou éducative et sans but lucratif ;
    (2) la nature de l'œuvre protégée ;
    (3) la quantité et l'importance de la partie utilisée en rapport à l'ensemble de l'œuvre protégée ;
    (4) les conséquences de cet usage sur le marché potentiel ou sur la valeur de l'œuvre protégée.

    On voit bien d'ailleurs une différence fondamentale entre le droit US qui est jurisprudentiel et le droit Français. Le CPI donne des exceptions assez claires, alors que le droit US est flou et laisse les tribunaux évaluer la situation.

    Au vu de ces éléments, il est tout à fait possible de plaider que l'entrainement d'un modèle relève du fair-use. Ça n'a rien à voir avec un changement de la loi, c'est juste un argument juridique. Les LLM ne sont pas des serveurs qui stockent et redistribuent les oeuvres, leur objectif n'est pas de concurrencer les distributeurs, le fait qu'ils aient utilisé ces oeuvres est neutre du point de vue financier pour les auteurs (le droit moral n'existe pas aux US). Ils vont plaider ça, et on va bien voir ce que les tribunaux vont décider.

    Pour le reste, je ne vais pas passer des heures sur chaque détail. L'histoire de stockage sur les serveurs pour redistribuer au public n'a à mon avis aucun sens, et la copie technique (RAM, cache etc) est explicitement listée dans les exceptions (exception #6, il faut évidemment que la source soit licite).

    En ce qui concerne la "propriété intellectuelle forte", c'est juste lié aux contours du fair-use. Au final, ce n'est clairement pas ici qu'on peut décider si l'usage d'oeuvres protégées pour l'entrainement des LLM est légale ou non, c'est beaucoup trop complexe et beaucoup trop technique. Mais en tout cas, j'en ai marre de lire que ça serait "évident". Non, il n'y a rien d'évident, et ces discussions sont toujours bourrées de gens qui pensent qu'OpenAI n'ont pas le droit d'utiliser le code sous GPL qu'ils ont mis dans un git public par exemple, et ils prétendent ça sans aucun argument à part qu'ils ne veulent pas. l'entrainement des LLM n'a pas été prévu, ni dans la loi, ni dans les licences libres, et jusqu'à preuve du contraire, plaider le fair-use ne me semble pas absurde du tout, puisque sans cette possibilité le développement des LLM ne serait possible que par d'énormes multinationales qui seraient en mesure de négocier des accords à plusieurs milliards de $$ avec les sociétés d'ayant-droits. Les conséquences pour la société de refuser le fair-use pour l'entrainement des LLM seraient donc majeures.

  • [^] # Re: Droits

    Posté par  . En réponse au journal Anthropic accepte de payer $1.5 milliard pour atteinte au droit d'auteur. Évalué à 5 (+2/-0).

    Je ne vois pas trop pourquoi cela tomberait dans la contrefaçon

    C'est le code de la propriété intellectuelle qui le dit:

    Toute édition d'écrits, de composition musicale, de dessin, de peinture ou de toute autre production, imprimée ou gravée en entier ou en partie, au mépris des lois et règlements relatifs à la propriété des auteurs, est une contrefaçon et toute contrefaçon est un délit.

    La contrefaçon en France d'ouvrages publiés en France ou à l'étranger est punie de trois ans d'emprisonnement et de 300 000 euros d'amende.

    Le code de la propriété intellectuelle est très clair : toute reproduction non autorisée est une contrefaçon.

    Il faut ensuite regarder les exceptions ; il y en a 13, et aucune ne s'applique ici.

    Après, il y a peut-être une tolérance; soit les sites en question sont hébergés à l'étranger et qu'il y a peu de recours pour leur faire respecter la loi française, soit ils ont conclu un accord avec les ayant-droit (partage des ressources publicitaires avec la SACEM, etc), soit il y a une forme de tolérance vis-à-vis de l'utilisation non-commerciale (connaissant la SACEM, j'en doute, mais bon). D

  • [^] # Re: quel connerie

    Posté par  . En réponse au journal Anthropic accepte de payer $1.5 milliard pour atteinte au droit d'auteur. Évalué à 6 (+4/-1).

    Ah, et j'avais oublié un argument super-important : si on imagine développer un LLM libre et utile, il faudra forcément le nourrir de contenu sous droit d'auteur sans rien reverser aux ayant-droits (à commencer par la littérature scientifique). Il est donc très important que la justice détermine clairement ce qui peut et ne peut pas être utilisé pour entrainer un modèle, et cette clarification permettra de déterminer s'il est possible pour l'humanité d'avoir des IA publiques et de qualité (une sorte de LLM Wikipédia par exemple) ou si les LLM sont pour toujours destinés à être privés/privatifs, fermés, et financés par des publicités plus ou moins visibles.

    À titre d'analogie un peu foireuse, Wikipédia est libre mais construite sur une biliographie largement privée, et personne ne vérifie si les auteurs des articles ont payé les livres qu'ils citent. S'il était interdit de sourcer Wikipédia à partir de livres non-libres, alors Wikipédia n'existerait pas.

  • [^] # Re: quel connerie

    Posté par  . En réponse au journal Anthropic accepte de payer $1.5 milliard pour atteinte au droit d'auteur. Évalué à 7 (+4/-0).

    Tu peux imaginer que la jurisprudence puisse considérer que le fair-use ne s'applique qu'aux personnes humaines et pas aux algorithmes. Dans ce cas, les personnes sont protégées de la voracité de ceux qui "possèdent" la propriété intellectuelle; ils peuvent par contre exercer cette voracité contre les machines et contre ceux qui possèdent ces machines.

    Mais sur le fond, je suis d'accord avec toi. Ceux qui prétendent lutter contre le capitalisme en assimilant l'entrainement des modèles avec la contrefaçon ne font que renforcer les tenants d'une propriété intellectuelle forte: une oeuvre appartient à ses ayant-droits et seulement à ses ayant-droits, qui possèderaient une sorte de pouvoir absolu sur toutes les réutilisations et modifications, mêmes fragmentaires, mêmes partielles, même indirectes. Je ne vois pas le rapport avec l'extrême droite, mais par contre ça ressemble beaucoup à la version falsifiée du libéralisme telle que défendue par la droite conservatrice : la loi ne servirait qu'à garantir la propriété, et la liberté ne s'applique qu'à ceux qui possèdent.

    Dans tous les cas, je ne considèrerais pas du tout qu'une victoire des vautours de la propriété intellectuelle ne soit une bonne nouvelle. L'IA ne peut pas exister sans la culture populaire, et la culture populaire est de plus en plus séquestrée et privatisée par l'industrie de la culture.

  • [^] # Re: Claude connait la chanson

    Posté par  . En réponse au journal Anthropic accepte de payer $1.5 milliard pour atteinte au droit d'auteur. Évalué à 5 (+2/-0).

    J'aurais donc tendance à dire que oui, il connaît très bien les paroles originales.

    En tout cas, il connait très bien le droit d'auteur puisqu'il sait que c'est la contrefaçon qui est illégale (reproduire les paroles ou la musique), pas le fait de les connaitre ou d'y avoir été confronté.

  • [^] # Re: Droits

    Posté par  . En réponse au journal Anthropic accepte de payer $1.5 milliard pour atteinte au droit d'auteur. Évalué à 5 (+2/-0).

    Ce qui est interdit c'est d'utiliser des données acquises illégalement pour entraîner une IA.

    Bah ça semble beaucoup plus compliqué que ça.

    Ce qui est clairement interdit, c'est la contrefaçon, c'est à dire de republier les oeuvres protégées sans l'autorisation des auteurs. Si tu demandes à un LLM "donne-moi les paroles de Comme d'Habitude" et qu'elle te les donnes, c'est de la contrefaçon, et c'est interdit. Pareil pour les musiques.

    Le reste semble beaucoup moins clair. Accéder ponctuellement à des données protégées sans y avoir accès dépend de comment on y a accès. Si on pirate un serveur, on peut être accusé d'intrusion dans un système informatique, si on les récupère "sur Internet" sans les stocker sur son disque dur, ça ne tombe pas vraiment sous le coup de la loi (comme d'une manière générale la détention "de bonne foi" d'un produit contrefait). Par conséquent, il ne semble pas si évident que ça qu'un LLM qui aspirerait le web pour s'entrainer puisse être condamné s'il est "tombé" sur de la contrefaçon. C'est le contrefacteur qui est condamnable, pas ses clients.

    Il faut aussi prendre en compte la notion anglo-saxonne de "fair use", qui va au-delà des exceptions qui existent en Europe (droit de citation, usage pédagogique, etc). Entrainer un LLM avec des contenus protégés sans demander l'autorisation des auteurs peut très bien être justifié par le "fair use", qui autorise l'usage qui ne nuit pas aux auteurs. C'est par exemple grâce au principe du "fair use" que les Wikipédia anglosaxonnes reproduisent des oeuvres protégées qui ne sont pas sous licence libre, chose que de nombreuses autres Wikipédias dans d'autres langues se refusent de faire. Et pour le coup, si tu ne peux pas prouver que les LLM produisent du contenu qui puisse concurrencer les auteurs (en gros, diminuer leurs revenus, puisque le droit US ne s'embarrasse pas réellement d'autres considérations que les $$), le fair-use semble largement plaidable.

    C'est justement cet énorme flou que les tribunaux et les législateurs vont devoir éclaircir ces prochaines années. Si tout était clair, alors il n'y aurait pas de discussions.

  • [^] # Re: La tour de Babel a encore frappé

    Posté par  . En réponse à la dépêche La Commission européenne publie une feuille de route sur le logiciel libre. Évalué à 4 (+1/-0). Dernière modification le 05 septembre 2025 à 13:50.

    xkcd