thoasm a écrit 10140 commentaires

  • [^] # Re: Il ne nous reste plus qu'un mème à sortir

    Posté par  . En réponse au journal La crise économique qui vient. Évalué à 7 (+5/-1).

    Alors on pouvait déjà s'inquiéter pour le climat avec le boom de l'IA quand les GAFAMS ont dit "fuck la neutralité carbone". Ce n'est que la suite logique du déroulement des opérations. Non seulement ça fout en l'air leurs objectifs en propre mais aussi ça rentre en concurrence (financière par ex.) avec les potentiels efforts de décarbonation des autres.

    L'argent d'abord, toujours, et l'argent vite. Pour la transition de l'énergie ça marche quand c'est vraiment la merde genre "il n'y a plus du tout de pétrole" ou "oups c'est la guerre et on bouffe du pétrole vraiment trop vite, quand ça s'arrête tout s'arrête, on a vraiment besoin d'une alternative". Mais on peut craindre que quand ça va repartir … ben le pétrole sera cramé quand même, on profitera juste de plus d'énergie sous forme d'électricité, ptete pour l'IA pour … whatever. Faire de l'argent à court terme.

  • [^] # Re: Il ne nous reste plus qu'un mème à sortir

    Posté par  . En réponse au journal La crise économique qui vient. Évalué à 7 (+6/-2).

    Ben quoi, l'industrie pétrolière fait d'énorme profits, on va quand même pas faire une croix sur tout cet argent en investissant dans les renouvelables !

  • [^] # Re: Fil mastodon qui discute le papier

    Posté par  . En réponse au lien AI Cannot Self Improve and Math behind PROVES IT!. Évalué à 4 (+2/-1).

    les données initiales non synthétiques c'est le jeu de donnée d'apprentissage initial. Par exemple une banque d'image, ou un ensemble de texte écrits par des humains, utilisé pour l'apprentissage du modèle.

    synthetic_data(model) c'est des données synthétiques, c'est à dire générées en utilisant le modèle, d'une manière ou d'une autre. Dans son algorithmes ces données générées en utilisant le modèle sont ajoutées au jeu de donnée initial pour faire apprendre la génération suivante de modèle.

  • [^] # Re: Nuit des étoiles filantes

    Posté par  . En réponse au lien Dans pas longtemps sur vos écrans : « OMG, Starlink is down ! ». Évalué à 5 (+3/-1).

    Si ça laisse pas un nuage de poussière qui va tout masquer et mettre de l'aluminium qui va déstabiliser la chimie de l'atmosphère pendant des plombes …

  • [^] # Re: Fil mastodon qui discute le papier

    Posté par  . En réponse au lien AI Cannot Self Improve and Math behind PROVES IT!. Évalué à 4 (+2/-1). Dernière modification le 29 avril 2026 à 12:06.

    On peut pas non plus imaginer augmenter les données d'apprentissage à l'infini, c'est raisonnable d'introduire une limite à la quantité de données. Dans ce contexte, le papier du lien implique une perte de diversité dans la distribution initiale si les données synthétiques remplacent progressivement les donnée.

    La méthode de génération des données synthétiques importe peu dans les hypothèses du papier. Et par exemple ça semble évident que si le modèle émet des hypothèses scientifiques et crée des expériences, à la manière d'un scientifique, il n'a pas la possibilité de les tester, il lui faudrait de vraies données pour réellement avancer.

    Dernière chose, ce que le papier veut réfuter c'est un peu l'émergence d'une AGI simplement par réapprentissage et croissance exponentielle rapide des performances dans un cadre "on reste dans les datacenter en circuit fermé" je pense, là ou tu peux avoir des boucles rapides.

  • [^] # Re: Difficile à lire

    Posté par  . En réponse au lien [fil] Panorama de la philosophie des sciences contemporaine. Évalué à 3 (+1/-1).

    Il y a un "dérouleur de fil" : https://tbsky.app/profile/cedricbrun.bsky.social/post/3mkikisbqvc2i

    Je ne le connaissais pas encore, donc j'ai pas utilisé, mais il suffit de préfixer le "bsky" de l'url par un "t" pour l'utiliser.

    Le ciel bleu n'est pas vraiment en silo, c'est plus compliqué que ça. Dans le protocole AT il y a des serveurs, les PDS, qui détiennent les données des comptes, et qu'on peut tout à fait héberger, des relais qui peuvent faire de l'agrégation de données, de l'étiquetage (spam, nsfw …), et des "appviews" pour les présenter (le dérouleur de fil tbsky en est un).

    Maintenant il y a un peu tout ça de dispo je crois. Eurosky est un serveur de PDS (pas autohébergé) récemment créé par exemple, alternatif à bsky et pas mal de personnes ont migré, blacksky est un relay / appview alternatif il me semble.

  • [^] # Re: Difficile à lire

    Posté par  . En réponse au lien [fil] Panorama de la philosophie des sciences contemporaine. Évalué à 3 (+0/-0).

    C'est dans l'ordre, numéroté et le dernier post du fil est indiqué comme tel ( genre c'est numéroté 10/n dans le corps et le dernier est indiqué à n=63 qqch comme ça) le seul piège c'est que tout n'est pas chargé d'un coup et qu'il 'aut cliquer sur "charger la suite/les autres réponses" une ou deux fois.

  • # Fil mastodon qui discute le papier

    Posté par  . En réponse au lien AI Cannot Self Improve and Math behind PROVES IT!. Évalué à 6 (+4/-1).

    Le point principal du papier n'est pas inattendu évidemment, c'est juste une preuve mathématique que faire réapprendre un LLM à partir de données générées par un ou d'autres LLM mène inévitablement à un effondrement. C'est valable aussi si la proportion de "nouveauté" d'information correcte injectée à chaque réapprentissage est trop faible.

    Ce fil Mastodon discute de tout ça.

    Je note notamment ce commentairece commentaire de Dan Piponi qui pointe que les modèles récent n'ont pas pour but de reproduire la distribution d'apprentissage initial mais aussi de réaliser des tâches hors distribution, et cite le papier
    From Entropy to Epiplexity: Rethinking Information for Computationally Bounded Intelligence
    , qui discute entre autre de comment maximiser l'utilité du modèle à ressource computationnelle contrainte étant donné les jeux d'apprentissages, en disant dépasser les pures notion de théorie de la complexité de l'information utilisées dans l'autre papier.

  • [^] # Re: de toute facon

    Posté par  . En réponse au lien Oui, la France peut vivre sans voiture (cette étude le prouve). Évalué à 5 (+3/-1). Dernière modification le 21 avril 2026 à 13:06.

    Ça peut avoir du sens de maintenir un maillage territorial. Sinon si tu vis dans un désert, que t'es vieux et que tu peux plus trop conduire, tu seras bien content d'avoir une bagnole et 150 km à faire pour tous trajets médicaux.

    Par ailleurs, c'est une question d'aménagement du territoire et ça marche dans les deux sens : tu supprimes les infrastructures, les emplois associés, les gens vont se barrer. À l'inverse, dans le cadre d'une politique de territoire, ça peut avoir du sens de maintenir des infras dans des coins peu denses, autours de villes moyennes par exemple, et ça peut générer de l'activité et donc rentabiliser les infras, ça attire des gens. Contrairement à laisser des coins à l'abandon ou plus personne ne va vouloir s'installer.

    Les grandes villes ont aussi un coût écologique, densifier des villes moyennes peut aussi avoir un sens écologique dans le sens optimisation des ressources. Justement pour alimenter les grandes villes il faut … cultiver les campagnes et faire venir la nourriture dedans. Et ne pas abandonner ces gens en rase campagne (lol) en gardant des infras dans ces coins n'est sans doute pas idiot.

  • [^] # Re: de toute facon

    Posté par  . En réponse au lien Oui, la France peut vivre sans voiture (cette étude le prouve). Évalué à 6 (+4/-1).

    Il y a plein de trucs qui vont pas dans ton commentaire, mais j'en relève quand même un : tu veux vraiment argumenter qu'avoir un bon réseau cyclable séparé de la circulation auto est un problèmes pour les livreurs à vélo et que leurs besoins ne sont pas pris en compte ?

  • [^] # Re: Alors non

    Posté par  . En réponse au journal Des ciseaux à bouts ronds pour gérer nos ordis - Wrappers on Linux Workstations. Évalué à 5 (+3/-1).

    Alors taper un mot de passe grub on est pas sur du besoin "un manchot sur le bureau pour les masses" par contre, c'est un "détail" pour gens qui bidouillent déjà pas mal non ?

  • [^] # Re: Ceci n'est pas un journal

    Posté par  . En réponse au lien Remise en service d'une chaîne hifi de 1990. Évalué à 7 (+5/-1).

    La traduction intégrée à FF c'est pas des modèles en lignes, c'est des modèles locaux. Cf. https://www.firefox.com/fr/features/translate/

  • [^] # Re: Il dit qu'il n'a plus de genou

    Posté par  . En réponse au journal PoC : Transformer les tableaux associatifs (dict/map) en vecteur algébrique. Évalué à 3 (+1/-1).

    Ni l'inspiration avec d'autres projets !

  • [^] # Re: Il dit qu'il n'a plus de genou

    Posté par  . En réponse au journal PoC : Transformer les tableaux associatifs (dict/map) en vecteur algébrique. Évalué à 4 (+2/-1). Dernière modification le 16 avril 2026 à 20:52.

    Sinon les opérations algébriques sur des vecteurs avec des "noms de colonne" ça fait aussi penser aux "DataFrame" de pandas pour les stats : https://pandas.pydata.org/docs/reference/frame.html

    Ça implémente pas tout à fait tes opérations et c'est très très largement plus étendu en fonctionnalité et en ambition par contre. Apparemment multiplier des "Series" calcule un produit scalaire.

    Comment calculer une matrice de similarité d'un ensemble de vecteurs avec cette librairie combinée avec d'autres en quelques ligne : https://stackoverflow.com/questions/45387476/cosine-similarity-between-each-row-in-a-dataframe-in-python

  • [^] # Re: Il dit qu'il n'a plus de genou

    Posté par  . En réponse au journal PoC : Transformer les tableaux associatifs (dict/map) en vecteur algébrique. Évalué à 5 (+3/-1).

    Par un espace de dimension infinie, ça c'est les espaces de fonctions (voir Espace Lp). Si l'ensemble des clés est effectivement infini, c'est pas vraiment calculable de manière générique avec une boucle "for" en tout cas, il faut des opérations d'intégrations spécifiques pour un certain espace vectoriel.

    C'est plus des opérations génériques sur des espaces vectoriels de dimensions arbitraires, mais finie, sans regarder le code.

  • [^] # Re: Ok, on est sur LinuxFR

    Posté par  . En réponse au journal Modèle Mythos : Anthropic bluffe, en partie. Évalué à 2 (+0/-1).

    Ça me fait penser à la vidéo yt de « Looking glass universe» ou la tenancière explique pourquoi l'IA ne guériras pas le cancer : ce qui prend la majorité du temps c'est … les essais cliniques, et c'est impensable de s'en passer. Ça permet éventuellement de gagner un peu de temps sur l'identification de molécules candidates, d'après elle.

  • [^] # Re: Ok, on est sur LinuxFR

    Posté par  . En réponse au journal Modèle Mythos : Anthropic bluffe, en partie. Évalué à 3 (+1/-1).

    C'est des domaines où c'est relativement simple d'avoir des éléments objectifs d'évaluation automatisables. Sur l'échelle de l'IA c'est entre le jeu comme les échecs ou tout est évaluable trivialement sur la correction d'une partie et c'est "gagné, perdu ou nul" et c'est tout, là t'as des batteries de tests par exemple éventuellement en info pour vaguement objectiver des patchs sur une base de code qui peuvent passer ou pas, et (une infinité de) autres domaines où virtuellement faudrait refaire une infinité d'évaluations ou tout revérifier à la main pour redonner du feedback.

    C'est donc logique que ce soit leur vitrine, et il y a de l'argent à se faire, bien qu'évidemment malhonnête de laisser penser que les progrès sont forcément identiques dans "toute" l'infinité d'applications possibles et très difficiles à tester correctement et exhaustivement. Logiquement ça implique par contre des progrès moins rapide, cette difficulté de tester automatiquement et donc d'avoir du feedback sur les erreurs. Mais c'est pas explicite sur la plaquette.

  • [^] # Re: C'est ce que je dis depuis le début

    Posté par  . En réponse au lien Les LLM sont un retour aux mainframes. Évalué à 2 (+0/-1).

    Il ne dit pas que le site central nécessite de la puissance de calcul (quoi que ce soit sa raison d'être), mais que les modèles d'IAgen en nécessitent.

  • [^] # Re: lien du lien et commentaires

    Posté par  . En réponse au journal Du rififi à la Document Foundation. Évalué à 5 (+3/-1).

    Zieuté rapidement le site "entreprisesamission.org" : https://entreprisesamission.org/nos-membres/page/4/ c'est intéressant mais ça donne pas trop d'idée de comment ces entreprises s'en sortent par rapport aux mastodontes de leurs secteurs respectifs.

    Et si j'en crois cet article : https://www.bfmtv.com/economie/entreprises/on-en-compte-en-moyenne-500-nouvelles-chaque-annee-depuis-4-ans-malgre-le-coup-de-frein-sur-la-rse-les-entreprises-a-mission-continuent-d-infuser-le-tissu-economique-francais_AV-202603240148.html la seule conséquence à renoncer à la mission et ses objectifs c'est de perdre le statut. C'est un genre de label, et c'est tout, en fait ?

  • [^] # Re: Pas remplaçable finalement

    Posté par  . En réponse au lien La qualité de Claude Code baisse à cause du trop grand nombre d'utilisateurs. Évalué à 2 (+0/-1).

    Un rapport avec henry ?

  • [^] # Re: "Merci la crise sur le marché des composants électroniques"

    Posté par  . En réponse au lien chez Volkswagen les boutons physiques font leur grand retour. Évalué à 3 (+1/-1). Dernière modification le 08 avril 2026 à 18:39.

    Dans une ambiance ou on a des "déserts démographiques" dans certains coin et un désengagement des services publics et autres agences de postes dans les campagnes … c'est pas très étonnant qu'il n'y ait pas davantage d'investissement dans des transports publics dans ces coins. Je sais pas exactement comment ça vote dans ces coins, en plus, mais je serai pas étonné que ce soit plutôt une droite pro voiture qui y soit forte, avec peut être le RN vu le désengagement des pouvoirs publics dans certaines zones.

    Pendant ce temps le bilan carbone de la France n'évolue pas au bon rythme :

    https://bonpote.com/baisse-des-emissions-de-co2-le-bilan-catastrophique-de-la-france-en-2025/

    La voiture individuelle c'est 30% 20% (plutôt un peu moins de 20%, 30 c'est l'ordre de grandeur des transports en général) des émissions de carbone, environ.

  • [^] # Re: "Merci la crise sur le marché des composants électroniques"

    Posté par  . En réponse au lien chez Volkswagen les boutons physiques font leur grand retour. Évalué à 2 (+0/-1).

    En tout cas et de fait, il n'y a pas de microbus en milieu rural (au moins partout) pour l'instant, ça a l'air plus simple et/ou prioritaire de le faire à Paris. Et c'est déjà un problème avec la hausse du prix de l'essence d'aller travailler ou visiter la famille quand on vit en milieu rural : https://www.lemonde.fr/economie/article/2026/04/08/40-euros-pour-17-litres-de-carburant-a-la-station-service-les-inegalites-se-creusent-au-moment-de-faire-le-plein_6678193_3234.html

  • [^] # Re: Y'a un truc qui me chiffonne

    Posté par  . En réponse au lien The Reverse Rewrite. Évalué à 2 (+0/-1).

    Mais avec cette définition, l'assembleur est probablement le langage le plus expressif: celui qui permet de tout faire. Pour moi ça pointe vers le fait que ce n'est pas vraiment la bonne notion ici.

    Ben plutôt pas. Prend une feature présente en C++ et pas en asm, les template par exemple, les traduire en asm nécessite une transformation complexe, la compilation carrément, avec un programme qui n'a rien à voir et qui a perdu la généricité. Dans l'autre sens si tu comptes qu'on peut utiliser de l'asm (c'est tricher mais …) dans un programme C++ … C++ est strictement plus expressif que l'asm.

    Dans un autre sens simuler une machine ASM en C++ permet de réutiliser le programme asm sans trop trop d'efforts, et là on a pas spécifié la relation entre le langage et l'implémentation ou la machine.

    To avoid restrictive assumptions about the set of programming languages, the
    Gefinition only requires that the semantics observe the termination behavior of
    programs.

    Il y a une nécessité de terminaison, et on peut quand même donc supposer que la correction des programmes est un critère. Pour un accès hors borne, par exemple, on a un comportement non défini y compris en asm, donc on ne peut plus supposer que le programme termine … pour moi donc si le programme en Rust ne compile pas il n'y a pas perte d'expressivité par rapport à l'assembleur.

  • [^] # Re: lien du lien et commentaires

    Posté par  . En réponse au journal Du rififi à la Document Foundation. Évalué à 9 (+7/-1).

    On ne vit pas dans un capitalisme ou l'objectif est que les salariés se répartissent les gains, en règle générale. On vit dans un capitalisme ou certains milliardaires trouvent qu'ils ou elles ne sont pas assez taxées et ou les actionnaires majoritaires visent la rentabilité de leurs actions.

    Et c'est systémique, revendiqué, tu trouveras plein de gens pour argumenter que l'objectif d'une entreprise capitaliste c'est le profit et point barre, et que c'est plus efficace si le riche s'occupe de redistribuer par charité en supprimant le salaire minimum et empêcher les syndicats d'avoir du pouvoir.

    Quand c'est écrit dans le statut juridique et qu'il faut se battre pour faire évoluer ça et introduire des trucs comme la RSE, c'est difficile d'argumenter sur le fait que rien ne dépend du statut et que c'est juste dépendant des gens qui occupent la structure. On est formatés d'une certaine manière, et des puissants utilisent la législation et l'influence autant que possible pour maintenir cet état de fait. Les structures individuelles peuvent lutter, sûrement … Fait voir qui survit et qui gagne le combat dans les contraintes du système dans cette ambiance de darwinisme social des structures qui visent je profit.

  • [^] # Re: "Merci la crise sur le marché des composants électroniques"

    Posté par  . En réponse au lien chez Volkswagen les boutons physiques font leur grand retour. Évalué à 2 (+1/-2).

    Un réseau de transport en commun dense et fréquent est aussi pas mal intensif en énergie.

    Voir par exemple cette étude sur les émissions des bus pendant les confinement :https://link.springer.com/article/10.1186/s42834-022-00146-7

    Le taux de remplissage des bus est important pour optimiser les émissions … Du coup pour les zones peu denses ca peut vouloir dire peu de fréquence et peu de lignes, donc des temps de trajets longs … Pas forcément ce que cherchent les gens qui sont installés en 3ème couronne pour emmener leurs gosses aux différentes activités qu'on a vendu en mode de vie ces dernières décennies.