Et puis un sujet est "qu'est-ce qu'on peut en dire de manière fiable si on sort des auto-sourçages". Si il y avait un bouquin édité sur l'histoire de linuxfr (et de la communauté libriste francophone) il y aurait plein de trucs à dire. Qui écrit cette histoire ?
Ce n'est pas en soi un critère. Ce type de cas, si on sort de l'opensource, c'est une zone grise et ça dépend des appréciations. On a probablement vu des articles sur des sujets davantage référencé à l'extérieur se faire supprimer et aussi l'inverse. Ainsi va Wikipédia, et la plupart du temps tout le monde s'en fout.
Question bibliographie, il y a quand même des trucs très intéressants : La bibliothèque Wikipédia fournit l'accès à des bases d'articles scientifiques et autres qui veulent bien jouer le jeu aux contributeurs pour condition de justifier d'un minimum d'activité.
Hasard du jour, Jules*, un contributeur qui a pas mal mouillé le maillot et subit quelques désagréments pour sa contribution, remarque que ça ne remplit pas le frigo :)
Ce bandeau est probablement complètement anecdotique, en vrai, les contributeurs utilisent bien ce qu'ils veulent et tous les habitués ont leur méthode. Si les gens on l'habitude de piocher dans les BDD d'articles de recherche, ils le feront. A contrario on va pas tout mettre dans un bandeau générique.
C'est l'éternelle histoire des supressionnistes et des inclusionnistes. Dans les début de Wikipédia c'était un peu plus simple et il y avait une forte communauté libriste qui pesait un peu dans les décisions.
Aujourd'hui c'est moins le cas et le projet a eu des tas d'article d'entreprises pour la visibilité ou le SEO, et la communauté ne veut surtout pas servir de support publicitaire. Donc les critères se sont resserrés, le point de vue inclusionniste a été plus difficile à tenir et le débat a épuisé pas mal de monde. Les nouveaux prennent les critères plus au sérieux et certains font un ménage qu'ils voulaient faire depuis longtemps en attendant que les choses se tassent.
De surcroît maintenant il n'y a souvent quasi aucun vote sur les pages débat d'admissibilité … Le projet évolue constamment et il y a probablement besoin d'un peu d'air avec l'apparition des IAs pour ne pas mourir à petit feu.
Une rapide recherche montre qu'il s'agit des hotels "de luxe". Un ptit détail de rien du tout. Du personnel de maison bien payé chez les richards pour endurer toute sorte de merde ? Pas une grosse innovation.
Pendant ce temps … dans la même recherche, autre titre « Une économie à deux vitesses : aux Etats-Unis, les 10 % des ménages les plus aisés concentrent près de la moitié des dépenses » d'un article de Challenge.
Après on peut mettre en rapport les deux infos et si on est honnête en tirer quelque leçon.
Et sur l'IA … un emploi remplacé par un robot dans un motel miteux des USA ? Les femmes de ménage vont voir leur niveau de vie exploser, clairement, dans ces endroits.
On peut rapprocher ça du compromis espace / temps en complexité informatique. Tu peux t'épargner (parfois beaucoup) de temps en mémorisant beaucoup de mémoire pour éviter certains calculs. Si tu ne mémorises rien, tu seras potentiellement obligé de faire et refaire encore certains calculs, sans utiliser de mémoire, mais au risque que le calcul prennent bien trop de temps.
Il y a donc un compromis à trouver entre calcul et mémorisation … Mais ne rien mémoriser et faire trop de calculs, d'intelligence donc si je pousse un peu malhonnêtement ton point, c'est probablement très bête et un mauvais compromis.
Donc … il n'y a pas d'opposition entre mémoriser et faire les choses intelligemment. Le truc est de trouver les trucs à mémoriser féconds. Je parierai que dans les IAs, c'est exactement ce que font certains patterns abstraits que reconnaissent des couches hautes des réseaux de neurones profonds.
C'est une opposition stérile. Évidemment que si tu connais déjà la solution à un problème tu l'as immédiatement et sans aucun indice. Tu n'as pas spécialement à mobiliser d'intelligence par contre …
D'un autre côté certains problèmes sont quasi-insolubles sans une certaine dose de connaissance. C'est pas parce que tu as ces connaissances à la base que tu es bête, par contre.
Mauvaise transposition, en supposant que ce soit pertinent de faire le parallèle.
On est face à des entreprises avec des moyens sans commune mesure avec les humains (la quasi totalité disons) qui sont récidivistes, on va pas dire "multi" parce que c'est pas le bon préfixes. Elles pompent tout ce qui leur passe sous la main sans aucune considération légale.
Pour ces histoires massives on fait pas comme si c'était quelqu'un qui a volé un truc une fois. Déjà tu le fais deux fois, en tant que personne normale, t'es considéré récidiviste et t'es pas traité pareil. Alors pour des "multi-*-récidivistes" avec moyens infinis … Aucun parallèle à faire.
Pour ce genre de cas ou c'est tellement massif on fait des systèmes particuliers. Des licences globales par exemple. On a envie de remplir les tribunaux avec ce genre de cas ? Ils débordent déjà.
La citation des auteurs des codes sources fait souvent partie des conditions de réutilisation d'un code libre aussi, c'est l'attribution.
Les données d'apprentissage des IAs c'est complètement l'inverse de tout ça. L'IA avale tout sans distinction, synthétise des réponses qui découlent largement des données avalées et qui vont être plus ou moins bonnes en fonction de la qualité des données avalées … sans vraiment citer en première intention ces données, ni d'ou elles viennent, et raconte des trucs faux (sans réelle source) comme des trucs vrais (avec peut être des vraies sources mais ou sont-elles ? Faisons une recherche web pour confirmer) avec autant d’aplomb.
Le rapport avec ce projet de loi ? Si tu t'es fait piller des données, c'est à toi d'apporter la preuve. C'est l'exact inverse d'une certaine bienséance qui prévalait jusque là dans bien des milieux. Un genre de rupture ontologique.
Devise de l'université de Standford "We're standing on the shoulders of giants". Le savoir est cumulatif parce qu'on s'appuie sur le travail de nos prédécesseurs pour fabriquer de nouveaux savoirs.
Dans le monde universitaire et de la recherche on cite toujours ses sources dans les articles pour toute affirmation non triviale. C'est la liste de citation à la fin des articles de recherche par exemple. On publie des critiques de certains travaux si on les pense erroné. On fait dépublier les fraudes. Faire du pompage de travaux de collègues sans les citer est une faute professionnelle (cf. l'affaire Étienne Klein par ex).
Ça permet de maintenir une chaîne du travail scientifique. Sur quels travaux préalables s'appuie telle découverte ? Quelle technique a été utilisée ? Ou sont les données (aujourd'hui ?)
Il ne s'agit pas de ses savoirs propres. Quoi que, tu peux oublier des trucs c'est certain … n'empêche tu t'appuies généralement sur ce que tu sais déjà pour avancer et éventuellement apprendre d'autres choses.
C'est dans l'article, "erreur d'échelle ?" il me semble. Mais dans une telle audition, c'est moche non ? Le manque de précision c'est un peu l'objet de l'article. Envoyer des chiffres qui en jettent mais … qui veulent dire quoi ? qui sortent d'ou ?
Ça n'empêche pas le procès, et là bon je vois rien d'équivalent à ton exemple dans les circonstances. Il y a pas de panneau "attention je trolle" en tout cas, c'est un peu l'inverse par principe.
Dans tout les cas, ça n'empêche pas l'enquêtes et donc les potentielles recherches de preuves.
Steam n'est pas tenu de garder une copie justement sur ce genre de cas éventuels en tant que distributeur ?
Après pour la justice, il est possible que l'intention soit juste une donnée comme une autre, mais que si c'est illégal que ce soit un troll ou pas ça ne passe pas. Tu peux pas tuer quelqu'un et t'en tirer en disant "troll, perché".
Là ou c'est intéressant c'est quand on fait de la preuve de programme, ça élimine carrément (presque) certaines classes de failles, ce que Rust fait en partie.
La preuve formelle de programme c'est traditionnellement un gros effort et c'est très peu fait. Là quelqu'un de compétent peut faire ce qui aurait pris énormément de temps pour un programme non trivial, un compilateur, et prouver formellement une partie significative, en étant aussi assistant de l'IA que l'inverse. C'est assez remarquable et ça va bien plus loin que la chasse aux failles.
Rust on doit être pas loin d'en parler autant qu'au pic de la "hype". L'IA … on risque de n'en plus entendre parler parce que c'est devenu naturel et très facile de causer avec ses appareils. C'est déjà le cas pour plein de gens.
Mais c'est tellement une étiquette qui recouvre des réalités très différentes que c'est dur d'en parler comme ça en gros, et c'est dommageable d'ailleurs. Le malheur est qu'on a des modèles à "tout" faire qui en pratique sont hyper couteux pour certaines tâches, très mauvais pour d'autres, et appropriés à quelques trucs si on les utilisait avec parcimonie.
[^] # Re: pertinence de la page wikipedia
Posté par thoasm . En réponse au journal Eh, réveillez-vous, LinuxFr.org est en train de se faire supprimer de Wikipédia ! 😱. Évalué à 5 (+2/-0).
Et puis un sujet est "qu'est-ce qu'on peut en dire de manière fiable si on sort des auto-sourçages". Si il y avait un bouquin édité sur l'histoire de linuxfr (et de la communauté libriste francophone) il y aurait plein de trucs à dire. Qui écrit cette histoire ?
[^] # Re: pertinence de la page wikipedia
Posté par thoasm . En réponse au journal Eh, réveillez-vous, LinuxFr.org est en train de se faire supprimer de Wikipédia ! 😱. Évalué à 3 (+0/-0).
Ce n'est pas en soi un critère. Ce type de cas, si on sort de l'opensource, c'est une zone grise et ça dépend des appréciations. On a probablement vu des articles sur des sujets davantage référencé à l'extérieur se faire supprimer et aussi l'inverse. Ainsi va Wikipédia, et la plupart du temps tout le monde s'en fout.
[^] # Re: Auto référence ?
Posté par thoasm . En réponse au journal Eh, réveillez-vous, LinuxFr.org est en train de se faire supprimer de Wikipédia ! 😱. Évalué à 4 (+1/-0).
Question bibliographie, il y a quand même des trucs très intéressants : La bibliothèque Wikipédia fournit l'accès à des bases d'articles scientifiques et autres qui veulent bien jouer le jeu aux contributeurs pour condition de justifier d'un minimum d'activité.
# Une partie de la réponse peut-être ?
Posté par thoasm . En réponse au journal Eh, réveillez-vous, LinuxFr.org est en train de se faire supprimer de Wikipédia ! 😱. Évalué à 4 (+1/-0).
Hasard du jour, Jules*, un contributeur qui a pas mal mouillé le maillot et subit quelques désagréments pour sa contribution, remarque que ça ne remplit pas le frigo :)
[^] # Re: Auto référence ?
Posté par thoasm . En réponse au journal Eh, réveillez-vous, LinuxFr.org est en train de se faire supprimer de Wikipédia ! 😱. Évalué à 4 (+1/-0).
Ce bandeau est probablement complètement anecdotique, en vrai, les contributeurs utilisent bien ce qu'ils veulent et tous les habitués ont leur méthode. Si les gens on l'habitude de piocher dans les BDD d'articles de recherche, ils le feront. A contrario on va pas tout mettre dans un bandeau générique.
Tu as mieux, sinon ?
[^] # Re: C'est comme ça que nos projets ont été effacés ...
Posté par thoasm . En réponse au journal Eh, réveillez-vous, LinuxFr.org est en train de se faire supprimer de Wikipédia ! 😱. Évalué à 8 (+5/-0).
C'est l'éternelle histoire des supressionnistes et des inclusionnistes. Dans les début de Wikipédia c'était un peu plus simple et il y avait une forte communauté libriste qui pesait un peu dans les décisions.
Aujourd'hui c'est moins le cas et le projet a eu des tas d'article d'entreprises pour la visibilité ou le SEO, et la communauté ne veut surtout pas servir de support publicitaire. Donc les critères se sont resserrés, le point de vue inclusionniste a été plus difficile à tenir et le débat a épuisé pas mal de monde. Les nouveaux prennent les critères plus au sérieux et certains font un ménage qu'ils voulaient faire depuis longtemps en attendant que les choses se tassent.
De surcroît maintenant il n'y a souvent quasi aucun vote sur les pages débat d'admissibilité … Le projet évolue constamment et il y a probablement besoin d'un peu d'air avec l'apparition des IAs pour ne pas mourir à petit feu.
[^] # Re: Epic Linuxférisation 🍾
Posté par thoasm . En réponse au lien L'Etat rompt avec l'américain Palantir et choisit le français ChapsVision pour la DGSI. Évalué à 6 (+3/-0).
Échappe toi par la tribune, vite !
# Note a posteriori : site généré par IA relue par des humains
Posté par thoasm . En réponse au lien Landmark German ruling declares Google's AI Overviews are Google's own words and makes it liable for false answers. Évalué à 3 (+0/-0).
Voilà. Je ne sais que faire de cette information.
Lien dans la presse "classique" : https://www.reuters.com/world/google-appeal-german-court-ruling-assigning-liability-ai-overviews-false-claims-2026-06-12/
# via Science4all
Posté par thoasm . En réponse au lien Landmark German ruling declares Google's AI Overviews are Google's own words and makes it liable for false answers. Évalué à 4 (+1/-0).
Dans le cadre d'un fil sur la veille des législations des algos de recommandation et autre : https://bsky.app/profile/science4all.org/post/3me7czfpvq227
[^] # Re: Ctrl-c Ctrl-v
Posté par thoasm . En réponse au lien La proposition de loi sur le droit d’auteur et l’IA torpillée à l’Assemblée après un vote au Sénat à l’unanimité. Évalué à 6 (+3/-0).
C'est pas le point, mais sinon se tu tiens à le savoir pourquoi pas aller chercher l'info et filer un lien ?
[^] # Re: Ctrl-c Ctrl-v
Posté par thoasm . En réponse au lien La proposition de loi sur le droit d’auteur et l’IA torpillée à l’Assemblée après un vote au Sénat à l’unanimité. Évalué à 6 (+3/-0).
Source, cet article titre sur "les hôtels de luxe" :
Hôtellerie : les femmes de ménage des hôtels de luxe de New York bientôt payées 100 000 dollars de salaire par an
[^] # Re: Ctrl-c Ctrl-v
Posté par thoasm . En réponse au lien La proposition de loi sur le droit d’auteur et l’IA torpillée à l’Assemblée après un vote au Sénat à l’unanimité. Évalué à 5 (+2/-0). Dernière modification le 13 juin 2026 à 14:01.
Une rapide recherche montre qu'il s'agit des hotels "de luxe". Un ptit détail de rien du tout. Du personnel de maison bien payé chez les richards pour endurer toute sorte de merde ? Pas une grosse innovation.
Pendant ce temps … dans la même recherche, autre titre « Une économie à deux vitesses : aux Etats-Unis, les 10 % des ménages les plus aisés concentrent près de la moitié des dépenses » d'un article de Challenge.
Après on peut mettre en rapport les deux infos et si on est honnête en tirer quelque leçon.
Et sur l'IA … un emploi remplacé par un robot dans un motel miteux des USA ? Les femmes de ménage vont voir leur niveau de vie exploser, clairement, dans ces endroits.
[^] # Re: tout ça pour ça
Posté par thoasm . En réponse au lien Arthur Mensch, la grande esbrouffe. Évalué à 4 (+1/-0).
On peut rapprocher ça du compromis espace / temps en complexité informatique. Tu peux t'épargner (parfois beaucoup) de temps en mémorisant beaucoup de mémoire pour éviter certains calculs. Si tu ne mémorises rien, tu seras potentiellement obligé de faire et refaire encore certains calculs, sans utiliser de mémoire, mais au risque que le calcul prennent bien trop de temps.
Il y a donc un compromis à trouver entre calcul et mémorisation … Mais ne rien mémoriser et faire trop de calculs, d'intelligence donc si je pousse un peu malhonnêtement ton point, c'est probablement très bête et un mauvais compromis.
Donc … il n'y a pas d'opposition entre mémoriser et faire les choses intelligemment. Le truc est de trouver les trucs à mémoriser féconds. Je parierai que dans les IAs, c'est exactement ce que font certains patterns abstraits que reconnaissent des couches hautes des réseaux de neurones profonds.
[^] # Re: tout ça pour ça
Posté par thoasm . En réponse au lien Arthur Mensch, la grande esbrouffe. Évalué à 3 (+0/-0).
C'est une opposition stérile. Évidemment que si tu connais déjà la solution à un problème tu l'as immédiatement et sans aucun indice. Tu n'as pas spécialement à mobiliser d'intelligence par contre …
D'un autre côté certains problèmes sont quasi-insolubles sans une certaine dose de connaissance. C'est pas parce que tu as ces connaissances à la base que tu es bête, par contre.
[^] # Re: Gnu ?
Posté par thoasm . En réponse au lien A Definitive Splash. Évalué à 3 (+0/-0).
GNU Terry Pratchett
[^] # Re: La Dépêche
Posté par thoasm . En réponse au lien Un agriculteur donne son terrain pour en faire un parc, la ville le revend 10 millions de dollars pour y construire… un data center. Évalué à 5 (+2/-0).
C'est probablement pas la concurrence du contenu généré par IA qui va améliorer les titres.
# Arrosage
Posté par thoasm . En réponse au lien A Definitive Splash. Évalué à 4 (+1/-0).
https://bsky.app/profile/padrepio.bsky.social/post/3mo3idn2npk2j
[^] # Re: Ctrl-c Ctrl-v
Posté par thoasm . En réponse au lien La proposition de loi sur le droit d’auteur et l’IA torpillée à l’Assemblée après un vote au Sénat à l’unanimité. Évalué à 7 (+4/-0).
Mauvaise transposition, en supposant que ce soit pertinent de faire le parallèle.
On est face à des entreprises avec des moyens sans commune mesure avec les humains (la quasi totalité disons) qui sont récidivistes, on va pas dire "multi" parce que c'est pas le bon préfixes. Elles pompent tout ce qui leur passe sous la main sans aucune considération légale.
Pour ces histoires massives on fait pas comme si c'était quelqu'un qui a volé un truc une fois. Déjà tu le fais deux fois, en tant que personne normale, t'es considéré récidiviste et t'es pas traité pareil. Alors pour des "multi-*-récidivistes" avec moyens infinis … Aucun parallèle à faire.
Pour ce genre de cas ou c'est tellement massif on fait des systèmes particuliers. Des licences globales par exemple. On a envie de remplir les tribunaux avec ce genre de cas ? Ils débordent déjà.
[^] # Re: Ctrl-c Ctrl-v
Posté par thoasm . En réponse au lien La proposition de loi sur le droit d’auteur et l’IA torpillée à l’Assemblée après un vote au Sénat à l’unanimité. Évalué à 9 (+6/-0).
La citation des auteurs des codes sources fait souvent partie des conditions de réutilisation d'un code libre aussi, c'est l'attribution.
Les données d'apprentissage des IAs c'est complètement l'inverse de tout ça. L'IA avale tout sans distinction, synthétise des réponses qui découlent largement des données avalées et qui vont être plus ou moins bonnes en fonction de la qualité des données avalées … sans vraiment citer en première intention ces données, ni d'ou elles viennent, et raconte des trucs faux (sans réelle source) comme des trucs vrais (avec peut être des vraies sources mais ou sont-elles ? Faisons une recherche web pour confirmer) avec autant d’aplomb.
Le rapport avec ce projet de loi ? Si tu t'es fait piller des données, c'est à toi d'apporter la preuve. C'est l'exact inverse d'une certaine bienséance qui prévalait jusque là dans bien des milieux. Un genre de rupture ontologique.
[^] # Re: Ctrl-c Ctrl-v
Posté par thoasm . En réponse au lien La proposition de loi sur le droit d’auteur et l’IA torpillée à l’Assemblée après un vote au Sénat à l’unanimité. Évalué à 9 (+6/-0).
Devise de l'université de Standford "We're standing on the shoulders of giants". Le savoir est cumulatif parce qu'on s'appuie sur le travail de nos prédécesseurs pour fabriquer de nouveaux savoirs.
Dans le monde universitaire et de la recherche on cite toujours ses sources dans les articles pour toute affirmation non triviale. C'est la liste de citation à la fin des articles de recherche par exemple. On publie des critiques de certains travaux si on les pense erroné. On fait dépublier les fraudes. Faire du pompage de travaux de collègues sans les citer est une faute professionnelle (cf. l'affaire Étienne Klein par ex).
Ça permet de maintenir une chaîne du travail scientifique. Sur quels travaux préalables s'appuie telle découverte ? Quelle technique a été utilisée ? Ou sont les données (aujourd'hui ?)
Il ne s'agit pas de ses savoirs propres. Quoi que, tu peux oublier des trucs c'est certain … n'empêche tu t'appuies généralement sur ce que tu sais déjà pour avancer et éventuellement apprendre d'autres choses.
[^] # Re: trillion ?
Posté par thoasm . En réponse au lien Arthur Mensch, la grande esbrouffe. Évalué à 6 (+3/-0).
C'est dans l'article, "erreur d'échelle ?" il me semble. Mais dans une telle audition, c'est moche non ? Le manque de précision c'est un peu l'objet de l'article. Envoyer des chiffres qui en jettent mais … qui veulent dire quoi ? qui sortent d'ou ?
[^] # Re: Dommage pour la préservation du JV
Posté par thoasm . En réponse au lien un dev troll les joueurs racistes, les joueurs anti-racistes et Steam. Évalué à 3 (+0/-0). Dernière modification le 11 juin 2026 à 12:23.
Ça n'empêche pas le procès, et là bon je vois rien d'équivalent à ton exemple dans les circonstances. Il y a pas de panneau "attention je trolle" en tout cas, c'est un peu l'inverse par principe.
Dans tout les cas, ça n'empêche pas l'enquêtes et donc les potentielles recherches de preuves.
[^] # Re: Dommage pour la préservation du JV
Posté par thoasm . En réponse au lien un dev troll les joueurs racistes, les joueurs anti-racistes et Steam. Évalué à 4 (+1/-0). Dernière modification le 10 juin 2026 à 20:32.
Steam n'est pas tenu de garder une copie justement sur ce genre de cas éventuels en tant que distributeur ?
Après pour la justice, il est possible que l'intention soit juste une donnée comme une autre, mais que si c'est illégal que ce soit un troll ou pas ça ne passe pas. Tu peux pas tuer quelqu'un et t'en tirer en disant "troll, perché".
[^] # Re: Faut t'habituer
Posté par thoasm . En réponse au journal Les LLM: Langueur, Lassitude et Morosité. Évalué à 1 (+0/-2).
Là ou c'est intéressant c'est quand on fait de la preuve de programme, ça élimine carrément (presque) certaines classes de failles, ce que Rust fait en partie.
C'est peut être passé un peu inaperçu mais, voir ce lien … https://linuxfr.org/users/thoasm/liens/creation-supervisee-d-un-compilateur-prouve-formellement-par-de-l-iagen
La preuve formelle de programme c'est traditionnellement un gros effort et c'est très peu fait. Là quelqu'un de compétent peut faire ce qui aurait pris énormément de temps pour un programme non trivial, un compilateur, et prouver formellement une partie significative, en étant aussi assistant de l'IA que l'inverse. C'est assez remarquable et ça va bien plus loin que la chasse aux failles.
[^] # Re: 🤪
Posté par thoasm . En réponse au journal Les LLM: Langueur, Lassitude et Morosité. Évalué à 3 (+0/-0).
Rust on doit être pas loin d'en parler autant qu'au pic de la "hype". L'IA … on risque de n'en plus entendre parler parce que c'est devenu naturel et très facile de causer avec ses appareils. C'est déjà le cas pour plein de gens.
Mais c'est tellement une étiquette qui recouvre des réalités très différentes que c'est dur d'en parler comme ça en gros, et c'est dommageable d'ailleurs. Le malheur est qu'on a des modèles à "tout" faire qui en pratique sont hyper couteux pour certaines tâches, très mauvais pour d'autres, et appropriés à quelques trucs si on les utilisait avec parcimonie.