C'est pas le même concept. Voir La France périphérique. Utilisé à la base plutot pour les personnes contraintes à un lieu de vie loin des centres urbains par défaillance des politiques publiques, dans des territoires sous-dotés. (Après lecture de wp par contre l'essai du géographe lié a une lecture au bord du racisme, c'est peut être pas la def de l'institut jaurès)
C'est pas la question de pas être capable d'apprendre ou de comprendre, c'est plutôt tout les gens qui ont un ordi ou une tablette chez eux mais qui ne l'allumaient quasi jamais ou juste pour un truc particulier genre "regarder la télé le soir dans son lit".
Et qui se sont retrouvé avec un smartphone dans les pattes en sortant de chez le vendeur de téléphone un jour ou ils voulaient en changer. Et c'est tout en terme de formation. Il y en a un certain nombre.
Alors qu'en vrai le contremaître il ne comprend pas pourquoi tu perds ton temps à réimplémenter unicode :) Tu ploies sous le joug des chaînes dans lesquelles tu t'es enfermé et a perdu la clé !
T'es pas prêt pour l'utilisation de masse de l'informatique. La majorité des utilisateurs ne savent pas vraiment ce qu'est le compte administrateur d'une machine, probablement.
C'est des logiques de sécurité aussi, dans un monde ou on installe des trucs qui viennent d'à droite à gauche, t'as pas forcément envie que le jeu installé par le petit dernier vienne fouiller n'importe ou dans ton arborescence.
Dans les objectifs, il y a aussi réfléchir en amont à ce que devrait faire l'application, ou lever des lièvres pendant le développement, trucs à causer avec les utilisateurs … . Les tests écrits au préalables ne sont pas non plus supposés restés figés, si il s'avère que la specification initiale envisagée est mauvaise …
Faut du courage et se boucher le nez pour lire les commentaires. On le sait bien, pourtant … c'est un festival. Entre les (paraphrase) « mais les arabes ils ont des esclaves » « c'était les africains qui les vendaient eux même » c'est un festival de clichés de wannabe esclavagistes.
Pour la référence que Maderieros semble avoir raté, le journal Je hais les thèmes sombres, et je peux l'expliquer ou on peut plutôt lire que pour les malvoyants en général, c'est plutôt mieux pour la lisibilité, le blanc partout.
Faut faire attention, je pense que le scraping constants c'est pas forcément pour constituer les jeux de données, il doit y avoir une part d'agents qui font des recherches sur le net pour faire des synthèses en fonction des requêtes des utilisateurs, et intuitivement ça doit être largement plus ce style de requêtes qu'on voit que celles pour la constitution de jeux de données.
Sinon je crois qu'il existe quand même des modèles qui détectent les générations. Je sais pas s'ils sont utilisés, mais je pense que maintenant la qualité du jeu de données et que des filtres sophistiqués sont mis en œuvre pour scorer et filtrer : https://www.catalyzex.com/paper/lp-data-pipeline-lightweight-purpose-driven
Qui peuvent eux même utiliser des modèles pour détecter des trucs. Il existe des modèles qui sont spécifiquement entraînés pour détecter les textes générés par d'autres modèles : https://github.com/TAL-auroraX/ResoFilter (on sait que les modèles ont des biais ou des tics qu'il est possible de détecter par apprentissage spécifique, on doit pouvoir faire ça pour les modèles principaux)
Alors on pouvait déjà s'inquiéter pour le climat avec le boom de l'IA quand les GAFAMS ont dit "fuck la neutralité carbone". Ce n'est que la suite logique du déroulement des opérations. Non seulement ça fout en l'air leurs objectifs en propre mais aussi ça rentre en concurrence (financière par ex.) avec les potentiels efforts de décarbonation des autres.
L'argent d'abord, toujours, et l'argent vite. Pour la transition de l'énergie ça marche quand c'est vraiment la merde genre "il n'y a plus du tout de pétrole" ou "oups c'est la guerre et on bouffe du pétrole vraiment trop vite, quand ça s'arrête tout s'arrête, on a vraiment besoin d'une alternative". Mais on peut craindre que quand ça va repartir … ben le pétrole sera cramé quand même, on profitera juste de plus d'énergie sous forme d'électricité, ptete pour l'IA pour … whatever. Faire de l'argent à court terme.
Ben quoi, l'industrie pétrolière fait d'énorme profits, on va quand même pas faire une croix sur tout cet argent en investissant dans les renouvelables !
les données initiales non synthétiques c'est le jeu de donnée d'apprentissage initial. Par exemple une banque d'image, ou un ensemble de texte écrits par des humains, utilisé pour l'apprentissage du modèle.
synthetic_data(model) c'est des données synthétiques, c'est à dire générées en utilisant le modèle, d'une manière ou d'une autre. Dans son algorithmes ces données générées en utilisant le modèle sont ajoutées au jeu de donnée initial pour faire apprendre la génération suivante de modèle.
Si ça laisse pas un nuage de poussière qui va tout masquer et mettre de l'aluminium qui va déstabiliser la chimie de l'atmosphère pendant des plombes …
[^] # Re: Rappel
Posté par thoasm . En réponse au journal Ce virus qui vous hante. Évalué à 8 (+6/-1).
Je suis d'accord, ils ont une responsabilité sur les informations qui sont diffusées ou pas. Comme toi. Comme moi.
Et justement, les bêtises nuisibles, si elles ne sont pas trop diffusées, c'est très bien.
[^] # Re: "périphérique"
Posté par thoasm . En réponse au lien [HS]Mettre la TNT hors-jeu ? Le spectre d’un nouveau match perdu pour la France périphérique. Évalué à 4 (+1/-0).
Et pourquoi c'est plus un thème de com pol et médiatique qu'un concept géographique pertinent : https://theconversation.com/pourquoi-limage-dune-france-peripherique-peuplee-delecteurs-en-colere-ne-resiste-pas-a-lexamen-274891
C'est une opposition qui ne fonctionne pas bien pour décrire les inégalités des territoires en France.
[^] # Re: "périphérique"
Posté par thoasm . En réponse au lien [HS]Mettre la TNT hors-jeu ? Le spectre d’un nouveau match perdu pour la France périphérique. Évalué à 4 (+1/-0). Dernière modification le 17 mai 2026 à 10:27.
C'est pas le même concept. Voir La France périphérique. Utilisé à la base plutot pour les personnes contraintes à un lieu de vie loin des centres urbains par défaillance des politiques publiques, dans des territoires sous-dotés. (Après lecture de wp par contre l'essai du géographe lié a une lecture au bord du racisme, c'est peut être pas la def de l'institut jaurès)
[^] # Re: nan mais lol
Posté par thoasm . En réponse au journal On nous cache tout on nous dit rien (rendez-moi mon filesystem !). Évalué à 3 (+0/-0).
C'est pas la question de pas être capable d'apprendre ou de comprendre, c'est plutôt tout les gens qui ont un ordi ou une tablette chez eux mais qui ne l'allumaient quasi jamais ou juste pour un truc particulier genre "regarder la télé le soir dans son lit".
Et qui se sont retrouvé avec un smartphone dans les pattes en sortant de chez le vendeur de téléphone un jour ou ils voulaient en changer. Et c'est tout en terme de formation. Il y en a un certain nombre.
[^] # Re: chiengpt 3000
Posté par thoasm . En réponse au journal Écrire un texte dans des systèmes d’écriture différents. Évalué à 5 (+3/-1).
Alors qu'en vrai le contremaître il ne comprend pas pourquoi tu perds ton temps à réimplémenter unicode :) Tu ploies sous le joug des chaînes dans lesquelles tu t'es enfermé et a perdu la clé !
[^] # Re: qu'est ce qui vous gêne ?
Posté par thoasm . En réponse au journal [LinuxFr] Confiance, IA et contenu. Évalué à 5 (+2/-0).
Ils s'en foutent ça leur coute pas grand chose de demander à un agent de publier des articles sur les sites "identifiés comme" pertinents, peut être.
[^] # Re: Evidemment !!!
Posté par thoasm . En réponse au journal ELY - Un agent IA auto-hébergé conforme RGPD avec anonymisation native. Évalué à 5 (+2/-0).
Open Source au sens de l'OSI et libre, c'est quasi synonyme.
[^] # Re: nan mais lol
Posté par thoasm . En réponse au journal On nous cache tout on nous dit rien (rendez-moi mon filesystem !). Évalué à 3 (+0/-0).
T'es pas prêt pour l'utilisation de masse de l'informatique. La majorité des utilisateurs ne savent pas vraiment ce qu'est le compte administrateur d'une machine, probablement.
[^] # Re: nan mais lol
Posté par thoasm . En réponse au journal On nous cache tout on nous dit rien (rendez-moi mon filesystem !). Évalué à 3 (+0/-0).
C'est des logiques de sécurité aussi, dans un monde ou on installe des trucs qui viennent d'à droite à gauche, t'as pas forcément envie que le jeu installé par le petit dernier vienne fouiller n'importe ou dans ton arborescence.
[^] # Re: Rien de nouveau, non?
Posté par thoasm . En réponse au lien Le culte du TDD et des LLMs. Évalué à 5 (+2/-0).
Dans les objectifs, il y a aussi réfléchir en amont à ce que devrait faire l'application, ou lever des lièvres pendant le développement, trucs à causer avec les utilisateurs … . Les tests écrits au préalables ne sont pas non plus supposés restés figés, si il s'avère que la specification initiale envisagée est mauvaise …
[^] # Re: Utilisateur presque satisfait.
Posté par thoasm . En réponse au lien Celebrating CoMaps' first birthday. Évalué à 3 (+1/-1).
C'est possible de faire des itinéraires entre deux lieux arbitraires.
[^] # Re: Les commentaires
Posté par thoasm . En réponse au lien La nouvelle municipalité d'extrême droite de Vierzon (Cher) annule la commémoration de l'abolition de l'esclavage du 10 mai. Évalué à 9 (+8/-2).
Plus que la qualité de l'argumentaire, ca montre qu'il existe en France une frange de racistes n'ayant aucun problème moral avec l'esclavage.
# Les commentaires
Posté par thoasm . En réponse au lien La nouvelle municipalité d'extrême droite de Vierzon (Cher) annule la commémoration de l'abolition de l'esclavage du 10 mai. Évalué à 4 (+4/-3).
Faut du courage et se boucher le nez pour lire les commentaires. On le sait bien, pourtant … c'est un festival. Entre les (paraphrase) « mais les arabes ils ont des esclaves » « c'était les africains qui les vendaient eux même » c'est un festival de clichés de wannabe esclavagistes.
# Rappel, la pétition à l'assemblée pour que l'état quitte X
Posté par thoasm . En réponse au lien Elon Musk insulte les magistrats français chargés d’enquêter sur de possibles abus de son réseau social X. Évalué à 10 (+14/-1).
https://petitions.assemblee-nationale.fr/initiatives/i-2610
[^] # Re: Ne tirez pas sur le pianiste !
Posté par thoasm . En réponse au lien Annonce du nouveau site de LibreOffice. Évalué à 2 (+1/-2).
Pour la référence que Maderieros semble avoir raté, le journal Je hais les thèmes sombres, et je peux l'expliquer ou on peut plutôt lire que pour les malvoyants en général, c'est plutôt mieux pour la lisibilité, le blanc partout.
[^] # Re: Paradoxal
Posté par thoasm . En réponse au lien Infographies concernant les symboles d'extrême-droite. Évalué à 4 (+2/-1).
https://indextreme.fr/a-propos/
[^] # Re: Ce mec est un génie !
Posté par thoasm . En réponse au lien iPhone : John Ternus tranche entre réparabilité et longévité. Évalué à 4 (+2/-1).
Je me demande aussi quelle est la part d'obsolescence logicielle dans le fait qu'un tel soit remplacé …
[^] # Re: Inventer plutôt que saboter
Posté par thoasm . En réponse au lien Faut-il saboter les datacenters ? (entretien avec Thomas Dekeyser). Évalué à 8 (+6/-1).
Si les adversaires sont des drones armés le mot "lutte" risque de prendre un sens un peu différent, cela dit.
[^] # Re: La machine
Posté par thoasm . En réponse au lien Plaques astronomiques : le retour à la lumière (Sciences chrono, France Culture). Évalué à 2 (+0/-1).
Chaque tartiflette est unique de ce point de vue en plus. Voire dynamique, faut faire des vidéos.
[^] # Re: Un appel en régie
Posté par thoasm . En réponse au journal Les IA sont-elles courtoises ?. Évalué à 5 (+3/-1).
Qui plus est … ça n'a aucun rapport avec le contenu du journal. Ce n'est en rien un résumé.
[^] # Re: Fil mastodon qui discute le papier
Posté par thoasm . En réponse au lien AI Cannot Self Improve and Math behind PROVES IT!. Évalué à 3 (+1/-1).
Faut faire attention, je pense que le scraping constants c'est pas forcément pour constituer les jeux de données, il doit y avoir une part d'agents qui font des recherches sur le net pour faire des synthèses en fonction des requêtes des utilisateurs, et intuitivement ça doit être largement plus ce style de requêtes qu'on voit que celles pour la constitution de jeux de données.
Sinon je crois qu'il existe quand même des modèles qui détectent les générations. Je sais pas s'ils sont utilisés, mais je pense que maintenant la qualité du jeu de données et que des filtres sophistiqués sont mis en œuvre pour scorer et filtrer : https://www.catalyzex.com/paper/lp-data-pipeline-lightweight-purpose-driven
Qui peuvent eux même utiliser des modèles pour détecter des trucs. Il existe des modèles qui sont spécifiquement entraînés pour détecter les textes générés par d'autres modèles : https://github.com/TAL-auroraX/ResoFilter (on sait que les modèles ont des biais ou des tics qu'il est possible de détecter par apprentissage spécifique, on doit pouvoir faire ça pour les modèles principaux)
[^] # Re: Il ne nous reste plus qu'un mème à sortir
Posté par thoasm . En réponse au journal La crise économique qui vient. Évalué à 7 (+5/-1).
Alors on pouvait déjà s'inquiéter pour le climat avec le boom de l'IA quand les GAFAMS ont dit "fuck la neutralité carbone". Ce n'est que la suite logique du déroulement des opérations. Non seulement ça fout en l'air leurs objectifs en propre mais aussi ça rentre en concurrence (financière par ex.) avec les potentiels efforts de décarbonation des autres.
L'argent d'abord, toujours, et l'argent vite. Pour la transition de l'énergie ça marche quand c'est vraiment la merde genre "il n'y a plus du tout de pétrole" ou "oups c'est la guerre et on bouffe du pétrole vraiment trop vite, quand ça s'arrête tout s'arrête, on a vraiment besoin d'une alternative". Mais on peut craindre que quand ça va repartir … ben le pétrole sera cramé quand même, on profitera juste de plus d'énergie sous forme d'électricité, ptete pour l'IA pour … whatever. Faire de l'argent à court terme.
[^] # Re: Il ne nous reste plus qu'un mème à sortir
Posté par thoasm . En réponse au journal La crise économique qui vient. Évalué à 7 (+6/-2).
Ben quoi, l'industrie pétrolière fait d'énorme profits, on va quand même pas faire une croix sur tout cet argent en investissant dans les renouvelables !
[^] # Re: Fil mastodon qui discute le papier
Posté par thoasm . En réponse au lien AI Cannot Self Improve and Math behind PROVES IT!. Évalué à 4 (+2/-1).
les données initiales non synthétiques c'est le jeu de donnée d'apprentissage initial. Par exemple une banque d'image, ou un ensemble de texte écrits par des humains, utilisé pour l'apprentissage du modèle.
synthetic_data(model) c'est des données synthétiques, c'est à dire générées en utilisant le modèle, d'une manière ou d'une autre. Dans son algorithmes ces données générées en utilisant le modèle sont ajoutées au jeu de donnée initial pour faire apprendre la génération suivante de modèle.
[^] # Re: Nuit des étoiles filantes
Posté par thoasm . En réponse au lien Dans pas longtemps sur vos écrans : « OMG, Starlink is down ! ». Évalué à 5 (+3/-1).
Si ça laisse pas un nuage de poussière qui va tout masquer et mettre de l'aluminium qui va déstabiliser la chimie de l'atmosphère pendant des plombes …