est-ce qu'on sait si le test ARC-AGI a été résolu (cassé ?) du fait que ces puzzles sont maintenant dans les données d'entrainement, ou parce que l'IA o3 d'OpenAI n'est plus démuni fasse aux situations totalement étrangères ?
Les puzzles ne sont pas dans les données d'entrainement (sinon cela n'aurait aucune valeur). Il y a des parties publiques du test et des parties privées (justement pour empêcher la triche).
Et le modèle o3 a bien résolu les puzzles privés.
Voir ici : https://arcprize.org/blog/oai-o3-pub-breakthrough
La page du test ARC-AGI dit bien the Grand Prize remains unclaimed et AGI remains unsolved.
Oui parce qu'il y a des conditions sur le budget alloué par tâche résolue. Et un LLM comme o3 est bien plus coûteux qu'un cerveau humain.
Mais l'article initial sur le site de la FNAC disait bien "ces puzzles ne sont pas dans leurs données d’entraînement. L’IA ne sait pas improviser. Elle est totalement démunie face à une situation qui lui est totalement étrangère" et c'est cette affirmation péremptoire qui a été complètement réfutée (et en plus cela a été réfuté un an avant l'écriture de l'article ce qui est un comble).
Ce qui est le plus problématique c'est (outre le biais anti-IA) le caractère daté des informations.
Par exemple l'article écrit :
"test redoutable, le ARC-AGI, composé de puzzles logiques visuels qu’un enfant peut résoudre, mais que les IA les plus puissantes échouent massivement. Pourquoi ? Parce que ces puzzles ne sont pas dans leurs données d’entraînement. L’IA ne sait pas improviser. Elle est totalement démunie face à une situation qui lui est totalement étrangère."
L'IA est tellement démunie que, fin 2024, le test ARC-AGI a été cassé par le modèle o3 d'OpenAI (88% des puzzles résolus).
François Chollet, auteur du test ARC-AGI, dit à ce sujet :
"Il ne s'agit pas d'une simple amélioration marginale, mais d'une véritable rupture, qui marque un changement qualitatif dans les capacités de l'IA par rapport aux limites antérieures des LLM".
Tout ceci est parfaitement et clairement expliqué dans le livre de Thibaut Giraud "La parole aux machines".
Il n'y a qu'à aller lire le premier commentaire épinglé :
"Talking about the ARC GPU Choice - It was never clarified in the video because both Linus/ Linus ended up continuing their conversations after being side tracked and never circled back. In our original email communications it is because Linus T drives 2 x 6K displays and needed something more than integrated graphics without being an annoying loud or power hungry "gaming" class GPU. It was suppose to be a lIntel Arc B50 but we could not get one in time of shooting. Linus T clarified he was still more than ok at the time of filming with this GPU being used".
un ordinateur n’est pas un cerveau et donc de différentier à coup sûr une IA d’un être humain : suffit de voir comment que c’est construit à l’intérieur
Ce qui nous intéresse ce n'est pas le hardware (comment c'est construit) mais le software (quels sont les effets de la cognition, comment la reconnaître).
Donc évoquer le fait que les IA et les humains ont un substrat hardware différent est complètement hors sujet.
Ça ne m'a jamais coûté de rater un coup de fil important : les gens légitimes laissent toujours un message.
Le livreur en bas de chez toi qui téléphone pour te signaler qu'il a ton paquet. Tu ne réponds pas alors il repart et tu es bon pour aller chercher ton paquet au dépôt hyper loin.
Merci à ceux qui ont déjà répondu et à ceux qui répondront !
Si certains veulent lire seulement les meilleures nouvelles de SF (et pas les autres) j'ai sur mon site perso une liste de près de 2000 nouvelles avec une note (et un résumé/commentaire pour bon nombre d'entre elles) :
Des audits de sécurité en 2014 et en 2015. Des résultats désastreux, cataclysmiques même, et puis après quoi ?
Pourquoi le directeur de l'époque n'a-t-il pas démissionné ? Pourquoi ne lui demande-t-on pas des comptes maintenant ?
Je me demande si d'autres personnes l'utilisent encore tout comme moi.
Oui j'utilise txt2tags. Sur mon site perso, hormis les pages générées par Tellico, tout est fait en exportant du txt2tags vers du HTML.
Dans le source on voit bien les:
<meta name="generator" content="https://txt2tags.org">
Après on parle d'un site perso statique plus que spartiate et qui ne bouge quasiment pas. J'avais choisi txt2tags à l'époque parce que c'était le truc le plus simple possible.
En revanche, je n'ai toujours pas compris cette notion d'injustice si un logiciel n'est pas libre.
Plutôt que de parler d'injustice je pense qu'il vaudrait mieux dire qu'un logiciel sous licence propriétaire va à l'encontre de l'éthique.
Il y a un (vieux) commentaire là-dessus qui fait une comparaison avec les biens matériel et en quoi un logiciel est fondamentalement différent ce qui entraîne une conclusion éthique différente : https://linuxfr.org/nodes/53024/comments/932032
C'est fou quand même. On te signale que ce qui est important, c'est la dangerosité pas la capacité de détecter. Et toi tu réponds par un autre lien vers une autre association militante qui titre également sur la détection de radioactivité.
"L’Organisation mondiale de la santé (OMS) recommande, sur la base des connaissances scientifiques relatives aux effets du tritium sur l’homme et l’environnement, une valeur guide de concentration dans l’eau à ne pas dépasser de 10000 Bq/Litre".
Et donc qu'est-ce qui a été détecté et qui motive les gros titres de ces associations anti-nucléaires militantes ?
"Châtellerault présente des niveaux parmi les plus importants relevés. La moyenne sur 2016 et 2017 est de 31 Bq/litre".
Mouhaha !
…mais en fait non, j'ai tort de rire.
Il ne faut pas rire mais plutôt pleurer en constatant l'aveuglement contre-productif de ces associations. Elles luttent stupidement contre une source d'énergie à bas carbone qui permet de combattre le vrai ennemi de l'humanité qui est la consommation effrénée d'énergie fossile.
L'énergie nucléaire n'est pas la panacée. Elle a des gros avantages et des gros défauts par rapport aux renouvelables.
Mais elle fait partie de la solution qu'il faut absolument mettre en œuvre pour nous désintoxiquer de ces foutues énergies fossiles.
Même avec elle ça va être monstrueusement difficile d'atteindre l'objectif. Alors on se passerait volontiers de ces attaques irrationnelles.
Le terme "contaminée" utilisée par le site reporterre.net et par la CRIIRAD te dit déjà tout ce qu'il y a à savoir au sujet de l'objectivité de ces associations purement militantes.
Ce n'est pas parce qu'on est capable de détecter quelque chose que c'est dangereux.
J'imagine qu'avec le progrès technologique et la capacité de détecter des niveaux de radioactivité de plus en plus infinitésimaux, la CRIIRAD va titrer que de plus en plus de communes sont contaminées. C'est dramatique, leur nombre augmente d'année en année !
Et oui, c'est fou ça, le nucléaire est géré par des ingénieurs spécialistes du domaine. On se demande bien pourquoi ce ne sont pas les votes d'une convention citoyenne qui décident de la montée ou de la descente des barres de contrôle.
Plus sérieusement, il suffit d'un coup d'œil sur une carte des émissions de CO2 pour constater qu'en dépit des renouvelables l'Allemagne continue à consommer des quantités ahurissantes de charbon.
Dans la perspective du changement climatique je suis bien content que la France n'ait pas suivi le même chemin.
au détriment des énergies renouvelables, énergies complémentaires entre elles, décentralisées, immédiatement disponibles
Le solaire et l'éolien sont "immédiatement disponibles" à tout moment ?
Tu racontes n'importe quoi. La disponibilité c'est justement le principal talon d'Achille de ces énergies.
quoi qu’on pense de l’œuvre et du personnage, il a montré une chose avec ce roman : l ’emploi d’un registre de langue soutenu, ou même simplement courant, n’est nullement un pré-requis à l’émergence de la matière littéraire.
"Céline, c'est souvent moins une débâcle de la langue qui s'écrit qu'un accident du tout-à-l'égout".
Julien Gracq.
le procureur de la République, ayant considéré qu’il n’y avait pas eu « d’intention de perturber l’ordre public ou de commettre un acte de délinquance », a demandé la simple confiscation de ses quatre brouilleurs, ainsi que le paiement du droit fixe de procédure.
Je conçois que lors de la première perquisition on ne puisse pas parler « d’intention de perturber l’ordre public ou de commettre un acte de délinquance ».
Mais le type a récidivé volontairement à plusieurs reprises et à chaque fois cela a brouillé toutes les fréquences du quartier et à chaque fois les agents de l'ANFR et les policiers ont du se déplacer au domicile de l'individu pour faire cesser l'infraction.
La mansuétude de la justice dans ce cas précis me semble malavisée et de nature à exaspérer la population.
[^] # Re: texte problématique
Posté par patrick_g (site web personnel) . En réponse au lien Pourquoi l’intelligence artificielle générale n’existera (sans doute) jamais. Évalué à 8 (+5/-0).
Les puzzles ne sont pas dans les données d'entrainement (sinon cela n'aurait aucune valeur). Il y a des parties publiques du test et des parties privées (justement pour empêcher la triche).
Et le modèle o3 a bien résolu les puzzles privés.
Voir ici : https://arcprize.org/blog/oai-o3-pub-breakthrough
[^] # Re: texte problématique
Posté par patrick_g (site web personnel) . En réponse au lien Pourquoi l’intelligence artificielle générale n’existera (sans doute) jamais. Évalué à 7 (+4/-0). Dernière modification le 29 décembre 2025 à 16:01.
Oui parce qu'il y a des conditions sur le budget alloué par tâche résolue. Et un LLM comme o3 est bien plus coûteux qu'un cerveau humain.
Mais l'article initial sur le site de la FNAC disait bien "ces puzzles ne sont pas dans leurs données d’entraînement. L’IA ne sait pas improviser. Elle est totalement démunie face à une situation qui lui est totalement étrangère" et c'est cette affirmation péremptoire qui a été complètement réfutée (et en plus cela a été réfuté un an avant l'écriture de l'article ce qui est un comble).
[^] # Re: texte problématique
Posté par patrick_g (site web personnel) . En réponse au lien Pourquoi l’intelligence artificielle générale n’existera (sans doute) jamais. Évalué à 7 (+6/-2).
Ce qui est le plus problématique c'est (outre le biais anti-IA) le caractère daté des informations.
Par exemple l'article écrit :
"test redoutable, le ARC-AGI, composé de puzzles logiques visuels qu’un enfant peut résoudre, mais que les IA les plus puissantes échouent massivement. Pourquoi ? Parce que ces puzzles ne sont pas dans leurs données d’entraînement. L’IA ne sait pas improviser. Elle est totalement démunie face à une situation qui lui est totalement étrangère."
L'IA est tellement démunie que, fin 2024, le test ARC-AGI a été cassé par le modèle o3 d'OpenAI (88% des puzzles résolus).
François Chollet, auteur du test ARC-AGI, dit à ce sujet :
"Il ne s'agit pas d'une simple amélioration marginale, mais d'une véritable rupture, qui marque un changement qualitatif dans les capacités de l'IA par rapport aux limites antérieures des LLM".
Tout ceci est parfaitement et clairement expliqué dans le livre de Thibaut Giraud "La parole aux machines".
[^] # Re: Décu
Posté par patrick_g (site web personnel) . En réponse à la dépêche Une rare interview/video de Linus Torvalds : Building the PERFECT Linux PC with Linus Torvalds. Évalué à 3 (+0/-0). Dernière modification le 26 décembre 2025 à 13:19.
Il n'y a qu'à aller lire le premier commentaire épinglé :
"Talking about the ARC GPU Choice - It was never clarified in the video because both Linus/ Linus ended up continuing their conversations after being side tracked and never circled back. In our original email communications it is because Linus T drives 2 x 6K displays and needed something more than integrated graphics without being an annoying loud or power hungry "gaming" class GPU. It was suppose to be a lIntel Arc B50 but we could not get one in time of shooting. Linus T clarified he was still more than ok at the time of filming with this GPU being used".
[^] # Re: Livre
Posté par patrick_g (site web personnel) . En réponse au lien Suis-je une machine qui pense ?. Évalué à 4 (+2/-1).
Ce qui nous intéresse ce n'est pas le hardware (comment c'est construit) mais le software (quels sont les effets de la cognition, comment la reconnaître).
Donc évoquer le fait que les IA et les humains ont un substrat hardware différent est complètement hors sujet.
# Livre
Posté par patrick_g (site web personnel) . En réponse au lien Suis-je une machine qui pense ?. Évalué à 3 (+1/-1).
Le bouquin de Monsieur Phi sur l'IA (la parole aux machines) est absolument excellent et je le recommande.
[^] # Re: Si ça pouvait être le signe d’une migration vers un usage raisonné des IA…
Posté par patrick_g (site web personnel) . En réponse au lien Microsoft Scales Back AI Goals Because Almost Nobody Is Using Copilot. Évalué à 6 (+3/-0).
Je confirme. Mon entreprise utilise Office365 et il y a des boutons Copilot partout en plus d'une application dédiée.
[^] # Re: Merci !
Posté par patrick_g (site web personnel) . En réponse au lien Je ne suis plus joignable par téléphone⁽¹⁾. Évalué à 9 (+6/-0).
Le livreur en bas de chez toi qui téléphone pour te signaler qu'il a ton paquet. Tu ne réponds pas alors il repart et tu es bon pour aller chercher ton paquet au dépôt hyper loin.
[^] # Re: Ma liste
Posté par patrick_g (site web personnel) . En réponse au journal Revue Bifrost : « IA : le futur rêve-t-il toujours de moutons électriques ? ». Évalué à 4 (+1/-0).
Si certains veulent lire seulement les meilleures nouvelles de SF (et pas les autres) j'ai sur mon site perso une liste de près de 2000 nouvelles avec une note (et un résumé/commentaire pour bon nombre d'entre elles) :
https://patrickguignot.fr/sf/introduction_sf.html
# Sécurité
Posté par patrick_g (site web personnel) . En réponse au lien Le mot de passe du Louvre était « LOUVRE », oui, oui !. Évalué à 10 (+8/-1).
Des audits de sécurité en 2014 et en 2015. Des résultats désastreux, cataclysmiques même, et puis après quoi ?
Pourquoi le directeur de l'époque n'a-t-il pas démissionné ? Pourquoi ne lui demande-t-on pas des comptes maintenant ?
# txt2tags
Posté par patrick_g (site web personnel) . En réponse au journal Le renouveau de txt2tags?. Évalué à 7 (+4/-0).
Oui j'utilise txt2tags. Sur mon site perso, hormis les pages générées par Tellico, tout est fait en exportant du txt2tags vers du HTML.
Dans le source on voit bien les:
<meta name="generator" content="https://txt2tags.org">
Après on parle d'un site perso statique plus que spartiate et qui ne bouge quasiment pas. J'avais choisi txt2tags à l'époque parce que c'était le truc le plus simple possible.
[^] # Re: Intéressant
Posté par patrick_g (site web personnel) . En réponse à la dépêche 40 ans pour l'informatique libre | Entretien avec Richard Stallman. Évalué à 4.
Plutôt que de parler d'injustice je pense qu'il vaudrait mieux dire qu'un logiciel sous licence propriétaire va à l'encontre de l'éthique.
Il y a un (vieux) commentaire là-dessus qui fait une comparaison avec les biens matériel et en quoi un logiciel est fondamentalement différent ce qui entraîne une conclusion éthique différente : https://linuxfr.org/nodes/53024/comments/932032
[^] # Re: décarbonation et renouvelable
Posté par patrick_g (site web personnel) . En réponse au lien Le développement de l’IA est incompatible avec la décarbonation, souligne le Shift Project. Évalué à 4.
Mais ce que je cite c'est une norme de l'OMS, pas une norme de l'ANSR.
Le document de l'ANSR ne fait qu'indiquer cette norme de l'OMS.
Mais bon tu ne veux pas comprendre, tu sembles incapable de discuter rationnellement et tu réponds systématiquement à côté donc PLONK !
[^] # Re: décarbonation et renouvelable
Posté par patrick_g (site web personnel) . En réponse au lien Le développement de l’IA est incompatible avec la décarbonation, souligne le Shift Project. Évalué à 8. Dernière modification le 07 octobre 2025 à 22:05.
C'est fou quand même. On te signale que ce qui est important, c'est la dangerosité pas la capacité de détecter. Et toi tu réponds par un autre lien vers une autre association militante qui titre également sur la détection de radioactivité.
Alors pour ce qui est de la dangerosité voici ce que j'ai trouvé :
"L’Organisation mondiale de la santé (OMS) recommande, sur la base des connaissances scientifiques relatives aux effets du tritium sur l’homme et l’environnement, une valeur guide de concentration dans l’eau à ne pas dépasser de 10000 Bq/Litre".
Et donc qu'est-ce qui a été détecté et qui motive les gros titres de ces associations anti-nucléaires militantes ?
"Châtellerault présente des niveaux parmi les plus importants relevés. La moyenne sur 2016 et 2017 est de 31 Bq/litre".
Mouhaha !
…mais en fait non, j'ai tort de rire.
Il ne faut pas rire mais plutôt pleurer en constatant l'aveuglement contre-productif de ces associations. Elles luttent stupidement contre une source d'énergie à bas carbone qui permet de combattre le vrai ennemi de l'humanité qui est la consommation effrénée d'énergie fossile.
L'énergie nucléaire n'est pas la panacée. Elle a des gros avantages et des gros défauts par rapport aux renouvelables.
Mais elle fait partie de la solution qu'il faut absolument mettre en œuvre pour nous désintoxiquer de ces foutues énergies fossiles.
Même avec elle ça va être monstrueusement difficile d'atteindre l'objectif. Alors on se passerait volontiers de ces attaques irrationnelles.
[^] # Re: décarbonation et renouvelable
Posté par patrick_g (site web personnel) . En réponse au lien Le développement de l’IA est incompatible avec la décarbonation, souligne le Shift Project. Évalué à 3. Dernière modification le 07 octobre 2025 à 19:21.
Le terme "contaminée" utilisée par le site reporterre.net et par la CRIIRAD te dit déjà tout ce qu'il y a à savoir au sujet de l'objectivité de ces associations purement militantes.
Ce n'est pas parce qu'on est capable de détecter quelque chose que c'est dangereux.
J'imagine qu'avec le progrès technologique et la capacité de détecter des niveaux de radioactivité de plus en plus infinitésimaux, la CRIIRAD va titrer que de plus en plus de communes sont contaminées. C'est dramatique, leur nombre augmente d'année en année !
[^] # Re: décarbonation et renouvelable
Posté par patrick_g (site web personnel) . En réponse au lien Le développement de l’IA est incompatible avec la décarbonation, souligne le Shift Project. Évalué à 6.
Et oui, c'est fou ça, le nucléaire est géré par des ingénieurs spécialistes du domaine. On se demande bien pourquoi ce ne sont pas les votes d'une convention citoyenne qui décident de la montée ou de la descente des barres de contrôle.
Plus sérieusement, il suffit d'un coup d'œil sur une carte des émissions de CO2 pour constater qu'en dépit des renouvelables l'Allemagne continue à consommer des quantités ahurissantes de charbon.
Dans la perspective du changement climatique je suis bien content que la France n'ait pas suivi le même chemin.
[^] # Re: décarbonation et renouvelable
Posté par patrick_g (site web personnel) . En réponse au lien Le développement de l’IA est incompatible avec la décarbonation, souligne le Shift Project. Évalué à 5. Dernière modification le 04 octobre 2025 à 09:47.
Le solaire et l'éolien sont "immédiatement disponibles" à tout moment ?
Tu racontes n'importe quoi. La disponibilité c'est justement le principal talon d'Achille de ces énergies.
# Rust
Posté par patrick_g (site web personnel) . En réponse au lien Faille critique exploitée dans sudo. Évalué à 4.
C'est du pain béni pour Sudo-rs : https://github.com/trifectatechfoundation/sudo-rs
[^] # Re: J'aime beaucoup, voici un exemple
Posté par patrick_g (site web personnel) . En réponse au lien A tool that takes any link and makes it look malicious. Évalué à 3.
Fait.
# L'avis (pessimiste) de Drew DeVault
Posté par patrick_g (site web personnel) . En réponse au journal npm et badaboum. Évalué à 10.
https://drewdevault.com/2025/09/17/2025-09-17-An-impossible-future-for-JS.html
Extrait de la conclusion :
"No one will learn their lesson. This has been happening for decades and no one has learned anything from it yet".
[^] # Re: Le bébé avec l'eau du bain
Posté par patrick_g (site web personnel) . En réponse au journal Gopher, une alternative simple aux bloatwares du Web. Évalué à 5.
s/markdown/txt2tags
[^] # Re: Le bébé avec l'eau du bain
Posté par patrick_g (site web personnel) . En réponse au journal Gopher, une alternative simple aux bloatwares du Web. Évalué à 5.
Mais pourquoi ne pas simplement faire un site web léger et statique en HTML ?
Je ne vois pas l'avantage de Gemini là-dedans.
[^] # Re: Intérêt du débat ?
Posté par patrick_g (site web personnel) . En réponse au lien Fil Mastodon : comment la réforme de l’orthographe de 1990 a été massacrée . Évalué à 2.
"Céline, c'est souvent moins une débâcle de la langue qui s'écrit qu'un accident du tout-à-l'égout".
Julien Gracq.
[^] # Re: vraie question.
Posté par patrick_g (site web personnel) . En réponse au journal GNOME Stop Me Now. Évalué à 4.
Ou Yazi qui est comme Ranger mais en Rust.
[^] # Re: L’enquête de l’ANFR
Posté par patrick_g (site web personnel) . En réponse au lien Des engins de chantier ont brouillé les réseaux mobile des opérateurs en France pendant 2 ans . Évalué à 6.
Merci pour le lien.
Je conçois que lors de la première perquisition on ne puisse pas parler « d’intention de perturber l’ordre public ou de commettre un acte de délinquance ».
Mais le type a récidivé volontairement à plusieurs reprises et à chaque fois cela a brouillé toutes les fréquences du quartier et à chaque fois les agents de l'ANFR et les policiers ont du se déplacer au domicile de l'individu pour faire cesser l'infraction.
La mansuétude de la justice dans ce cas précis me semble malavisée et de nature à exaspérer la population.