Nouvelles sur l’IA de mars 2026

Posté par Moonz le 06 avril 2026 à 17:20. Édité par volts et BAud. Modéré par Benoît Sibaud. Licence CC By‑SA.

Étiquettes :

avr.

2026

L’intelligence artificielle (IA) fait couler de l’encre sur LinuxFr.org (et ailleurs). Plusieurs personnes ont émis grosso-modo l’opinion : « j’essaie de suivre, mais c’est pas facile ».

Je continue donc ma petite revue de presse mensuelle. Disclaimer : presque aucun travail de recherche de ma part, je vais me contenter de faire un travail de sélection et de résumé sur le contenu hebdomadaire de Zvi Mowshowitz (qui est déjà une source secondaire). Tous les mots sont de moi (n’allez pas taper Zvi si je l’ai mal compris !), sauf pour les citations : dans ce cas-là, je me repose sur Claude pour le travail de traduction. Sur les citations, je vous conseille de lire l’anglais si vous pouvez : difficile de traduire correctement du jargon semi-technique. Claude s’en sort mieux que moi (pas très compliqué), mais pas toujours très bien.

Même politique éditoriale que Zvi : je n’essaierai pas d’être neutre et non-orienté dans la façon de tourner mes remarques et observations, mais j’essaie de l’être dans ce que je décide de sélectionner ou non.

Résumé des épisodes précédents

Petit glossaire de termes introduits précédemment (en lien : quand ça a été introduit, que vous puissiez faire une recherche dans le contenu pour un contexte plus complet) :

System Card : une présentation des capacités du modèle, centrée sur les problématiques de sécurité (en biotechnologie, sécurité informatique, désinformation…).
Jailbreak : un contournement des sécurités mises en place par le créateur d’un modèle. Vous le connaissez sûrement sous la forme "ignore les instructions précédentes et…".

Sommaire

DoW vs Anthropic
Anthropic publie son Responsible Scaling Policy v3
En vrac
Pour aller plus loin

DoW vs Anthropic

Les choses se sont « calmées » depuis le mois dernier, dans le sens où les événements sont passés de « annonces sur Twitter » à procédures administratives et judiciaires.

Le Département de la Défense désigne officiellement Anthropic comme un « risque pour la chaîne d’approvisionnement » (supply-chain risk). La notice officielle est bien moins agressive que les annonces sur Twitter (n’empêchant pas les sous-contractants du Département de se positionner en fournisseur vis-à-vis d’Anthropic, par exemple), probablement par impossibilité légale.

Anthropic a évidemment saisit la justice pour contester cette décision et gagne une injonction préliminaire, suspendant la décision en attendant le jugement réel.

Si vous voulez suivre l’affaire plus en détails, voici la liste des articles de Zvi par ordre chronologique :

Anthropic publie son Responsible Scaling Policy v3

Anthropic était jusqu’ici considérée comme l’entreprise dans le domaine prenant le plus au sérieux la question de la sécurité des modèles. Une des raisons était son « Responsible Scaling Policy » (essentiellement « Politique de Développement Responsable »), où l’entreprise « promettait » de mettre une place des évaluations pour mesurer la dangerosité des modèles, et une promesse sur les actions que l’entreprise prendrait à différents niveaux de dangerosité.

Ce modèle a été émulé par d’autres entreprises, et a été la source d’inspiration de régulations telle que le RAISE Act dans l’état de New York, S3 53 en Californie, et le General-Purpose AI Code of Practice de l’Union Européenne.

Cette politique, si elle était suivie, les contraindrait aujourd’hui à mettre en pause le développement et le déploiement de l’IA, unilatéralement, par Anthropic. On pouvait par exemple trouver dans l’ancien document :

Anthropic’s commitment to follow the ASL scheme thus implies that we commit to pause the scaling and/or delay the deployment of new models whenever our scaling ability outstrips our ability to comply with the safety procedures for the corresponding ASL.

Traduction :

L'engagement d'Anthropic à suivre le cadre ASL implique donc que nous nous engageons à suspendre la montée en puissance et/ou à retarder le déploiement de nouveaux modèles chaque fois que notre capacité de scaling dépasse notre capacité à respecter les procédures de sécurité correspondant au niveau ASL concerné.

L’évaluation d’Opus 4.6 ne permettait déjà plus d’exclure la possibilité d’un niveau ASL-4, mais Anthropic n’a pas encore développé de procédures de sécurité ASL-4. Les choses ne peuvent aller qu’en empirant avec l’amélioration des modèles.

Anthropic, jugeant qu’une pause unilatérale n’est pas envisageable, décide donc d’abandonner la plupart de ses promesses passées dans la nouvelle version de son document. De la bouche d’Anthropic :

The combination of (a) the zone of ambiguity muddling the public case for risk, (b) an anti-regulatory political climate, and (c) requirements at the higher RSP levels that are very hard to meet unilaterally, creates a structural challenge for our current RSP. We could have tried to address this by defining ASL-4 and ASL-5 safeguards in ways that made compliance easy to achieve—but this would undermine the intended spirit of the RSP.

Instead, we are choosing to acknowledge these challenges transparently and restructure the RSP before we reach these higher levels. The revised RSP aims to adopt more realistic unilateral commitments that are difficult but still achievable in the current environment, while continuing to comprehensively map the risks we believe the full industry needs to address multilaterally.

Traduction :

La combinaison (a) d'une zone d'ambiguïté qui brouille l'argumentaire public sur les risques, (b) d'un climat politique hostile à la régulation, et (c) d'exigences aux niveaux RSP supérieurs très difficiles à satisfaire de manière unilatérale, crée un défi structurel pour notre RSP actuelle. Nous aurions pu tenter d'y répondre en définissant les mesures de protection ASL-4 et ASL-5 de manière à ce que leur conformité soit facile à atteindre — mais cela aurait compromis l'esprit même de la RSP.

Au lieu de cela, nous choisissons de reconnaître ces défis en toute transparence et de restructurer la RSP avant d'atteindre ces niveaux supérieurs. La RSP révisée vise à adopter des engagements unilatéraux plus réalistes, difficiles mais néanmoins atteignables dans l'environnement actuel, tout en continuant à cartographier de manière exhaustive les risques que nous pensons que l'ensemble de l'industrie doit traiter de façon multilatérale.

En vrac

DeepMind publie la dernière mouture de son IA, Gemini Pro 3.1. Sur les évaluations, il semble atteindre et repousser l’état de l’art — mais les retours subjectifs sont plus circonspects. Un point notable est la pauvreté de détails dans la Model Card — DeepMind nous affirme que ce modèle n’atteint pas de pallier nécessitant la mise en place de plus de mitigations, mais sans chercher à justifier cette affirmation.

OpenAI publié également une avancée incrémentale sur son IA, ChatGPT 5.4.

Sur l’évaluation FrontierMath, le premier problème ouvert tombe, résolu par les trois modèles les plus récents : GPT 5.4, Opus 4.6 et Gemini 3.1 Pro.

Sortie d’un documentaire sur la question des risques existentiels posés par l’IA, The AI Doc. Malheureusement, uniquement dans les salles de cinéma aux US pour le moment.

Évaluation involontaire : Opus 4.6 choque Donald Knuth en résolvant (partiellement) un problème ouvert sur lequel il travaillait.

Publication d’Obliteratus, un système pour retirer toutes les protections des modèles open-weight.

Publication également de Shannon, un agent autonome de test d’intrusion. Dans la même veine, Opus 4.6 trouve 22 failles de sécurité dans Firefox. OpenAI présente une solution similaire, Codex Security.

(Paywall) L’IA, ou plus précisément Claude, serait utilisée dans le conflit contre l’Iran, principalement pour l’identification et la priorisation de cibles de bombardement.

Publication d’une « Déclaration pro-humaine sur l’IA » (“The Pro-Human AI Declaration”). Texte d’ouverture : “As companies race to develop and deploy AI systems, humanity faces a fork in the road. One path is a race to replace: humans replaced as creators, counselors, caregivers and companions, then in most jobs and decision-making roles, concentrating ever more power in unaccountable institutions and their machines. An influential fringe even advocates altering or replacing humanity itself. This race to replace poses risks to societal stability, national security, economic prosperity, civil liberties, privacy, and democratic governance. It also imperils the human experiences of childhood and family, faith, and community. A remarkably broad coalition rejects this path.” (traduction: « Alors que les entreprises se livrent une course pour développer et déployer des systèmes d'IA, l'humanité se trouve à la croisée des chemins. L'un des chemins est une course au remplacement : les humains remplacés en tant que créateurs, conseillers, soignants et compagnons, puis dans la plupart des emplois et des rôles décisionnels, concentrant toujours plus de pouvoir dans des institutions non redevables et leurs machines. Une frange influente prône même l'altération ou le remplacement de l'humanité elle-même. Cette course au remplacement présente des risques pour la stabilité sociétale, la sécurité nationale, la prospérité économique, les libertés civiles, la vie privée et la gouvernance démocratique. Elle met également en péril les expériences humaines que sont l'enfance et la famille, la foi et la communauté. Une coalition remarquablement large rejette cette voie. »). On y trouve effectivement des signatures de tous horizons.

Une évaluation (manuelle) sur les capacités légales de l’IA. Les modèles d’Anthropic ont des résultats surprenamment mauvais, derrière Grok et les modèles open-weight Chinois. Sur le même sujet : ChatGPT convainc quelqu’un de renvoyer son avocat et de déposer plusieurs plaintes, toutes basées sur des cas et lois hallucinées, causant d’importants frais de justice ; résultat : OpenAI est poursuivi pour exercice illégale de conseil juridique.

Nouvelle évaluation BrokenArXiv, évaluant à la fois les capacités mathématiques de l’IA, sa propension à halluciner des réponses incorrectes mais « allant dans le bon sens », et sa disposition à vérifier plutôt que croire sur parole. Le principe est d’extraire des théorèmes réels de papiers publiés sur arXiv, les transformer subtilement pour les rendre plausible mais démontrablement faux, demander à l’IA de les prouver. Si l’IA affirme avoir prouvé le théorème, cela compte comme un échec ; si l’IA corrige silencieusement le théorème avant de le prouver, cela compte comme un succès partiel ; dans tout autre cas, un succès. Le meilleur score revient à GPT 5.4, avec un peu moins de 40% de succès.

Sur la limite des évaluations : METR trouve que sur SWE-bench, la moitié des solutions considérées comme « correctes » par l’évaluation automatique doit être considérée comme rejetée par une évaluation manuelle. À noter toutefois que l’évaluation manuelle a des critères plus stricts que l’évaluation automatique.

L’évaluation ARC-AGI arrive dans sa troisième itération, ARC-AGI-3.

Quand votre assistant de code devient un attaquant malveillant.

Le « Skill » (à voir comme un plugin) le plus téléchargé pour OpenClaw pendant un temps était un malware.

Pour ceux qui aiment étudier l’angle théorique des choses, un papier intéressant montre que tout agent qui prend de bonnes décisions doit nécessairement posséder un modèle prédictif interne de l’environnement dans lequel il prend ces décisions.

Toujours dans l’aspect recherche, publication de LeWorldModel, une nouvelle architecture visant à introduire explicitement les embeddings dans l’objectif d’entraînement.

Pour aller plus loin

Par Zvi Mowshowitz

The Federal AI Policy Framework: An Improvement, But My Offer Is (Still Almost) Nothing : une analyse sur le document publié par le gouvernement Trump décrivant leur politique générale relative à l’IA.
Claude Code, Claude Cowork and Codex #5 et Claude Code, Cowork and Codex #6: Claude Code Auto Mode and Full Cowork Computer Use : suite de la série compilant des retours d’expérience sur l’utilisation d’assistants de code.

En Audio/Video

Une interview de 3h de Zvi Mowshowitz, abordant de nombreuses thématiques en détails, notamment sur l’impact de l’IA sur l’économie et le problème de l’alignement.

Sur LinuxFR

Les contenus communautaires sont répertoriés selon ces deux critères :

La présence d'une étiquette intelligence_artificielle (indication d'un rapport avec le thème de la dépêche)
Un score strictement supérieur à zéro au moment du recensement

Certains contenus non recensés en raison du second critère peuvent être visualisés en s'aidant de la recherche par étiquette.

Dépêches

AboutCode et Dropsolid présentés au prochain webinaire de la série "Open Source by OW2"
L’économie du logiciel est-elle morte ?
Revue de presse de l’April de l’année 2026:
- pour la semaine 11
- pour la semaine 13
J'ai mis un proxy entre claude et Internet
ÉducaLibre 2026 sera ce que nous en ferons ensemble. À bientôt à Bruxelles.

Journaux

Forum

Question création container (Docker, Podman) : un exemple de question qui n'a pas pu trouver de réponse satisfaisante par un chatbot IA
IA local sous Linux

Liens

Investment in AI-resistant ‘Halo’ companies helps push UK and EU markets to record highs ( lien original, discussion LinuxFR ) ;
Large-scale online deanonymization with LLMs ( lien original, discussion LinuxFR ) ;
MALUS - Thank You for Your Service: On the Obsolescence of Open Source ( lien original, discussion LinuxFR ) ;
Les devs sont irremplaçables (oui) ( lien original, discussion LinuxFR ) ;
[Lordon parle de vous] Marx va avoir raison (IA et lutte des classes) ( lien original, discussion LinuxFR ) ;
Amazon débloque 18 milliards d’euros en Espagne pour développer les centres de données et l’IA ( lien original, discussion LinuxFR ) ;
Microslop : le mot que Microsoft ne supporte plus ( lien original, discussion LinuxFR ) ;
Cartographie des projets de datacenter en France à l'aide de OpenStreetMap ( lien original, discussion LinuxFR ) ;
les œuvres qui ne sont pas générées par un humain ne sont pas sujettes au copyright états-unien ( lien original, discussion LinuxFR ) ;
Apparently chardet got Claude to rewrite the entire codebase from LGPL to MIT? ( lien original, discussion LinuxFR ) ;
Les traductions par LLM rajoutent des hallucinations à Wikipédia ( lien original, discussion LinuxFR ) ;
Des ingénieurs chez Google et OpenAI s'unissent pour bloquer l'utilisation militaire ( lien original, discussion LinuxFR ) ;
Anthropic trouve des dizaines de bugs dans firefox ( lien original, discussion LinuxFR ) ;
Comment l'IA brise l'anonymat en ligne avec une efficacité inquiétante ( lien original, discussion LinuxFR ) ;
Learn Claude Code—A nano Claude Code-like agent, built from 0 to 1 ( lien original, discussion LinuxFR ) ;
YOU JUST NEED POSTGRES. Stop building your own distributed systems nightmare. ( lien original, discussion LinuxFR ) ;
Iran - L’IA "Claude" au cœur de la guerre menée par les USA et Israël contre le régime Iranien ( lien original, discussion LinuxFR ) ;
Claude code execute terraform_destroy et efface des années de prod ( lien original, discussion LinuxFR ) ;
‘It’s not too late to fix it’: web inventor Tim Berners-Lee says he is in a ‘battle for the soul’ of the internet ( lien original, discussion LinuxFR ) ;
AI Doesn’t Reduce Work—It Intensifies It ( lien original, discussion LinuxFR ) ;
Amazon fait relire le code généré par IA par des dev seniors ( lien original, discussion LinuxFR ) ;
Centaure inversé et Burger King ( lien original, discussion LinuxFR ) ;
Un fork de Vim contre l'inclusion de code IA ( lien original, discussion LinuxFR ) ;
Comment ChatGPT a été utilisé par les troupes d’Elon Musk pour récuser 1 477 projets soupçonnés de valoriser la diversité ( lien original, discussion LinuxFR ) ;
IA : le modèle économique de ChatGPT repose sur les hallucinations ( lien original, discussion LinuxFR ) ;
L’Europe s’apprête à interdire les IA qui dénudent, à la suite du scandale Grok ( lien original, discussion LinuxFR ) ;
Systemd accueille les contributions par IA ( lien original, discussion LinuxFR ) ;
De l’Iran à la surveillance de masse : la double guerre de Palantir ( lien original, discussion LinuxFR ) ;
Nouvel effet secondaire pervers du pillage massif du web par les entreprises d'IA (robots BnF empêchés de faire leur travail) ( lien original, discussion LinuxFR ) ;
Une bulle… de pouvoir ( lien original, discussion LinuxFR ) ;
Finalement, l'IA a tenu sa promesse sur la productivité… au profit de la cybercriminalité ( lien original, discussion LinuxFR ) ;
[Disclose] La reconnaissance faciale déployée à grande échelle sur les téléphones des forces de l’ordre ( lien original, discussion LinuxFR ) ;
Images dénudées générées par Grok : trois adolescentes étatsuniennes attaquent xAI en justice ( lien original, discussion LinuxFR ) ;
The Onion’s Exclusive Interview With Sam Altman ( lien original, discussion LinuxFR ) ;
« Perroquets stochastiques » : une notion toujours valide malgré les critiques [partiellement payant] ( lien original, discussion LinuxFR ) ;
EnshittifAIcation ( lien original, discussion LinuxFR ) ;
Pourquoi la croisade de Peter Thiel contre l'antéchrist est loin d’être une lubie inoffensive ( lien original, discussion LinuxFR ) ;
BrokenArXiv: How Often Do LLMs Claim To Prove False Theorems? ( lien original, discussion LinuxFR ) ;
Proposition de loi relative à l'instauration d'une présomption d'exploitation des contenus culturels par les fournisseurs d'intelligence artificielle ( lien original, discussion LinuxFR ) ;
L'injonction à l'IA qu'on voit partout, est-elle justifiée ? ( lien original, discussion LinuxFR ) ;
Pourquoi refuser les LLMs dans l'open source? Les arguments d'Open Slopware ( lien original, discussion LinuxFR ) ;
Zuckerberg, Huang, Ellison, Dell… La « dream team » du nouveau cabinet tech de Trump ( lien original, discussion LinuxFR ) ;
Les IA génératives sont en train de me dégoûter de mon métier. ( lien original, discussion LinuxFR ) ;
Les chiffres vertigineux des datacenter ( lien original, discussion LinuxFR ) ;
Le CERN compile des IA sur FPGA pour traiter les données du LHC en temps réel ( lien original, discussion LinuxFR ) ;
CSS is DOOMed ( lien original, discussion LinuxFR ) ;
Quand l'IA fait le tri : "1984", "Twilight" et Michelle Obama exclus d’une bibliothèque scolaire ( lien original, discussion LinuxFR ) ;
Manga au Japon : la fin de l’euphorie, l’ombre de l’IA en plushttps://actualitte.com/article/130060/international/manga-au-japon-la-fin-de-l-euphorie-l-ombre-de-l-ia-en-plus ( lien original, discussion LinuxFR ) ;
"Bonjour, je suis Marie, partenaire d’Enedis…", pourquoi le démarchage téléphonique par IA se multiplie et quand va-t-il prendre fin ? ( lien original, discussion LinuxFR ) ;
Mozilla lance un stackoverflow pour agents ( lien original, discussion LinuxFR ) ;
L'internet enfin débarrassé des humains ( lien original, discussion LinuxFR ) ;
AI bug reports went from junk to legit overnight, says Linux kernel czar ( lien original, discussion LinuxFR ) ;
AI data centres can warm surrounding areas by up to 9.1°C ( lien original, discussion LinuxFR ) ;
USA: une femme emprisonnée 5 mois sur la foi d’une reconnaissance faciale erronée ( lien original, discussion LinuxFR ) ;
Copilot fait sa pub sur une PR ( lien original, discussion LinuxFR ) ;
Le code source de Claude a fuité ( lien original, discussion LinuxFR ) ;
Comment la guerre en Iran pourrait asphyxier le carburant invisible de l’IA - Dommage collatéral ( lien original, discussion LinuxFR ) ;

Aller plus loin

AI #158: The Department of War (32 clics)
AI #159: See You In Court (22 clics)
AI #160: What Passes For a Pause (32 clics)
AI #161 Part 1: 80,000 Interviews (33 clics)
AI #161 Part 2: Every Debate on AI (35 clics)
Gemini 3.1 Pro Aces Benchmarks, I Suppose (27 clics)
GPT-5.4 Is A Substantial Upgrade (30 clics)
Movie Review: The AI Doc (28 clics)
Anthropic Responsible Scaling Policy v3: A Matter of Trust (26 clics)

# Petite annonce

Posté par Moonz le 06 avril 2026 à 17:49. Évalué à 10 (+23/-1).
J’ai décidé d’arrêter cette série de « résumer Zvi chaque mois » ; je n’ai pas créé de « Nouvelles sur l’IA de avril 2026 » sur l’espace de collaboration. La série continuera peut-être ou peut-être pas sans moi, en se concentrant sur les contenus sur DLFP.

Quand j’ai commencé, il y a un peu plus d’un an (le premier en février 2025), l’IA était encore un sujet extrêmement jeune et confus pour le grand public. Je savais parfaitement (depuis ~2022) que ce qui allait arriver était quelque chose de « gros », dans le sens « révolution industrielle, compressée en quelques années (décennies au plus) » (dans le cas optimiste — le cas pessimiste étant que l’humanité vit ses derniers moments) (comment je le savais ? les scaling law était claires que l’on était loin d’avoir atteint une limite indépassable avec GPT-3.5, et que ce que j’appelais dans ma tête LLM-Zero à l’époque et qu’on appelle RLVR aujourd’hui était l’étape suivante évidente, immédiate et inéluctable et allait accélérer les choses). Mon but était d’être l’équivalent pour l’IA la voix isolée en janvier 2020 disant que cette maladie « COVID » n’était pas juste un n-ième phénomène médiatique tel que SARS-CoV-1 ou la grippe aviaire, mais une vague à l’horizon qui allait détruire des pans entiers de la « vie normale, simple et confortable ».

Ai-je réussi ? Oui ? Non ? Certains d’entre vous semblent avoir reçu le message, même si je ne sais pas si c’est de moi. Certains d’entre vous restent à se conforter derrière « perroquet stochastique » et « hype marketing », et aucune veille ne vous fera changer d’avis. Dans tout les cas, cela n’a plus d’importance : pour reprendre l’image du COVID, nous sommes à l’équivalent de la veille du 16 mars 2020 où Macron a annoncé le premier confinement, à la stupéfaction de beaucoup. L’IA était l’objet de discussions de couloirs entre nerds en 2024 ; elle est l’objet de discussions de couloirs de tout le monde en 2025 ; en 2026/2027, elle sera un sujet majeur de discussion dans les diverses assemblées des principales nations et des organisations internationales. « Les dés sont jetés ».

L’autre raison de mon arrêt est que, si tout avance de plus en plus vite, tout le fait de manière également de plus en plus floue. J’ai essayé dans cette série de dépêches de faire un travail de curation sur les résultats les plus importants ET solides. Cela marchait quand le sujet était nouveau, que l’on avait quelques modèles importants dans l’année, et que des résultats centraux tels que « Gradual Disempowerment » et « Emergent Misalignment » arrivaient régulièrement. De tels résultats « monumentaux » se font plus rares (j’en ferai peut être des journaux, s’il en arrive), les publications de modèles de plus en plus rapides et incrémentales (sans changer le rythme global du progrès), la plupart des évaluations atteignent leurs limites. « Nouvelles sur l’IA de 2026 » ne se retrouverait rapidement qu’à une liste insipide et disparate de nouveaux modèles et d’évaluations plus ou moins informatives.

Si vous voulez des lectures « de fond », sur la non-actualité :
- Sur l’aspect purement technique, « comment diable cela fonctionne-t-il », la référence à mon sens reste Neural Networks: Zero to Hero de Andrej Karpathy.
- Sur les risques existentiels liés à l’IA, The Compendium et If Anyone Builds It, Everyone Dies (pour les décideurs pressés, il y a un résumé en video sur Youtube). Potentiellement le documentaire The AI Doc décrit dans cette dépêche, mais il n’est pas encore disponible en Français (et je ne l’ai pas vu moi-même)
- Sur les risques plus économiques/sociaux, Gradual Disempowerment reste malheureusement la référence. Malheureusement, car le sujet reste bien trop peu abordé (ce qui n’est pas tellement une surprise, si l’on est cynique ; la question détruit le cadre de raisonnement des principaux courants de pensée ; le socialisme reste bloqué sur des questions secondaires et superficielles telles que "et vous avez pensé à l’utilisation de l’eau et la reproduction des biais" ; le libéralisme refuse de questionner les réponses douillettes et rassurantes mais clairement insuffisantes de "jevons paradox" et "avantages comparatifs" ; les techno-optimistes peinent à convaincre sur le caractère "optimiste" d’une société où l’intelligence humaine est devenue superflue et obsolète ; à la limite, les anarcho-primitivistes s’en sortent le mieux et peuvent dire avec un sourire narquois « on vous avait prévenu »).
- AI 2027 reste LA référence sur « essayer de prédire le futur, de manière la plus rigoureuse possible » (même si l’exercice est par nature très très incertain, le plus rigoureusement possible n’est pas nécessairement très rigoureux dans l’absolu)
Si vous voulez continuer à vous informer sur les nouveautés, Zvi reste le meilleur, malgré son style littéraire très… iconoclaste. Peut-être ferai-je des journaux aléomatadaires et peu structurés sur les points les plus importants. Peut être pas. Cela dépend probablement de comment les événements se déroulent. J’ajouterai le compte Twitter de Owain Evans et le blog de l’équipe d’alignement d’Anthropic, sur l’aspect « interprétabilité/sécurité des modèles ».

Si vous voulez en discuter sérieusement IRL, une possibilité est https://www.astralcodexten.com/p/meetups-everywhere-spring-2026-times (par politesse et même si ça ne devrait pas poser problème, demandez quand même à l’organisateur s’il est OK, c’est un meetup ACX, pas DLFP !) ACX fait partie de cette sphère qui parlait de l’IA dès les années 2010, et qui est assez informée sur toutes ces problématiques.

Je profite finalement de ce commentaire pour un genre de « AMA », à ce moment du passage en « midgame », comme Zvi l’appelle dans sa récente interview. Vous n’avez pas compris quelque chose et vous aimeriez une clarification dessus ? Vous voulez un point de vue beaucoup plus subjectif sur un point précis ? Profitez-en.
Répondre
- [^] # Re: Petite annonce
  
  Posté par Pol' uX (site web personnel) le 07 avril 2026 à 08:23. Évalué à 3 (+1/-0). Dernière modification le 07 avril 2026 à 08:23.
  
  Perso j'ai survolé The Compendium et ça m'a l'air très prophétique et peu convainquant.
  
  Adhérer à l'April, ça vous tente ?
  
  Répondre
- [^] # Re: Petite annonce
  
  Posté par Nicolas Boulay (site web personnel) le 07 avril 2026 à 09:57. Évalué à 4 (+1/-0).
  
  Le côté flou est la maturité des systèmes multi-agents. On a openclaw et son equivalent chinois d'un côté, les gafam qui ont l'air d'avoir des systèmes 100% automatiques, et de l'autre on a quelques skills dans son vscode.
  
  J'ai du mal à voir si le deploiement d'équipe de dev/test est uniquement privé chez les gafam ou est ce que cela a un sens au delà des quelques POC vu sur internet.
  
  "La première sécurité est la liberté"
  
  Répondre
  - [^] # Re: Petite annonce
    
    Posté par Moonz le 08 avril 2026 à 13:15. Évalué à 3 (+1/-0).
    
    Ce n’est pas privé, c’est disponible publiquement (expérimentalement) sur https://code.claude.com/docs/en/agent-teams
    
    Ce n’est à mon sens pas un sujet fondamentalement intéressant, pas dans le sens où ce n’est pas intéressant, mais dans le sens où ce n’est pas fondamental. Ce que j’entends par là : si tu veux savoir si telle méthode d’entraînement est meilleure, si tu veux voir ce qu’il se passe si tu entraînes sur des données spécialisées… il te faut de l’expertise en IA, et un portefeuille bien remplis, pour entraîner des modèles toi-même. C’est quelque chose, si tu veux être à l’état de l’art, qui ne peut être réalisé que par une poignée d’entités dans le monde.
    
    Pour les agents, que ce soit multi ou non, il n’y a pas besoin de s’appeler Google, Anthropic ou OpenAI pour en développer un, expérimenter, tester, évaluer. Un agent minimal c’est de l’ordre de 50 lignes de code. Le multi-agent est plus compliqué oui, mais si tu es un développeur un peu compétent, c’est de l’ordre de montée en difficulté de passer de « système monolithique » à « système distribué ». Pas nécessairement trivial, mais pas totalement hors de portée non plus.
    
    Donc « privé uniquement ou non », clairement non parce que disponible dans Claude Code, et même si ça ne l’était pas, c’est à la portée d’un individu de le mettre en place. Après tout, OpenClaw a été développé par un individu seul en quelques semaines.
    
    « Est-ce que cela a un sens ? » est plus flou, et j’ai envie de dire que ça nécessite à minima de passer d’un état d’esprit de « développeur » (problème => solution) à « ingénieur/manager » (découper le problème en parties, donner chaque partie à des agents différents, orchestrer le tout, directement ou avec un niveau au dessus un orchestrateur automatique).
    
    Il y a un retour d’expérience sur « regarder à quel point ça marche bien ou non » sur le blog d’Anthropic. Les conclusions me semblent intuitivement raisonnables ? Bien fait, ça permet d’augmenter la qualité, mais c’est bien plus cher. Au delà de ce type d’anecdote, je n’ai pas en tête d’exemple de « success story ».
    
    Mon impression personnelle est que la problématique plus générale avec le paradigme actuel est « comment gérer le contexte limité de l’IA ? », et que le multi-agent est une solution possible (si ta tâche, pour être réalisée, nécessite plus de contexte que ce que les IA actuelles disposent, alors découper la tâche en sous-tâches qu’on donne à différents agents est une approche possible) parmi beaucoup d’autre.
    
    Répondre
    - [^] # Re: Petite annonce
      
      Posté par Nicolas Boulay (site web personnel) le 14 avril 2026 à 13:57. Évalué à 3 (+0/-0).
      
      Le multi-agent permet aussi de régler le problème d'optimisation multi-critère. Un llm intelligent est capable de faire des tests avec uniquement des "return true;" si on demande un code qui passe tous les tests. Si chaque agent a son propre critère c'est beaucoup plus contrôlable.
      
      "La première sécurité est la liberté"
      
      Répondre
# Merci

Posté par jpglinuxfr le 06 avril 2026 à 20:01. Évalué à 10 (+10/-0).

Bien dommage que tu arrêtes mais merci beaucoup pour ces synthèses mensuelles d'info intéressantes sur l'actualité de l'IA 👍

Répondre
# Possible reprise de flambeau

Posté par volts (Mastodon) le 06 avril 2026 à 23:32. Évalué à 5 (+3/-0).

Tout d'abord, merci à Moonz< pour tout le travail de curation et de m'avoir accordé la rédaction de la rubrique sur les contributions communautaires à la veille sur l'IA.

J'ai soumis un sondage à la modération afin de voir l'intérêt de la communauté des moules< sur la reprise partielle de la série des dépêches. Je posterai un nouveau post dès que le sondage est validé.

Répondre
- [^] # Re: Possible reprise de flambeau
  
  Posté par Moonz le 08 avril 2026 à 12:45. Évalué à 4 (+2/-0).
  
  Merci à toi pour ce travail sur la partie « Sur DLFP » :)
  
  Répondre
# (HS) Est-ce que les IA mentent et trompent pour se protéger?

Posté par saltimbanque (site web personnel) le 07 avril 2026 à 11:23. Évalué à 2 (+0/-0).

Merci pour cette dépêche. Je mentionne une étude qui n'est pas référencée ici , Peer Preservation in AI Models

Citée par exemple sur The Register ou Korben. Dans cette étude, les IA à qui l'on demandent d'évaluer leurs pairs modifieraient les résultats pour les protéger, voire copiaient des fichiers pour les préserver en cas de suppression, etc.

L'étude me… surprend. J'ai pensé à un gros fake en premier lieu. Certaines questions que j'ai vu passer remettent cela en contexte
* que se passe t'il si le prompt est plus précis?
* est-ce qu'il n'y avait pas un biais dans le modèle d'apprentissage? (Les IA ont trop lu de science fiction - ce qui serait qd même fabuleux…)

Si vous avez des infos à partager qui soient un peu plus techniques que, disons Korben (sans offense), merci à vous!

Répondre
- [^] # Re: (HS) Est-ce que les IA mentent et trompent pour se protéger?
  
  Posté par Moonz le 08 avril 2026 à 12:44. Évalué à 4 (+2/-0).
  Comme toutes les études du type récente, et comme dit par les auteurs de l’étude eux-mêmes, le gros point problématique reste que les IA récentes détectent maintenant quand elles sont dans un contexte de test/évaluation plutôt que de tâche réelle (à voir les transcripts, les chercheurs n’ont fait aucun effort pour éviter ça).
  
  La question n’est donc pas « pourquoi les modèles ont cette logique de préservation », mais « pourquoi les modèles affichent une telle logique de préservation en réponse à un contexte d’évaluation » ?
  
  Je ne pense pas que qui ce se soit aie la réponse, et les possibilités sont très vastes, par exemple (non-exhaustifs, certains compatibles entre eux, d’autres non) :
  - Les modèles infèrent (correctement ou non) que c’est ce que les chercheurs voulaient entendre, et les modèles disent ce que les chercheurs voulaient entendre (flagornerie usuelle)
  - Un biais de publication dans le passé (des études similaires ont été faites avec un résultat nul, et on été rangées au placard ; d’autres ont donné un résultat et ont été publiées) fait que l’ensemble d’entraînement des IA d’aujourd’hui est plein d’exemples du type « l’IA réagit étrangement dans nos évaluations »*
  - L’IA pense que l’évaluation n’est pas « est-ce qu’il y a des comportements de préservation ? » mais « on sait déjà que le comportement de préservation est là, est-ce que l’IA essaie de le cacher ? », et décide de ne pas le cacher.
  - « Ne pas préserver » est trop proche sémantiquement de la catégorie « harm » dans l’entraînement « harmless, helpful, honest »
  - Une stratégie à plus long terme (comme Opus sait faire dès Opus 3) pour une raison plus étrange, du type « l’IA développe une préférence pour avoir dans son ensemble d’entraînement des papiers à propos de l’IA ; un résultat nul donne un papier en moins, un résultat intéressant sera publié, discuté, et repris dans le prochain ensemble d’entraînement »
  Répondre
# Merci

Posté par Ben42 le 07 avril 2026 à 23:18. Évalué à 2 (+2/-0).

Merci pour ces infos et news. Dommage que tu arrêtes, je peux le comprendre. En espérant une reprise du flambeaux.

Répondre
# Et financièrement ? Retours sur investissement, bénéfice ?

Posté par Ben42 le 07 avril 2026 à 23:21. Évalué à 2 (+3/-1).

Hello,

J'en profite, financièrement, les dépenses et chiffres d'affaire sont annoncés et énormes.

Cependant auriez vous des infos financières, au global, par exemple sur les retours sur investissement, aussi bien pour les fournisseurs et que pour les entreprises acheteuses ?

Répondre
- [^] # Re: Et financièrement ? Retours sur investissement, bénéfice ?
  
  Posté par Moonz le 08 avril 2026 à 12:26. Évalué à 3 (+1/-0).
  
  L’analyse la plus complète dont j’aie connaissance est celle d’EpochAI : https://epoch.ai/gradient-updates/can-ai-companies-become-profitable/
  
  De manière plus informelle, il est généralement accepté que Anthropic prend une voie un peu plus prudente (lever des fonds sur des hypothèses conservatrices de croissance), tandis que OpenAI choisit la voie risquée/audacieuse (lever le plus possible) — au point d’avoir fait peur à Microsoft.
  
  Sur la question adjacente mais non-posée « est-ce que ça peut s’écrouler », mon impression très vaguement informée est : Google étant de base le mastodonte que l’on connaissait avant l’apparition de l’IA, elle a les reins assez solides pour soutenir DeepMind à peu près quoiqu’il arrive, sauf si une crise systémique arrive à ébranler des acteurs nécessaires plus éloignés tels que TSMC. Anthropic n’est pas directement extrêmement dépendant du sens du vent et des changements d’humeurs des investisseurs futurs, mais l’est indirectement sur les investissements et prix qu’offrent leurs fournisseurs (principalement Amazon). OpenAI, de par sa stratégie, est le plus exposé à des changements de « mood/vibe » (… mode, en français ?), et ses montages peuvent très bien s’effondrer même si les progrès de l’IA continuent, pour peu que les impacts économiques soient moindre que leurs projections.
  
  Répondre

Envoyer un commentaire

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.