Journal IA : mon parcours initiatique

Posté par gUI (Mastodon) le 16 mai 2026 à 22:36. Licence CC By‑SA.

Étiquettes :

mai

2026

Sommaire

Niveau 0 : ChatGPT dans le browser
Niveau 1 : LLM local
Niveau 2 : Agent IA
Niveau 3 : Skills
Niveau 4 : MCP
Conclusion

Salut les moule·e·s,

Je m'intéresse de près à l'IA depuis peu, et il m'a fallu un certain temps pour comprendre ce que je devais chercher en fait. Le fameux "claude code" ou les "agents" étaient un peu nébuleux, mais j'avais bien compris que c'était autre chose que de faire ses requêtes dans un browser web.

Si vous êtes comme moi il y a quelques mois, voici l'article que j'aurais aimé lire à l'époque.

Niveau 0 : ChatGPT dans le browser

J'ai commencé par ChatGPT à ses débuts. Comme beaucoup je suppose. Au tout début je rigolais de le voir me citer "les 3 capitales des États-Unis" sans broncher. Bon, ça n'a pas trop duré, rapidement il a su me répondre qu'il n'y en a qu'une mais que d'autres villes importantes blablabla, veux-tu que je te liste blablabla.

En matière de code, j'ai pas mal essayé de le faire bosser à ma place, avec des résultats mitigés. Un copier/coller de quelques centaines de lignes de log et il me pointe exactement le souci en 10 secondes, c'est arrivé. Une correction de bug en le décrivant et en lui donnant le code actuel aussi. Mais ça ne l'a pas empêché d'être souvent en dehors de la plaque, de me donner des corrections fausses, ou de tourner en rond en étant persuadé qu'il avait raison.

J'appelle ça le niveau 0 parce que ça permet de se donner une idée de la puissance du machin tout de même, mais ça une utilisation vraiment restreinte. C'est adapté au LLM (parler avec une machine en langage naturel) mais pas trop à la génération de code.

Niveau 1 : LLM local

Ensuite de par la curiosité d'une part mais aussi l'envie de dépendre le moins possible de service extérieurs (payants ou pas), j'ai regardé du côté des IA qu'on peut faire tourner localement.

D'abord sur mon CPU, puis en achetant une carte graphique AMD avec pas mal de RAM mais dont les joueurs ne veulent pas (une AMD avec 24Go de VRAM que j'ai payé 600€).

Honnêtement je n'ai pas encore beaucoup creusé cela, mais je sais déjà faire le minimum :

utiliser un modèle proposé par Ollama ou Hugging Faces
le paramétrer légèrement (taille du contexte, température)

Ça m'a permis facilement de mettre rapidement le doigt sur ces deux paramètres fondamentaux. En gros la fenêtre de contexte est la taille des informations que le modèle peut traiter en même temps. Il contient les instructions, mais aussi les données à traiter. Plus le contexte est gros moins il va halluciner et raconter des conneries, mais bien évidemment plus ce sera consommateur en ressources.

Pour la température c'est un peu à quel point il peut être "farfelu" et "créatif". Par exemple si on fournit une capture d'écran effectuée lors d'un test automatique et qu'on demande 10x à un même LLM de nous dire ce qu'il y voit dedans, il nous dira en gros la même chose, mais avec des mots différents, parfois les détails diffèreront etc. Par contre si on met une température à 1 (qui veut dire "aucune imagination", en opposé à 0 qui veut dire "t'es no limit !", et toutes les valeurs intermédiaires étant des nuances), on ne sait toujours pas à l'avance ce qu'il sortira, mais par contre si on lui demande 10x avec la même source il ressortira 10x exactement le même texte.

Bon, j'ai également pu voir l'intérêt de payer pour un service extérieur, les performances sont sans commune mesure en matière de rapidité, mais aussi de qualité. Et notamment parce que les modèles qui tournent dans les services externes peuvent avoir une fenêtre de contexte de l'ordre de 10 ou 100x supérieures à ce que je peux faire en local.

Pour du LLM (parler à une machine en langage naturel) la solution locale est vraiment pas mal. Mais pour du code, passé le boilerplate d'un script bash ou python, c'est très limité.

J'appelle ça le niveau 1 parce que c'est tout aussi peu utilisable, mais au moins on comprend 2 ou 3 trucs, on devient (un peu) acteur.

Niveau 2 : Agent IA

C'est clairement là où j'ai compris le potentiel de l'IA dans le domaine du développement logiciel.

Un "agent" c'est un programme (codé en python, Rust, C++… tout ce qu'il y a d'habituel) qui fait l'intermédiaire entre nous, pauvres humains, et l'IA. C'est lui qui transmet notre demande, et c'est lui qui va recevoir la réponse.

La différence avec le browser web ? C'est que l'échange est un peu plus formalisé, sous forme de fichier JSON généralement. Ainsi on peut gérer plus finement le contexte (fichiers joints, prompts de différents niveaux…) mais aussi la réponse peut contenir des actions comme écrire dans un fichier, exécuter une commande git etc.

Toutes ces actions sont concrètement exécutées par l'agent lui-même. Il faut donc veiller à ce qu'il n'accepte pas de faire n'importe quoi. En général l'agent va demander les autorisations au fur et à mesure, en laissant la possibilité d'accepter par défaut toutes les prochaines actions du même type.

Claude code

J'ai commencé à utiliser claude code comme agent. Par défaut il utilise Claude, l'IA dans le cloud comme LLM. Et là oui, c'est impressionnant. Sur une base de code existante où on veut rajouter une fonctionnalité il va d'abord lire tout le code (évidemment, faut que ça rentre dans la fenêtre de contexte, si le code est vraiment trop gros il ne lira pas tout). Ensuite selon ce qu'on lui a demandé de faire, il peut juste proposer la modification, mais aussi la faire, la tester, faire le commit git… Tout cela en quelques minutes et quelques aller/retour entre l'agent et le modèle IA. Ça se déroule sous nos yeux, c'est réellement fascinant.

CLAUDE.md

C'est aussi la découverte du fameux CLAUDE.md. Ce fichier est par défaut lu par l'agent claude code, et ajouté dans le contexte du LLM. C'est un peu un prompt par défaut. En voici un bref exemple juste pour avoir une idée:

# langage
tout doit être réalisé en python3

# langue
parle-moi en français mais rédige le code (classes, fonctions, cariables, commentaires) en anglais

# règles de codage
application stricte de PEP-8

Ensuite dans l'outil si on dit simplement "fais-moi un programme des tours de Hanoï" ce sera donc écrit en python3, le code en anglais, et il vérifiera bien que les recommandations PEP-8 sont appliquées.

Il y a plein de littérature sur ces fichiers (au pluriel, parce que dans ce même fichier on peut par exemple écrire "lis GIT.md pour savoir comment rédiger les commit git" et donc dédier un fichier à la rédaction des commits git), et c'est clairement une nouvelle compétence de développeur de savoir l'écrire et le gérer. Entre "chaque codeur le sien", et à l'opposé "un seul qui est commun pour tout le projet", toutes les saveurs existent !

Open code avec Ollama

Toujours dans l'iée de ne pas être accroc à un abonnement (mais ça devient de plus en plus dur… ) je me suis amusé à utiliser open code au lieu de claude code (un autre outil d'agent IA, très ressemblant), et mon instance locale ollama au lieu de Claude. J'ai fais quelques essais avec le LLM ministral (cocorico !) ou qwen3 (celui d'Alibaba, le chinois qui devient connu également pour ses LLM). Concrètement ça marche certes, mais évidemment c'est moins rapide, moins pertinent…

J'appelle ça le niveau 2 parce que clairement, on a passé un niveau ! Un niveau en matière d'utilisabilité, oui on peut coder, trouver des bugs, refactorer… mais aussi on est un peu plus impliqué dans le résultat final, de par la qualité des prompts demandés.

Niveau 3 : Skills

Comme dit précédemment, la fenêtre de contexte est assez stratégique. C'est en gros ce qui coûte en ressources, il faut la gérer au mieux. Un "skill" ça pourrait être caricaturé par "oublie tout ce que j'ai dis jusqu'à présent et concentre-toi sur un point particulier".

Concrètement, c'est un nouveau fichier markdwon écrit à destination de l'agent (Claude code par exemple). C'est un nouveau prompt, mais spécialisé sur un point particulier.

Par exemple on va créer un skill de relecteur de code. En lui disant quelque chose comme "tu vérifies les best practices, les règles de codage. tu vérifies qu'il n'y a pas de code dupliqué" il va relire le code que le même LLM a généré et le voir d'un autre œil. Selon le contexte et la situation, il arrive qu'il corrige ainsi son propre code !

Idem pour un agent spécialisé cybersécurité par exemple, il peut écrire un rapport par exemple en suggérant des améliorations de code.

J'appelle ça le niveau 3 parce que ça permet de comprendre réellement les limites des LLM. Vraiment, tu n'as que ce que tu demandes. On le sait depuis le début, c'est un évidence, mais là ça formalise l'exercice de parler différemment au même LLM pour avoir différents comportements, complémentaires souvent, mais parfois même contradictoires.

Niveau 4 : MCP

Quand on utilise un agent IA, comme Claude code, le LLM sait faire certaines choses basiques : lire un fichier, le modifier, exécuter une commande shell (comme grep, sed ou git) mais pas grand-chose de plus. On peut lui ajouter des fonctionnalités via le protocole MCP (Model Context Protocol).

Un exemple qu'on peut citer ce serait un LLM qui remplace le SAV d'une entreprise de VPC. En codant un MCP permettant d'accéder à la base de donnée, le LLM pourra répondre à M. Toutlemonde "oui, je vous confirme que votre paquet a été posté hier". Ce n'est pas un LLM entraîné pour, c'est un LLM tout à fait standard qu'on prend tel quel et auquel on explique simplement comment faire telle ou telle action.

Concrètement il s'agit de code python (qui utilise un SDK dédié) et qui fournit quelques fonctions. Ensuite encore et toujours via un fichier markdown on décrira l'utilisation. Par exemple "pour accéder à la base de donnée tu dois utiliser le MCP my_bdd.". Les docstrings de chaque fonction suffisent souvent au LLM à comprendre leur but et leur mode d'emploi. Mais si on veut détailler des choses, il "suffit" de les ajouter dans ce markdown.

Dans mon cas, j'ai commencé à écrire un MCP utilisant labgrid, un framework d'accès à des machines physiques en vue de tests automatiques. Je le fais tourner en local sur ollama avec un LLM standard (ministral), et du coup je peux lui dire "dis-moi la RAM libre au moment du boot sur les produits de type X, Y et Z". Il saura réserver chacun des bancs de tests, le booter, lancer une commande SSH simple et me donner le résultat. Pour l'instant ça ne me sert à rien (j'ai déjà des tests pytests qui le font formellement) mais je voulais tenter l'expérience, et il faut reconnaître que c'est assez troublant de voir avec quelle facilité on peut permettre à une IA d'accéder au monde réel.

J'appelle ça le niveau 4 parce qu’on apprend à donner encore plus de possibilités à son agent LLM, et on peut ainsi sortir du cadre imposé par l'outil agent.

Conclusion

Voilà, c'est là où j'en suis, et j'ai déjà quelques pistes pour la suite.

RAG : il s'agit en gros de prendre un modèle et de l'entraîner un peu plus sur ses propres données (typiquement de la doc) (EDIT en fait ça pas ça, voir ce fil de commentaires pour plus de détails). J'en sais pas plus, et maintenant que je sais utiliser MCP je ne vois pas vraiment les cas d'usage que ça pourrait combler
Gas Town : quelques collègues ont commencé à jouer avec Gas Town. Si j'ai bien compris, il s'agit d'une organisation complète de différents agents/skills qui s'organisent et se supervisent entre eux

J'espère que ce journal a permis de mieux faire comprendre les quelques termes techniques de base qui gravitent autour de l'utilisation des LLM dans le contexte du développement logiciel, qu'il permettra de mieux comprendre les prochaines publications sur LinuxFR.org qui deviendront fatalement de plus en plus techniques sur les sujets d'IA, et évidemment axées sur le développement logiciel. En tous cas j'ai passé pas mal de temps à voir passer des infos que je ne comprenais pas du tout, tout en me disant que je passais à côté de quelque chose.

Bref, si vous jugez l'IA pour le développement logiciel en étant resté simplement à copier/coller du code dans l'interface web d'un LLM, je vous engage à essayer d'aller plus loin, c'est réellement une autre dimension.

# RAG

Posté par barmic 🦦 le 17 mai 2026 à 00:20. Évalué à 7 (+6/-0).

RAG : il s'agit en gros de prendre un modèle et de l'entraîner un peu plus sur ses propres données (typiquement de la doc). J'en sais pas plus, et maintenant que je sais utiliser MCP je ne vois pas vraiment les cas d'usage que ça pourrait combler

Non tu confond avec le fine tuning. Le fine tuning c’est ce que tu commence à décrire le RAG, c’est le fait de donner des documents à une IA. L’intérêt c’est qu’il requête ces documents via des embeddings qui sont plus sémantiques que ce que tu peut faire avec un MCP par exemple.

L’intérêt du RAG face au fine tuned c’est que c’est plus dynamique. Tu n’a pas un entraînement coûteux à faire pour intégrer des nouveaux documents.

https://linuxfr.org/users/barmic/journaux/y-en-a-marre-de-ce-gros-troll

Répondre
- [^] # Re: RAG
  
  Posté par gUI (Mastodon) le 17 mai 2026 à 06:50. Évalué à 3 (+0/-0).
  
  Ok donc le RAG c'est enrichir encore le contexte ? Tu files à l'utilisateur final un LLM "classique" dont le prompt est déjà enrichi par des données ?
  
  En théorie, la théorie et la pratique c'est pareil. En pratique c'est pas vrai.
  
  Répondre
  - [^] # Re: RAG
    
    Posté par jtremesay (site web personnel) le 17 mai 2026 à 07:07. Évalué à 2 (+0/-0).
    
    C'est de la recherche sémantique.
    
    L'agent gagne la possibilité d'interroger une base de donnée de documents afin de récupérer les plus pertinents.
    
    Répondre
    - [^] # Re: RAG
      
      Posté par gUI (Mastodon) le 17 mai 2026 à 07:33. Évalué à 3 (+0/-0).
      
      L'agent gagne la possibilité d'interroger une base de donnée
      
      Arglll… pour moi filer des possibilités nouvelles à un agent c'est clairement du MCP (ce que j'ai déjà implémenté).
      
      En théorie, la théorie et la pratique c'est pareil. En pratique c'est pas vrai.
      
      Répondre
      - [^] # Re: RAG
        
        Posté par mrlem (site web personnel, Mastodon) le 17 mai 2026 à 08:07. Évalué à 4 (+3/-0). Dernière modification le 17 mai 2026 à 08:07.
        
        Le point vraiment différent, de ce que je comprends (je ne suis pas expert du tout), c'est que pour le RAG il faut passer tes données dans une moulinette pour peupler une vector database qui va permettre d'interroger tes documents de manière assez efficace. Il va falloir fine-tuner les paramètres de cette moulinette avec des valeurs qui dépendent assez largement de la nature des documents traités.
        
        J'avais commencé à regarder aussi, ça semblait assez efficace, mais complexe à mettre en place et paramétrer.
        
        En fait je trouve que ça fait beaucoup d'overhead et que ça limite les cas d'utilisation. Notamment, ça me semble plus adaptés à des corpus documentaires qui ne changent pas (parceque sinon, te devrais mettre à jour ta vector database, et je ne crois pas que l'on puisse faire ça par delta).
        
        Au final, depuis que j'ai découvert les MCP, je trouve ça plus flexible d'un point de vue utilisation.
        
        Répondre
        
        [^] # Re: RAG
        
        Posté par jtremesay (site web personnel) le 17 mai 2026 à 08:39. Évalué à 4 (+2/-0).
        
        Tout a fait.
        
        (source)
        
        En amont tu génères les vecteurs sémantiques ("embedding") de tes documents en utilisant un modèle spécialisé pour ça ("embedding model") et tu fous tout ça dans une base de donnée.
        
        Puis au runtime, tu fais une requête en langage naturel qui est elle aussi transformé en vecteur sémantique avec le modèle spécialisé que tu compares aux vecteurs de documents pour voir lesquels sont les plus proches.
        
        En fait je trouve que ça fait beaucoup d'overhead et que ça limite les cas d'utilisation. Notamment, ça me semble plus adaptés à des corpus documentaires qui ne changent pas (parceque sinon, te devrais mettre à jour ta vector database, et je ne crois pas que l'on puisse faire ça par delta).
        
        Tu n'as besoin de mettre à jour que les vecteurs des documents qui ont changés, pas recalculer toute la base de donnée.
        
        Répondre
        
        [^] # Re: RAG
        
        Posté par gUI (Mastodon) le 17 mai 2026 à 09:32. Évalué à 3 (+0/-0).
        
        Merci pour toutes ces infos, j'ai modifié le journal pour renvoyer vers ce fil.
        
        En théorie, la théorie et la pratique c'est pareil. En pratique c'est pas vrai.
        
        Répondre
      - [^] # Re: RAG
        
        Posté par jtremesay (site web personnel) le 17 mai 2026 à 08:16. Évalué à 2 (+0/-0).
        
        Ben c'est deux notions orthogonales. Tout RAG n'est pas nécessairement implémenté via un MCP et tout MCP ne permet pas de faire du RAG.
        
        Répondre
  - [^] # Re: RAG
    
    Posté par YBoy360 (site web personnel) le 17 mai 2026 à 08:43. Évalué à 3 (+1/-0). Dernière modification le 17 mai 2026 à 08:45.
    
    Le RAG permets plus de borner la réponse pour éviter les hallucinations.
    
    Le résultat des documents matchés est réinjecté dans le prompt si tu fais bien les choses.
    
    Il y a donc 2 étapes dans le RAG : on cherche des parties de documents liées au prompt, puis on utilise une template pour reformuler le prompt en injectant le résultat de l'étape précédente.
    
    Comme dit Barmic, c'est différent du fine tuning, c'est très économique (si tu caches tes vecteurs en db) …
    
    I use Arch BTW
    
    Répondre
# Parcours

Posté par mrlem (site web personnel, Mastodon) le 17 mai 2026 à 08:30. Évalué à 4 (+4/-1). Dernière modification le 17 mai 2026 à 08:35.
Comme tu le mentionnes, j'ai l'impression qu'il y a vraiment cette notion de "parcours initiatique". Et tant qu'on ne le suit pas d'une manière où une autre, on peut lire plein d'articles, mais ça reste flou.

Quelques petits commentaires :
- je n'aurais pas classé skills et MCP, parceque ce sont 2 choses à mon avis complémentaires
- je n'aurais pas défini Claude Code comme un agent IA, mais comme un outil permettant faire de l'IA agentique, au sens où il fournit une infrastructure modulaire avec des skills, des MCP, et surtout des agents (tu peux aussi en définir toi même) qu'il va orchestrer pour réaliser des tâches complexes.
- au sein de Claude Code, j'aurais même rajouté une étape : l'utilisation du mode "plan" - en planifiant le travail à venir, on obtient des résultats beaucoup plus pertinents avec moins d'itérations coûteuses
Mon expérience :

J'utilise au travail Claude Code, mais à titre perso, j'essaie de fonctionner avec Mistral Vibe branché sur un modèle devstral-small. C'est clairement plus rustique, mais ça répond à pas mal de mes besoins, avec une consommation beaucoup raisonnable que des modèles plus grands. Ces 2 configurations fonctionnent pour moi parcequ'elles correspondent à 2 objectifs complètement différents :
- au travail : je ne produis quasi plus de code, et l'enjeu est de réussir à affiner skills, utilisation de MCP, stratégies de prompting pour réduire les itérations nécessaires
- en perso : je veux rester rester auteur de mon code, j'utilise principalement l'IA pour sa rapidité d'analyse de code, pour rapidement avoir une idée de comment marche telle ou telle API, pour investiguer des erreurs complexes, et pour confronter mes choix et éventuellement découvrir des alternatives
Répondre
- [^] # Re: Parcours
  
  Posté par jtremesay (site web personnel) le 17 mai 2026 à 09:09. Évalué à 5 (+5/-2).
  
  j'ai commencé à jouer avec les LLM fin 2023 quand j'ai réalisé que je pouvais les faire tourner en local (ollama) sans donner mes sous à une boite fondé par Musk et financé par Microsoft (OpenAI).
  
  Mon premier projet fut de ressusciter mon bon vieux bot ~~IRC~~ ~~XMPP~~ Mattermost (il a voyagé ce truc) afin de faire marrer les copains. Ça nous a permit de faire d’hilarantes parties de jeu de rôles. Meilleur meujeuh de ma vie, je recommande.
  
  L'idée a tellement plus au patron qu'il m'a demandé de le réimplémenté pour le Slack du taf et de l'interconnecter à la DB de notre produit principal afin que les non-techs ne soient plus obligés de passer par les techs pour extraire des insights. Le langage naturel, c'est la vie.
  
  Sinon, j'ai un abonnement à GitHub Copilot. J'adore l'auto-complétion intelligente. J'aime bien avoir ~~quelqu'un~~ quelque chose à qui poser mes questions. Il m'arrive de vibe-coder les parties chiantes et qui ne m'intéresse pas sur mes projets persos. On ne vibe-code pas au taf parce que le truc a un peu de mal avec la taille et la complexité de notre base de code, et que personne ne s'est donné la peine de créer les skills et prompts qui vont bien pour guider efficacement l'outil. En plus j'aime pas trop vibe-coder parce que ça me donne plus l'impression d'être un manager que d'être un développeur.
  
  Répondre
# Une autre dimension… qui mène où ?

Posté par PhRæD le 17 mai 2026 à 21:42. Évalué à 10 (+10/-0).

Merci pour le partage.

Là où je travaille, on en est au même point, avec toujours cette question lancinante : quand est-ce qu’on pourra en tirer quelque chose d’opérationnel ?

Nous vivons une époque unique : pour la première fois, mon entreprise me met à disposition un outil dont je dois trouver moi-même l’usage !

Quand on y réfléchit, c’est assez cocasse ! D’habitude, un truc chouette sort, et il faut attendre parfois des années avant que l’entreprise ne se décide enfin à le mettre à disposition. Par exemple, avant d’avoir un wiki digne de ce nom, ça en a mis du temps (reste maintenant à ce qu’il soit correctement utilisé, mais ça, c’est une autre histoire…).

Là, mon entreprise dépense des sommes considérables pour me mettre dans les mains un outil dont je ne sais pas quoi faire : on m’offre même des ateliers d’une heure toutes les deux semaines pour partager les cas d’usage qu’on a pu lui trouver. Dingue !

Cela étant dit, lors de la dernière réunion de service, pour la première fois, on a eu écho des premières restrictions d’usage : il va être établi des quotas d’usage, certains utilisateurs ayant visiblement « dépassé les bornes des limites ». Les premiers frémissement annonçant la crise scélérate ?

« Y a même des gens qui ont l’air vivant, mais ils sont morts depuis longtemps ! »

Répondre
- [^] # Re: Une autre dimension… qui mène où ?
  
  Posté par Luc-Skywalker le 17 mai 2026 à 23:29. Évalué à 10 (+8/-0).
  
  ça rejoint un peu ce qui est relaté ci dessous:
  40 TOPS de NPU sont exigés par Win11, mais pour quoi faire ?
  Si c'est pour enlever les yeux rouges sur une photo et utiliser les services de CoPilot pour le reste, je dirais "tout ça pour ça"
  
  "Si tous les cons volaient, il ferait nuit" F. Dard
  
  Répondre
# NPU ?

Posté par sjub le 17 mai 2026 à 22:09. Évalué à 5 (+4/-0).

Le fait qu'une carte GPU AMD ne suffise pas (lent et pas pertinent d'après l'auteur) pour l'utilisation la plus courante en local pose la question de l'utilité des NPU dans les processeurs actuels.
Est-ce que quelqu'un a un retour sur leur utilisation ?
En plus il faut de la mémoire pour faire tourner tout ça donc avec le prix de la mémoire en ce moment est-ce que ce ne sera pas plus utile de virer les NPU et mettre plus de coeurs ou d'unités GPU qui servent à plein d'autres choses (ou juste les virer et faire payer moins cher…) ?

Répondre
- [^] # Re: NPU ?
  
  Posté par Luc-Skywalker le 17 mai 2026 à 23:28. Évalué à 4 (+2/-0).
  
  c'est une vraie question !
  vu que c'est fourni d'Office
  
  "Si tous les cons volaient, il ferait nuit" F. Dard
  
  Répondre
- [^] # Re: NPU ?
  
  Posté par gUI (Mastodon) le 18 mai 2026 à 08:50. Évalué à 4 (+1/-0).
  
  pour l'utilisation la plus courante en local
  
  Je ne pense pas que le développement logiciel est l'utilisation la plus courante des LLM.
  
  En local plein de choses marchent très bien. Par exemple tout ce qui est blabla (traduction, correction orthographe/grammaire, ou génération de texte) ou vision (1s en gros pour me décrire le contenu d'un screenshot). Il doit y avoir d'autres domaines, mais j'ai pas (encore) expérimenté personnellement.
  
  En théorie, la théorie et la pratique c'est pareil. En pratique c'est pas vrai.
  
  Répondre
- [^] # Re: NPU ?
  
  Posté par Renault (site web personnel) le 18 mai 2026 à 08:53. Évalué à 4 (+1/-0).
  
  L'objectif des NPUs dans les ordinateurs portables n'est pas de faire tourner de gros LLMs, ni même forcément des LLMs tout court d'ailleurs.
  
  Répondre
  - [^] # Re: NPU ?
    
    Posté par nonas le 18 mai 2026 à 22:42. Évalué à 4 (+2/-0).
    
    Et donc quel est l'objectif des NPU ?
    Quels logiciels en profitent ?
    
    Répondre
    - [^] # Re: NPU ?
      
      Posté par barmic 🦦 le 19 mai 2026 à 11:10. Évalué à 3 (+1/-0).
      
      Les modèles spécifiques text 2 speach, speach 2 text, detection d'yeux rouge,… Donc beaucoup de classification qui travaillent avec peu de mémoire.
      
      Photoshop peu beaucoup en profiter, je sais pas ce qu'en fait win mais si tu ouvre ton ordi sur de la reconnaissance de visage, s'ils veulent catégoriser tes fichiers.
      
      Dis-toi que la première limite pour faire tourner des llm sur ta carte graphique c'est le volume mémoire. Donc une puce n'est pas livrée avec au minimum 8Gio de RAM (mais 16 ou 32 c'est mieux) elle n'est pas prévu pour les llm.
      
      Si tu as un nombre d'opérations par seconde trop bas ton llm va ramer, si tu n'a pas assez de mémoire il ne se lancera pas
      
      https://linuxfr.org/users/barmic/journaux/y-en-a-marre-de-ce-gros-troll
      
      Répondre
# ohhohohoh !

Posté par Graveen le 17 mai 2026 à 22:41. Évalué à 3 (+2/-1).

Je fais comme toi, en ce moment, et je commence le niveau 3.
Je n'aurais pas formulé mieux pour un retex :)

Répondre
# Pré-requis

Posté par Benoît Sibaud (site web personnel) le 18 mai 2026 à 10:39. Évalué à 10 (+8/-0).
Les pré-requis sont limitants : il faut soit
- acheter une grosse carte graphique avec de la RAM (donc écologiquement/économiquement/énergétiquement il faut avoir une certaine motivation à ce dire qu'on va l'utiliser ensuite sérieusement)
- se créer une dépendance à un service LLM extérieur (ce qui est plutôt ce que je cherche à limiter en faisant du libre perso)
Évidemment les personnes passionnées/convaincues/exploratrices ne se posent pas trop de questions, mais je commencerais bien par regarder le peu qui est faisable avec le matériel dont je dispose déjà (une sorte de niveau 0.5) et voir si ça vaut le coup par rapport à du code/script purement déterministe dans ces conditions.
Répondre
- [^] # Re: Pré-requis
  
  Posté par gUI (Mastodon) le 18 mai 2026 à 10:47. Évalué à 3 (+0/-0).
  
  Pour du développement pur style IA agentique c'est clairement peine perdue.
  
  Par contre pour de l'auto-completion dans ton Vim par exemple, ça se tente peut-être. J'ai pas essayé mais je pense sincèrement que ça se tente.
  
  En théorie, la théorie et la pratique c'est pareil. En pratique c'est pas vrai.
  
  Répondre
- [^] # Re: Pré-requis
  
  Posté par fearan le 18 mai 2026 à 11:06. Évalué à 3 (+0/-0).
  
  acheter une grosse carte graphique avec de la RAM (donc écologiquement/économiquement/énergétiquement il faut avoir une certaine motivation à ce dire qu'on va l'utiliser ensuite sérieusement)
  
  Ça dépends, si on aime le jeu vidéo, acheter une grosse carte c'est pas déconnant :D Bon j'ai acheté la mienne avant que ça ne devienne délirant, aujourd'hui pour le même coût j'aurais probablement moins bien.
  
  Il ne faut pas décorner les boeufs avant d'avoir semé le vent
  
  Répondre
- [^] # Re: Pré-requis
  
  Posté par Sébastien B. le 18 mai 2026 à 13:44. Évalué à 5 (+3/-0).
  
  En vrai, si tu veux passer par des LLMs locaux, il te faut du matériel ET te créer une dépendance à un service qui te fourni des LLMs. Tu ne peux pas créer tes propres LLMs locaux, seules une poignée de grosse boite a les moyens financiers de le faire. Pour le moment, certaines de ces boites partagent certains de leur LLMs, mais c'est pas dit que ça continue.
  Et je doute que quiconque ait envie de rester bloquer avec un LLM qui croit que le président c'est Pompidou, donc le fait de ne jamais mettre à jour un LLM me paraît assez baroque, surtout pour certains domaines (informatique notamment).
  
  Répondre
  - [^] # Re: Pré-requis
    
    Posté par Benoît Sibaud (site web personnel) le 19 mai 2026 à 09:15. Évalué à 5 (+2/-0).
    
    Je pense surtout que ça lève la question du "Large" dans LLM. Si je veux faire du RoR, du Go, du Javascript ou du SQL pour LinuxFr, je m'en cogne que mon assistant/agent connaisse les présidents de la Ve ou le président actuel (ni les IDE ni les compilateurs/linters/analyseurs ne les connaissent non plus et on a survécu avec). Qu'il soit "un peu" daté n'est pas forcément un souci non plus à mon avis : déjà moi je le suis parce que j'utilise pas ses technos au quotidien, ensuite on n'utilise pas du bleeding edge non plus, enfin je suis plus intéressé par l'assistance (un petit côté CI/CD en local qui va exécuter des tâches automatisées) que par la génération de code dernier cri.
    
    Maintenant est-ce que des modèles spécialisés sont disponibles, sous licence libre et moins gourmands, ça reste à démontrer…
    
    Répondre
    - [^] # Re: Pré-requis
      
      Posté par Renault (site web personnel) le 19 mai 2026 à 09:25. Évalué à 3 (+0/-0).
      
      Je pense que trop spécialiser les modèles dans le cadre du codage pourrait retirer justement une partie de leur force car le code est utilisé dans tous les domaines pour des applications très variées et doit donc être en mesure de s'adapter à une quantité massive de contextes différents. S'il ne sait faire admettons que du code, l'IA aura bien du mal à s'adapter à de nombreux projets et à être efficient pour l'utilisateur.
      
      Répondre
- [^] # Re: Pré-requis
  
  Posté par nonas le 18 mai 2026 à 22:47. Évalué à 4 (+2/-0). Dernière modification le 18 mai 2026 à 22:48.
  
  J'avais vu passer sur HN ce dépôt qui décrit un peu ce qu'il est possible de faire avant de sortir l'artillerie lourde que sont les modèles frontier (les derniers nés de Anthropic, OpenAI etc)
  
  https://github.com/NehmeAILabs/llm-sanity-checks
  
  Peut-être plus facile à faire tourner en local.
  
  (Note : je n'y connais pas grand chose, sur l'échelle de gUI™, j'en suis au niveau 0, par radinerie et par réticence à installer tout agent sur ma machine)
  
  Répondre
  - [^] # Re: Pré-requis
    
    Posté par gUI (Mastodon) le 19 mai 2026 à 07:37. Évalué à 4 (+1/-0).
    
    Excellente ressource, merci !
    
    En théorie, la théorie et la pratique c'est pareil. En pratique c'est pas vrai.
    
    Répondre
# Niveau 5 : arrêtez d'utiliser de l'IA

Posté par Laurent Pointecouteau (site web personnel, Mastodon) le 19 mai 2026 à 00:52. Évalué à 10 (+12/-3).

En dehors du RAG ou de l'analyse textométrique via des modèles locaux (donc des "petits" modèles de langage), et encore je n'en suis même plus tout à fait sûr, il est impossible de faire de l'IA sans ravager des pays (jamais en Occident) où se trouvent les matières premières des GPU, faire trimer leurs habitants (jamais des blancs) à des tâches dégradantes et sous-payées, piller sans vergogne tout le patrimoine immatériel numérisé, défoncer des pans entiers du web ouvert et du logiciel libre, détourner l'économie et le droit pour flinguer le marché des semi-conducteurs et l'écosystème des lieux où on veut construire des datacenters, enfin collaborer au projets fascistes d'une poignée de milliardaires irresponsables. Cessez d'y toucher avant qu'il ne soit trop tard pour le démanteler.

Répondre
- [^] # Re: Niveau 5 : arrêtez d'utiliser de l'IA
  
  Posté par arnaudus le 19 mai 2026 à 10:35. Évalué à 0 (+2/-5). Dernière modification le 19 mai 2026 à 10:37.
  
  Jamais dans l'histoire des avancées technologiques de l'humanité, il n'a été possible de faire rentrer le dentifrice dans le tube. Nos sociétés ne le permettent pas, et nos cerveaux ne le permettent pas. On ne peut pas "désapprendre" le fonctionnement des LLM, et même s'ils étaient régulés et si le public cessait de les utiliser, ils ne cesseraient pas d'exister pour autant; les gens pourraient financer leurs propres serveurs (comme les mineurs de Bitcoin), s'échanger des fichiers de poids sous le manteau, les modèles continueraient à être entrainés en interne par les grandes entreprises, des LLM seraient entrainés à des fins de recherche scientifique… Il y aurait automatiquement des pays qui n'auraient pas de législation restrictive et qui pourraient héberger ces gros datacenters.
  
  Après, la décision de s'auto-limiter en refusant par principe d'utiliser une technologie reste tout à fait possible; nos sociétés libérales permettent ce genre de choses, et il existe plein de communautés qui sont fondées sur une forme d'Amishisation à différents stades technologiques, donc pourquoi pas 2020? Je pense que peu de gens nient cette liberté. Le problème c'est l'idée d'imposer ça à tous (par la loi? par la force? juste par persuasion?). Rien de ceci ne serait légal ni légitime dans nos sociétés, et rendre des algorithmes illégaux par principe ne semble même pas compatible avec les concepts de base du logiciel libre (en fait, ça ne semble pas compatible avec grand chose qui ne ressemblerait pas aux pires régimes autoritaires). Si l'idée est de dire "ça serait mieux pour tous d'arrêter nos bêtises et de réaliser une transition vers une société décroissante", bah on peut partager cette idée (qui n'est quand même pas majoritaire), mais ça ne dit pas "comment" on fait. Si "comment" implique que la police puisse visiter mon garage pour vérifier que je ne fais pas tourner un LLM sur un vieux serveur, ou qu'Internet soit régulé au point où je ne puisse pas accéder au clouds LLM hébergés à l'étranger, je suis vachement moins d'accord.
  
  Dans le milieu professionnel, c'est plus délicat. Ton employeur peut respecter tes engagements personnels tout en constatant leur incompatibilité avec le développement de l'entreprise, et se passer de tes services. Et comme tu peux le voir dans cette discussion, le monde regorge de curieux, des gens qui ont moins peur de l'avenir que toi et qui voient plein de développements possibles pour cette technologie; les entreprises ne vont pas manquer de main d'oeuvre pour mettre tout ça en place, et ta résistance n'aura servi qu'à te mettre en marge de la société. Est-ce que c'est la meilleure stratégie?
  
  Répondre
  - [^] # Re: Niveau 5 : arrêtez d'utiliser de l'IA
    
    Posté par raphj (site web personnel) le 19 mai 2026 à 12:20. Évalué à 8 (+6/-0). Dernière modification le 19 mai 2026 à 12:25.
    
    (en fait, ça ne semble pas compatible avec grand chose qui ne ressemblerait pas aux pires régimes autoritaires)
    
    […]
    
    Si "comment" implique que la police puisse visiter mon garage pour vérifier que je ne fais pas tourner un LLM sur un vieux serveur
    
    Cette tendance à brandir l'épouvantail du régime totalitaire quand tu n'es pas d'accord avec les idées de quelqu'un pour le décrédibiliser…
    
    Remarque, c'est commode. Une technologie est produite avec des méthodes affreuses (et avec beaucoup de conséquences négatives aussi), mais bon, maintenant que c'est là, faudrait pas trop chercher à limiter son développement et notre sainte liberté individuelle de l'utiliser… Ce serait totalitaire.
    
    Je n'ai vu et lu personne suggérer des méthodes totalitaires contre le développement ou l'usage des LLM. Le plus violent que j'ai vu c'est l'appel au boycott. Tu parles de méthodes totalitaires.
    
    On rappellera que, l'IA générative, elle, en revanche, a été poussée de manière très peu démocratique : les acteurs clés - investisseurs, big tech et leurs CEOs… n'ont jamais été élus.
    
    Je retourne l'accusation déguisée.
    
    Répondre
  - [^] # Re: Niveau 5 : arrêtez d'utiliser de l'IA
    
    Posté par Renault (site web personnel) le 19 mai 2026 à 12:29. Évalué à 8 (+5/-0).
    
    Mouais je trouve cette argumentation très légère.
    
    Il y a des tas de technologies dont l'usage est restreint voire totalement proscrit. On peut penser en particulier aux armes ou à des substances chimiques pour différents usages.
    
    Cela n'empêche pas entièrement les dérives, les usages illégaux malgré la prohibition, ou leur production et usage sous le manteau mais ça évite pas mal des effets néfastes en rendant leur accès plus compliqué et leur usage moins fréquent.
    
    De même qu'il y a des tas de lois pour réglementer les produits et entreprises qui permettent des contrôles internes fouillés qu'on ne voit pas dans cette industrie alors que ça serait probablement nécessaire pour éviter certaines dérives aussi.
    
    Ce n'est pas parce que la technologie est là qu'on ne peut et qu'on ne doit pas réglementer à son sujet, au contraire. Et la population a tout à fait le droit d'exiger des contrôles ou limitations si elle le juge nécessaire. C'est un peu la base de la démocratie après tout.
    
    Répondre
    - [^] # Re: Niveau 5 : arrêtez d'utiliser de l'IA
      
      Posté par arnaudus le 19 mai 2026 à 15:16. Évalué à -1 (+0/-4).
      
      Il y a des tas de technologies dont l'usage est restreint voire totalement proscrit. On peut penser en particulier aux armes ou à des substances chimiques pour différents usages.
      
      Il y a au contraire très peu de produits dont l'usage est proscrit. C'est parfois la vente au public qui est interdite, mais pour les armes par exemple, c'est une industrie qui représente plus de 1% du PIB. Pour les substances chimiques, c'est pas l'usage général de substances chimiques qui est interdite, c'est certaines substances très particulières dont l'usage dans certaines conditions est règlementé. D'une manière générale, il faut des raisons valides et concrètes pour interdire un truc; si les députés voteraient demain l'interdiction de porter des tongs, le conseil constitutionnel censurerait cette loi.
      
      Bien sûr qu'il faut règlementer l'usage de l'IA, depuis maintenant plusieurs années je raconte à qui veut l'entendre qu'il faudrait que l'"usurpation d'humanité" (faire passer une IA pour un humain) soit passible d'une peine de prison; je suis évidemment favorable à interdire au grand public d'accéder à des technologies permettant de faire des fausses photos ou vidéos avec des vrais gens, comme on interdit les technologies permettant de faire de faux billets ou de faux papiers. Mais tout ça n'a rien à voir avec une sorte de bannissement d'une catégorie générique d'algorithmes sous prétexte de d'externalités potentiellement négatives.
      
      C'est vraiment là où est la limite. Dans cette discussion, il est clair que certains savent de quoi ils parlent et ont embrassé cette technologie sans peur de l'avenir, simplement parce qu'ils ont envie d'exploiter ses possibilités. D'autres sont sur la défensive et ne souhaitent pas l'utiliser, parfois en fantasmant n'importe quoi sur ses performances ("ça n'est qu'un perroquet stochastique", etc). À chaque rupture technologique, il y a eu de telles fractures dans la société, et je dis juste que les derniers n'ont jamais gagné, et ils n'ont d'ailleurs même jamais eu raison, je pense. Les seuls cas discutables que je retrouve sont ceux où il a fallu modifier la technologie pour limiter ses externalités négatives (par exemple, remplacer le gaz des climatisations, ou électrifier le parc automobile), mais quelle technologie (en dehors de celles conçues pour tuer) aurait-il mieux valu ne pas développer?
      
      Répondre
      - [^] # Re: Niveau 5 : arrêtez d'utiliser de l'IA
        
        Posté par Sébastien B. le 19 mai 2026 à 15:49. Évalué à 5 (+3/-0). Dernière modification le 19 mai 2026 à 15:51.
        
        Le plomb dans l'essence (et dans la peinture) ? Tout ce qui est à base d'amiante ? Foutre du radium dans chaque objet de la vie quotidienne ? ~~les trampolines pour enfants qu'on a chez soi ?~~ Le dioxyde de titane dans la nourriture et les cosmétiques ? Tous les gaz interdits parce que la couche d'ozone tout ça ?
        
        Répondre
        
        [^] # Re: Niveau 5 : arrêtez d'utiliser de l'IA
        
        Posté par raphj (site web personnel) le 19 mai 2026 à 15:58. Évalué à 5 (+3/-0). Dernière modification le 19 mai 2026 à 16:00.
        
        Les emballages à usage unique qui ont remplacé la réutilisation et les consignes.
        
        L'enshittification. Le gratuit financé par la pub et le pistage.
        
        Répondre
      - [^] # Re: Niveau 5 : arrêtez d'utiliser de l'IA
        
        Posté par raphj (site web personnel) le 19 mai 2026 à 15:57. Évalué à 7 (+5/-0). Dernière modification le 19 mai 2026 à 16:01.
        
        ont embrassé cette technologie sans peur de l'avenir
        
        C'est une manière de le présenter.
        
        sans se préoccuper / en ignorant / en acceptant les conséquences négatives
        
        En serait une autre.
        
        Mais je comprends que tu ne crois pas vraiment qu'il y en a :
        
        sous prétexte de d'externalités potentiellement négatives
        
        (emphase de moi)
        
        En résumé, les gens qui rejettent l'IA sont juste des réac' qui ont des peurs irrationnelles, et ils ont tort parce que le changement est inévitable et toute résistance est futile. Super.
        
        Ça s'est déjà produit avec l'industrialisation, et maintenant on a un problème massif de changement climatique que personne ne résout. Parce que les gens qui l'ont imposés étaient "sans peur de l'avenir". Surtout, ils ne pensaient qu'à leur profit individuel sans se préoccuper du coût collectif. (je ne dis pas, l'industrialisation est bien sûr venue avec ses avantages, tout comme l'IA générative a ses avantages)
        
        Répondre
        
        [^] # Re: Niveau 5 : arrêtez d'utiliser de l'IA
        
        Posté par arnaudus le 19 mai 2026 à 17:17. Évalué à 1 (+0/-2). Dernière modification le 19 mai 2026 à 17:17.
        
        En résumé, les gens qui rejettent l'IA sont juste des réac' qui ont des peurs irrationnelles,
        
        Non, pas tous, il y a une grosse diversité parmi eux. Je trouve que les gens qui demandent à règlementer de manière urgente l'IA, si tu les classes parmi ceux qui rejettent l'IA, ne sont pas du tout irrationnels, ils ont même largement raison. Il y a aussi tous les arguments liés au droit d'auteur, que je trouve pertinents (même si c'est probablement trop tard: les trous dans le droit d'auteur ont permis aux IA de se servir à peu près légalement dans le corpus artistique, et le droit n'est pas rétroactif).
        
        Mais il y a aussi beaucoup d'irrationalité dans le rejet de l'IA. Il y a de la technophobie bête et méchante ("je suis dépassé par une technologie, donc je dis que c'est de la bouse"). Il y a de l'ignorance crasse ("peuh, c'est juste un perroquet stochastique"). Il y a du déni du wishfull thinking ("L'IA nous éloigne de la société décroissante qu'il faudrait viser, donc l'IA ne peut pas avoir d'externalités positives".). Il y a de l'agenda politique ("L'IA est promue par des gens que je n'aime pas, donc je n'aime pas l'IA").
        
        et ils ont tort parce que le changement est inévitable et toute résistance est futile.
        
        Oui. Certains peuvent s'épanouir dans la défense de causes perdues, mais d'autres préfèrent choisir leurs combats. En plus, je ne suis même pas convaincu que c'est une bonne cause. En particulier parce que l'IA peut aussi résoudre des problèmes, et pas seulement en causer.
        
        Répondre
        
        [^] # Re: Niveau 5 : arrêtez d'utiliser de l'IA
        
        Posté par thoasm le 19 mai 2026 à 18:12. Évalué à 7 (+4/-0).
        
        J'ai pas très bien compris quel combat tu avais choisi, à part te faire avocat de l'IA. Un combat qui ne manque pas de combattants très puissants … pas le plus compliqué à mener …
        
        Répondre
        
        [^] # Re: Niveau 5 : arrêtez d'utiliser de l'IA
        
        Posté par Luc-Skywalker le 19 mai 2026 à 19:23. Évalué à 3 (+1/-0).
        
        Il y a quand même une stratégie du fait accompli poussée par les gros sous:
        
        mon ordi a un NPU, mais j'en suis encore à essayer de comprendre à quoi il pourrait servir, mais je ne désespère pas d'en faire un truc.
        
        si cette folie spéculative devait se calmer un bon coup, il n'en restera pas moins une infrastructure massive dédiée à l'IA et je la vois mal s'arrêter du jour au lendemain.
        
        "Si tous les cons volaient, il ferait nuit" F. Dard
        
        Répondre
        
        [^] # Re: Niveau 5 : arrêtez d'utiliser de l'IA
        
        Posté par thoasm le 19 mai 2026 à 19:32. Évalué à 5 (+2/-0).
        
        Si on pouvait éteindre les centrales à gaz qu'ils sont supposés ouvrir ce serait mieux pour le climat, et l'énergie pourra probablement sans trop de problèmes servir à autre chose. Une partie du matos qui a servi à la course est parait-il déjà obsolète. Sinon je sais pas trop en quoi ça me répond :)
        
        Répondre
        
        [^] # Re: Niveau 5 : arrêtez d'utiliser de l'IA
        
        Posté par Luc-Skywalker le 19 mai 2026 à 22:11. Évalué à 3 (+1/-0).
        
        Pour être plus explicite
        
        Une partie du matos qui a servi à la course est parait-il déjà obsolète.
        
        A un moment on arrêtera peut être de "dépenser" des MD$ pour des trucs déjà "obsolètes" et
        
        qui n'auront jamais été rentabilisés
        
        ou qui sont inutilisés (ex, mon boulot: les ordis ont été upgradés pour Win11 avec le NPU obligatoire. Les postes sont complètement verrouillés, donc rien à en tirer, mais au moins, j'ai pas de compte chez MS),
        
        ou utilisés n'importe comment (cf Grok ou le coté Script Kiddy qui pollue le Web en général)
        
        Par contre, ce qui est déjà en place le restera, quitte à être racheté -winner takes all- par un plus gros que soi.
        
        Quelque part ici sur LinuxFr, on parle de mettre plusieurs CG d'okaze dans une même bécane d'okaze elle aussi (recyclage des ressources, lutte contre l'obsolescence programmée) , ou de faire un truc à la mode SETI@home (exploiter et partager -vive le Libre- ces NPU, ces GPU, ces 128 Go de DDRAM -prévision pour le passage à WIN12- très souvent dormants)
        
        Donc, je suis tout a fait convaincu que, tant localement, pour des problématiques simples, que pour ces systèmes démesurés, ça ne s’arrêtera de sitôt.
        
        "Si tous les cons volaient, il ferait nuit" F. Dard
        
        Répondre
        
        [^] # Re: Niveau 5 : arrêtez d'utiliser de l'IA
        
        Posté par gUI (Mastodon) le 19 mai 2026 à 22:33. Évalué à 6 (+3/-0).
        
        mon ordi a un NPU, mais j'en suis encore à essayer de comprendre à quoi il pourrait servir
        
        Ah mais ça mon ami c'est pas le soucis du vendeur :)
        
        Cela dit, la sous-utilisation des performances des ordis c'est même pas un classique, c'est carrément un business model. Les corei5 / 16Go de RAM / 1To de SSD pour lire du mail et faire 3 powerpoints, c'est ce qui fait vivre DELL, HP, Lenovo…
        
        D'ailleurs curieusement vu les explosions des prix du matériel, on va découvrir qu'il n'est finalement pas nécessaire de changer le matos des entreprises tous les 3 ans. Et bon courage à DELL, HP, Lenovo… pour les prochaines semestres.
        
        En théorie, la théorie et la pratique c'est pareil. En pratique c'est pas vrai.
        
        Répondre
        
        [^] # Re: Niveau 5 : arrêtez d'utiliser de l'IA
        
        Posté par BAud (site web personnel) le 25 mai 2026 à 14:54. Évalué à 3 (+1/-0).
        
        on va découvrir qu'il n'est finalement pas nécessaire de changer le matos des entreprises tous les 3 ans.
        
        eh ! mais comment je vais récupérer des portables et fixes sympas pour notre fablab !?
        
        Répondre
        
        [^] # Re: Niveau 5 : arrêtez d'utiliser de l'IA
        
        Posté par thoasm le 19 mai 2026 à 20:17. Évalué à 3 (+0/-0).
        
        Personnages puissants par ailleurs fort sympathiques et qui savent résoudre des problèmes importants pour l'humanité : https://bsky.app/profile/monniauxd.bsky.social/post/3mm7xyxrsss2e
        
        Répondre
        
        [^] # Re: Niveau 5 : arrêtez d'utiliser de l'IA
        
        Posté par raphj (site web personnel) le 19 mai 2026 à 20:33. Évalué à 2 (+0/-0). Dernière modification le 19 mai 2026 à 20:34.
        
        Possible de citer pour les gens qui n'ont pas de compte ? Même si je devine un peu ce que David Monniaux a pu écrire…
        
        Répondre
        
        [^] # Re: Niveau 5 : arrêtez d'utiliser de l'IA
        
        Posté par thoasm le 19 mai 2026 à 20:37. Évalué à 5 (+2/-0).
        
        Ah oui mince il est en privé :
        
        Ebola tue des noirs
        
        Post cité
        
        "A viral clip of Elon Musk laughing at DOGE cutting funding for Ebola prevention resurfaces amid global health emergency" https://www.indy100.com/viral/elon-musk-doge-ebola-prevention
        
        Répondre
        
        [^] # Re: Niveau 5 : arrêtez d'utiliser de l'IA
        
        Posté par raphj (site web personnel) le 19 mai 2026 à 23:02. Évalué à 4 (+2/-0).
        
        Merci !
        
        Au secours…
        
        Répondre
  - [^] # Re: Niveau 5 : arrêtez d'utiliser de l'IA
    
    Posté par Sébastien B. le 19 mai 2026 à 12:33. Évalué à 7 (+5/-0).
    
    Le dentifrice a besoin de centaines de milliards d'euros investis en pure perte pour ne pas rentrer tout seul dans le tube. Ça fait cher le dentifrice hors du tube et on sait toujours pas qui va payer pour ça.
    
    Je sais pas ce qu'est devenu le dentifrice du Métaverse ou des NFTs, mais bon, dans le tube ou non on est passés à autre chose, même si un pan entier du domaine croyait que c'était le futur parfaitement inévitable.
    
    Répondre
- [^] # Re: Niveau 5 : arrêtez d'utiliser de l'IA
  
  Posté par barmic 🦦 le 19 mai 2026 à 10:38. Évalué à 4 (+2/-0).
  
  Ce que tu décrit ça s'appelle l'informatique. Ce ne sont pas les llm qui ont créé les techno fascistes. Ils ne disparaîtront pas avec les llm. Ce n'est pas une question de ne rien faire mais de s'attaquer à la cause plutôt qu'au dernier artefact.
  
  Si demain mercredi 20 mai, on supprime tout llm. Imagine tu frotte une lampe et tout octet qui stocke un llm toutes machines confondues est à 0 sans possibilité de restauration. Tout les backup compris, il n'y a plus rien.
  
  Eh ben tous les effets que tu décrit existeront encore.
  
  https://linuxfr.org/users/barmic/journaux/y-en-a-marre-de-ce-gros-troll
  
  Répondre
  - [^] # Re: Niveau 5 : arrêtez d'utiliser de l'IA
    
    Posté par Laurent Pointecouteau (site web personnel, Mastodon) le 23 mai 2026 à 15:10. Évalué à 4 (+3/-1).
    
    Eh ben tous les effets que tu décrit existeront encore.
    
    Ah ben si après avoir frotté la lampe les gens s'empressent de refaire des LLM derrière, ça n'aura effectivement pas grand intérêt. L'idée c'est de ne pas donner de billes aux technofascistes en se reposant sur une technologie qui ne bénéficie qu'à eux.
    
    Une fois ceci accordé, le plus dur reste à faire : un numérique acceptable. Est-ce qu'on peut le faire avec du libre, du copyleft, ou du post-libre ? Est-ce qu'on le fait sur le fédivers, sur le smolweb, sur Gemini, en local-first voire sans internet ? Est-ce qu'on le fait sur des ordis open hardware réparables, ou sur des machines recyclées en mode permacomputing ? Je n'ai pas la réponse à toutes ces questions, mais si on s'en remet aux LLM comme une fatalité, j'ai peur qu'on oublie de se les poser.
    
    Répondre
    - [^] # Re: Niveau 5 : arrêtez d'utiliser de l'IA
      
      Posté par barmic 🦦 le 23 mai 2026 à 19:37. Évalué à 2 (+1/-1).
      Ah ben si après avoir frotté la lampe les gens s'empressent de refaire des LLM derrière, ça n'aura effectivement pas grand intérêt. L'idée c'est de ne pas donner de billes aux technofascistes en se reposant sur une technologie qui ne bénéficie qu'à eux.
      
      Ils avaient les billes avant et ils les auront après. Ils ne sont pas sorti de terre en 2021 ni même dans les années 2000. On leur donnaient d’autres noms, mais ils étaient là avant l’essor d’internet. Ford avait déjà des accointances avec le nazisme.
      
      un numérique acceptable
      
      https://louisderrac.com/transformer-le-numerique-des-pistes-pour-un-alternumerisme-radical
      
      Je vois que des vœux pieux. Un fairphone ne repose pas sur une industrie durable, dans aucun sens du terme. MNT utilise des composants produits à l’autre bout de la planète avec des matériaux extraits à un autre bout. Seul la conception et l’assemblage est fait à Berlin (pour des machines à 1500€)¹. Le numérique durable c’est un oxymore. On ne peut pas crée ce materiel de manière à la fois écologique, social et accessible à tous.
      
      Je te reprends parce que je trouve que donner des leçons de morales en ayant soit même ce genre de contradiction assez lénifiant. C’est rigolo de sauter tout de suite sur le côté logiciel, mais déjà il n’y a pas l’ombre d’un début de materiel durable.
      
      ce n’est pas une critique que j’ai contre eux. Je suis client. Ils ne peuvent pas faire autrement. Ils font du mieux qu’ils peuvent ce qui est très loin de l’alternumerisme radical que décrivent les liens que tu donne. C’est comme se féliciter des voitures hybrides parce que ça consomme moins d’essence que les voitures essence uniquement. ↩
      
      https://linuxfr.org/users/barmic/journaux/y-en-a-marre-de-ce-gros-troll
      Répondre
      - [^] # Re: Niveau 5 : arrêtez d'utiliser de l'IA
        
        Posté par Laurent Pointecouteau (site web personnel, Mastodon) le 25 mai 2026 à 13:30. Évalué à 5 (+4/-1). Dernière modification le 25 mai 2026 à 13:31.
        
        Je te reprends parce que je trouve que donner des leçons de morales en ayant soit même ce genre de contradiction assez lénifiant.
        
        Ce que je trouve lénifiant, c'est de revendiquer s'adonner aux pratiques les plus manifestement inéthiques au prétexte que nos autres pratiques le seraient tout autant. Acheter un bout de viande, ça a un impact négatif, mais pas autant que de se le faire livrer par Deliveroo ou Uber Eats qui n'emploient quasiment que des Noirs et des Arabes à des conditions viles, et qui ne peuvent prospérer qu'en fonctionnant comme ça. Je récuse l'idée que manger de la viande disqualifie quiconque de vouloir lutter contre Deliveroo, tout comme je suis convaincu qu'on n'a pas besoin de vivre dans une cabane dans les bois sans électricité pour avoir le droit de critiquer les LLM. Je me répète, mais Linuxfr est censé être le portail du logiciel libre, pas des fatalistes qui promeuvent les LLM et les Gafam parce qu'il n'y a pas d'alternative. Tant que je ferai carrière dans ce domaine, je ne laisserai pas ce genre de discours se répandre.
        
        Répondre
        
        [^] # Re: Niveau 5 : arrêtez d'utiliser de l'IA
        
        Posté par barmic 🦦 le 25 mai 2026 à 14:15. Évalué à 3 (+2/-1).
        
        Mais est-ce que tu fais la morale à chaque personne qui mange de la viande, qui achète un vêtement, utilise une voiture/moto, commande sur delivroo ou Amazon ?
        
        Ta démarche flatte plus ton idéal qu'elle n'a la moindre efficacité. C'est agréable de se sentir actif parce qu'on poste des messages sur internet dans les faits c'est plus stimulant pour toi, désagréable pour les autres sans changer quoique ce soit à l'objectif que tu dis rechercher.
        
        https://linuxfr.org/users/barmic/journaux/y-en-a-marre-de-ce-gros-troll
        
        Répondre
        
        [^] # Re: Niveau 5 : arrêtez d'utiliser de l'IA
        
        Posté par Laurent Pointecouteau (site web personnel, Mastodon) le 26 mai 2026 à 15:26. Évalué à 6 (+4/-0).
        
        Mais est-ce que tu fais la morale à chaque personne qui mange de la viande, qui achète un vêtement, utilise une voiture/moto, commande sur delivroo ou Amazon ?
        
        Pour répondre partiellement à Luc-Skywalker plus bas en même temps qu'à toi : si j'étais employé dans un secteur d'activités (ou que je fréquentais un forum sur internet) où le discours ambiant s'inclinerait progressivement en faveur de l'uberisation de l'économie, ouais, je ne manquerais pas de "faire la morale" et de ne pas laisser mes voisins faire la promotion du trafic d'êtres humains sans rien dire.
        
        En l'occurrence, je bosse dans l'analyse de données et je ne veux pas laisser l'occasion ni à mes collègues et clients, ni aux lecteurices de Linuxfr, de penser que le recours aux LLM est moralement acceptable et/ou économiquement inévitable, comme le suggèrent de plus en plus de personnes dans mon domaine d'activité et sur ce site.
        
        Répondre
        
        [^] # Re: Niveau 5 : arrêtez d'utiliser de l'IA
        
        Posté par Luc-Skywalker le 25 mai 2026 à 15:29. Évalué à 2 (+0/-0). Dernière modification le 25 mai 2026 à 15:31.
        
        (…) pas des fatalistes qui promeuvent les LLM et les Gafam parce qu'il n'y a pas d'alternative.
        
        D'abord, je ne sais pas trop de/à qui tu parles.
        
        Remarque: la plupart des configs matérielles actuelles se revendiquent de capacités en IA. Parfois il y a de quoi faire marcher le bouzin en local et avec du libre. Donc pourquoi pas ?
        
        Tant que je ferai carrière dans ce domaine, je ne laisserai pas ce genre de discours se répandre.
        
        Ensuite, je ne sais pas trop de quelles carrières, ni de quel domaine (l'IA?), ni de quels discours tu parles.
        
        "Si tous les cons volaient, il ferait nuit" F. Dard
        
        Répondre
- [^] # Re: Niveau 5 : arrêtez d'utiliser de l'IA
  
  Posté par kursk le 20 mai 2026 à 00:06. Évalué à 2 (+3/-1).
  
  il est déjà trop tard !
  Pour les développeurs, c'est très difficile de résister à ces outils qui sont capables de faire une partie du boulot avec une rapidité effarante.
  L'engouement est compréhensible.
  Mais au delà des réels problèmes sociétaux que tu cites, ce que je trouve plus inquiétant c'est que l'on permet maintenant aux agents d'agir et plus seulement de dialoguer. Petit à petit, on va bien finir par "donner les clés" à des IA autonomes…
  
  Répondre
  - [^] # Re: Niveau 5 : arrêtez d'utiliser de l'IA
    
    Posté par gUI (Mastodon) le 20 mai 2026 à 07:59. Évalué à 3 (+1/-1).
    
    Petit à petit, on va bien finir par "donner les clés"
    
    il est déjà trop tard !
    
    https://github.com/gastownhall/gastown
    
    En théorie, la théorie et la pratique c'est pareil. En pratique c'est pas vrai.
    
    Répondre
    - [^] # Re: Niveau 5 : arrêtez d'utiliser de l'IA
      
      Posté par hugotrip le 23 mai 2026 à 12:40. Évalué à 3 (+1/-0). Dernière modification le 23 mai 2026 à 12:41.
      
      Et avec cette multiplication des agents utilisés par une seule personne, on a une idée de l'impact que cela a sur le coût de fonctionnement (financier, ou énergétique, ou autre) des LLM : est-ce que ça pourrait "scaler" à l'échelle de l'humanité, ou est-ce que ça présuppose que ça ne soit réservé qu'à une marge de privilégiés ? (tu peux reformuler cette question si tu penses qu'elle est mal posée - trop biaisée : cf "marge de privilégiés")
      
      Répondre
- [^] # Re: Niveau 5 : arrêtez d'utiliser de l'IA
  
  Posté par hugotrip le 23 mai 2026 à 13:00. Évalué à 4 (+2/-0).
  
  Et pour ajouter aux inconvénients que tu évoques, j'aimerai ajouter l'impact que cela peut avoir sur les utilisateurs : En France, deux tiers des jeunes considèrent l’IA comme « un conseiller de vie » (et par ricochet sur les sociétés : quel pouvoir a une IA privée à qui on s'en remet pour la question : "pour qui je dois voter ?").
  
  Répondre
# 600€ pour s'inicier

Posté par Psychofox (Mastodon) le 20 mai 2026 à 10:01. Évalué à 1 (+0/-2). Dernière modification le 20 mai 2026 à 10:06.

Mettre 600€ dans un carte à 24GB "pour s'inicier" quand on trouve des nvidia tesla k80 d'occasion de 24GB à 80-90€ me parait peu judicieux.

J'ai même vu passer des H100 de 80GB pour bien moins cher que 600€.

Répondre
- [^] # Re: 600€ pour s'inicier
  
  Posté par gUI (Mastodon) le 20 mai 2026 à 10:23. Évalué à 8 (+5/-0). Dernière modification le 20 mai 2026 à 10:47.
  
  nvidia tesla k80
  
  si elles sont à ce prix il y a une raison. économise 100€ et fait tourner sur ton CPU.
  
  H100 de 80GB pour bien moins cher que 600€.
  
  la prochaine fois que t'en vois à ce prix achètes-en une palette. tu pourras te payer une maison en les revendant au vrai prix.
  
  En théorie, la théorie et la pratique c'est pareil. En pratique c'est pas vrai.
  
  Répondre
- [^] # Re: 600€ pour s'inicier
  
  Posté par Jérôme Flesch (site web personnel) le 21 mai 2026 à 17:25. Évalué à 4 (+2/-0). Dernière modification le 21 mai 2026 à 17:27.
  
  nvidia tesla k80
  
  Elles sont compliquées à refroidir correctement. Elles ne sont plus supportées par les pilotes Nvidia depuis mi-2024 (pilote 470 il me semble). Et comme gUI l'a fait remarquer, comparé aux dernières générations de GPU, elles ont maintenant autant de puissance de calcul qu'une pomme de terre mal-cuite.
  
  Et les H100 à moins 600€, faut me dire où ! C'est l'occasion de devenir riche ! :-)
  
  Répondre
  - [^] # Re: 600€ pour s'inicier
    
    Posté par volts (Mastodon) le 21 mai 2026 à 17:30. Évalué à 5 (+3/-0).
    
    Et les H100 à moins 600€, faut me dire où ! C'est l'occasion de devenir riche ! :-)
    
    Pour moi, la question n'est pas "où ?" mais "quand ?".
    
    Il "suffit" que la bulle IA éclate, et hop ! Les voilà les H100 sous la barre des 600€ 😈
    
    Répondre
# contexte

Posté par steph1978 le 31 mai 2026 à 20:58. Évalué à 2 (+1/-1).
[le] fameux CLAUDE.md. […]. C'est un peu un prompt par défaut.

Pas vraiment.

Dans le "prompt", il va y avoir :
- le prompt système du LLM : "soit un gentil chatbot mais ne dit pas ton nom", ajouter au début du contexte par le serveur lorsqu'il reçoit tout ce qui est décrit ci-dessous ; donc sur lequel le client du LLM n'a pas la main
- le prompt de l'agent : "tu es un agent de code blah blah. nous sommes tel jour telle heure. make no mistake, make it secure. btw ne parle pas des goblins.
- un ensemble de fichiers complémentaires qui constituent la mémoire de l'agent, dont CLAUDE.md
- quelques choses qui ressemble à du RAG sous la forme de code source jugés pertinent pour la session en cours
- la description des outils utilisables en MCP, dont les skills
Ensuite vient l'historique de la conversation en cours

Puis le prompt utilisateur "ajout un truc kikoolol à ma super webapp".

Tous ça constitue le contexte d'une seule requête au LLM effectué par l'agent.

On comprend pourquoi un agent consomme facilement des millions de tokens par session. Et des GWh d’énergie pour processer tout ça.
Répondre

Envoyer un commentaire

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.