Je parlais de la vidéo du sénat où il invitait aussi le sénat à auditionner d'autres sachants sur l'IA :
« Faites ça avec Yann Le Cun, avec des gens qui savent et connaissent les IA. Ne faites pas ça avec des gens qui disent n'importe quoi comme Laurent Alexandre ».
Pour le coup personne ne lui donnera tort sur le fond concernant Laurent Alexandre.
Cependant il me semble mal placé pour donner des leçons de compétences.
La visibilité de Julia est faible par rapport aux discours laudatifs sur l'IA générative dans les médias (TV, radio, Web, etc.) et des politiciens, notamment Macron !
Si tu parles du discours ambiant, tu as probablement raison. Par contre il fait probablement parti des "expert" les plus présents sur les plateaux.
En fait c'est même le seul à être régulièrement invité à ma connaissance.
Si tu compares avec un gars comme Arthur Mensch (qui est lui un réel expert du domaine, personne ne le niera), tapes les deux noms sur Youtube, la différence saute aux yeux.
Luc Julia profite probablement d'avoir été présent sur des plateaux depuis plusieurs années, avant même l'explosion de ChatGPT, et de pas trop s’appesantir sur des détails techniques, ce qui en fait probablement un "bon client".
Maintenant ça ne me parait pas à la hauteur des enjeux.
Aux Etats-Unis, les entrepreneurs du secteur comme Sam Altman ou Jensen Huang ont une présence médiatique largement supérieure à ce que l'on peut voir en France, où l'on préfère généralement passer par des "experts", des intermédiaires au discours convenu et prévisible.
Hum, là tu sembles fortement influencé par la vidéo du clown, il est quand même directeur scientifique chez RENAULT depuis 4 ans.
Oui, Renault, la fameux entreprise connue pour ses recherches et avancées techniques en IA et autres LLM…
Merci pour la correction -^ (trop tard pour éditer).
J'ai effectivement quelques lacune, et c'est d'ailleurs la difficulté de l’exercice quand il s'agit de critiquer les autres, mais tu admettra qu'il y a quand une différence entre mal formuler certaines tournures de phrases, faire quelques fautes de ci, de là et systématiquement détruire la structure des phrases, et en utilisant le minimum de vocabulaire.
Concernant l'idée selon laquelle ont n'écrit pas de la même façon sur une plateforme de micro-blogging, il est évident que le format n'aide pas à l'élaboration de la pensée abstraite et que les utilisateurs tendent à s'exprimer de la même façon qu'à l'oral.
Donc ça ne change rien à mon propos, puisqu'on peut difficilement imaginer que des posteurs indigents sur Twitter se révèlent comme par magie être de fin lettrés une fois leur téléphone en veille…
Je ne sais pas de quelle vidéo tu parles exactement. Son audition au sénat ou le débat chez Le Futurologue ?
L'argument de l'écologie est pertinent.
Et effectivement, Monsieur Phi ne l'a pas mis à son crédit.
Maintenant, Luc Julia se contente d'appliquer toujours la même méthode, à savoir qu'une large partie de la population est anxieuse vis à vis de l'écologie, donc il appui sur cet aspect (ce qu'il ne faisait pas en 2023 par ailleurs, c'est visiblement plus récent).
Pour moi ça ne change rien au fait que le gars semble avoir une visibilité trop important au vu de ses compétences réelles, ce qui n'aide pas à éclairer le débat.
Et plus que tout, où sont ses contradicteurs dans le débat publique ?
La vidéo de monsieur Phi met également l'accent sur le fait que le gars soit invité partout et qu'il a rarement des contradicteurs (l'exception étant chez le Futurologue, où il s'est révélé être particulièrement désagréable par ailleurs).
Et il me semble donc nécessaire d'insister que c'est un scandale qu'il puisse être auditionné au sénat alors qu'il semble avoir de profondes lacunes techniques.
Je doute de l'intérêt du débat dans le sens où je ne sais pas si une simple réforme aurait pu changer grand chose à la situation actuelle.
Il suffit de créer un compte Twitter vierge (ce que j'ai fais très récemment) pour tomber au hasard sur des discussions insoupçonnée.
Les conjonctions et la ponctuation semblent avoir disparues en nouvelle France.
De nouvelle formes de ponctuations apparaissent, tels que "sah".
Ainsi il est admis d'énoncer "Les frères je crois pas on va aller au ciné" (fautes d'orthographes non incluses).
Dans ces conditions, je ne vois pas ce qu'une réforme aurait pu changer puisque que la force du changement est principalement démographique.
Pour le coup j'ai trouvé la vidéo de Monsieur Phi travaillée, sourcée et plus factuelle que Luc Julia qui répète les même histoires depuis la sortie initiale de ChatGPT, alors que le monde change à grande vitesse (il n'y a qu'à voir ce qui se passe en ce moment autour du protocole MCP).
Si j'ai pu regarder certaines de des conférences de Luc Julia (sans être convaincu), j'avais vu la série de reportages sur la Silicon Valley qu'il avait commis pour Arte. Et je l'avais trouvé insupportable !
Sa façon soixante-huitarde de faire passer son insolence et son irrévérence pour de la "coolitude" (notamment le moment où il pousse le journaliste à entrer dans le bâtiment d'une entreprise sans y être invité), c'était vraiment malsain.
Bon vous me direz que c'est hors sujet, mais j'ai rien de plus à ajouter que ce qui a été dit dans la vidéo de Monsieur Phi…
Je suis gré envers Monsieur Phi d'avoir tiré un missile en direction ce pitre (décoré de la légion d'honneur), dont l'influence dans le débat sur l'IA en France surpasse de loin celle des fondateurs de Mistral AI, ce qui en dit beaucoup sur l'état catastrophique du débat.
Nous fûmes l'une des nations à la pointe de la science, nous sombrons dans l'obscurantisme et la peur de l'innovation.
Et de ce point de vu, un gars tel que Luc Julia est parfait pour assurer le rôle du "en même temps".
Appliqué à l'IA ça devient "ne vous inquiétez pas, c'est rien du tout finalement".
Alors que si, tout est en train de changer, qu'on le veuille ou non.
Il faut prendre la techno à bras le corps, sinon les conséquences seront bien pire que l'inaction…
L'un des problèmes auquel a été confronté le RN depuis des décennies est que les banques refusaient de lui prêter de l'argent pour financer ses campagnes présidentielles et législatives (c'est illégal mais personne n'en parle là).
Donc il y a pas de quoi pavoiser avec la moraline du type "le FN/RN se fait financer par des banques Russes" ou "le RN appel à des particuliers" quand les autres partis en dehors du RN et Reconquête qui sont assurés de faire plus de 5% n'ont aucun problème de financement.
Pour l'affaire qui a provoquée l'inéligibilité de MLP je me permet de rappeler que Bayrou a été condamné pour les mêmes faits, ce qui ne l'a pas empêché d'être premier ministre par la suite et que Mélenchon est également poursuivi pour la même raison (son affaire est au point mort pour le moment).
Pour information je suis même pas spécialement pro RN, mais faut faire la part des chose et savoir être honnête.
Si Mélenchon était rendu inéligible je trouverai ça aussi scandaleux (le principe de la démocratie, c'est que c'est au peuple de juger, non ?).
Taper au porte-monnaie est une chose, mais si on accepte que la justice s'invite dans toutes les campagnes électorales ont commence à ouvrir une boite de pandore dangereuse (ça avait commencé en 2017 avec Fillon).
Je me souviens d'un reportage il y a une dizaine d'années environ qui parlait des magouilles de Poutine pour se maintenir au pouvoir en décrédibilisant ses adversaire les plus sérieux, notamment le chantage via des caméra cachées compromettante (après une recherche il s'agirait de Mikhail Kasyanov).
On fonctionne un peu différemment mais fondamentalement le résultat est le même actuellement en France et il n'y a pas lieu de se réjouir.
Et merci pour l'énième article du monde à charge contre Stérin, mais je n'accorde qu'une crédibilité toute relative à ce journal partial qui ne s'est jamais penché sur tout l'entourage oligarchiques de Macron dès la sortie de l'ENA avec Jean-Pierre Jouyet, Alain Minc et Jacques Attali puis plus tard des gens comme Matthieu Pigasse et Xavier Niel, entre autres.
Là le "journal de référence" semble avoir fait preuve d'une cécité tout à fait étonnante.
Votre grille de lecture datée vous aveugle, mais, outre tout ce qui a été accompli par la commission von der leyen ces dernières années, elle travaille en ce moment à l'accès aux données chiffrées sans mandat de justice: https://ec.europa.eu/commission/presscorner/detail/fr/ip_25_1599
Nous glissons vers la dictature, la justice en France comme en Europe est de plus en plus utilisé pour attaquer les opposition (de gauche comme de droite), des gens qui se nomment entre eux peuvent décider pour tout le continent et exploitent chaque crise pour se doter sans cesse de nouvelle compétences en dehors des traités initiaux et sans contre pouvoir possible.
Dans ces conditions, s'il leur suffit de dire "n'écoutez pas l'opposition, elles est d’extrême droite" pour que des gens modérés et sérieux comme vous gobent tout, contrairement à ces ploucs franchouillards qui ont piqués des millions dans la caisse, votre mépris est une distinction.
Le fait que la procédure ait été ouverte pile au moment où circulait une pétition entre députés européens pour ouvrir une motion de censure contre la commission von der Leyen est probablement tout à fait fortuit et n'a absolument aucun rapport, pas plus que l’abstention massive des députés patriotes français pour la soutenir (et qui se feront probablement discrets lors du vote).
Tout va bien la démocratie est sauve, la motion de censure est tuée dans l’œuf et tout ceci participe d'un monde meilleur, n'en doutons pas !
Quand je vois "Commission Européenne", j'ai les poils qui se hérissent !
En particulier si la commission Von des Layen venait à plébisciter un acteur français, ça serait une vrai surprise.
Je suis très sceptique mais si ça venait à se concrétiser, je gage que l'on apprendra dans quelques temps le revers de la médaille…
En sachant que choisir un prestataire français coûte généralement moins cher parce que l'état récupère la différence en impôts et prélèvement indirects.
Faire appel à l'étranger pour un service réalisé à distance sur internet est une perte sèche.
Le transfert de nos données de santé sur Azure n'a pas déclenché de scandale, donc de l'analyse de données sur les RS, on est vraiment sur un non problème pour nos décideurs.
Le problème est que l'on a tellement attaqué le principe d'état nation en Europe que c'est même plus un problème, c'est devenu normal.
Après il y a peut être aussi un non dit qui est la minimisation du risque de fuite de la presse en France sur la nature des investigation du gouvernement…
J'adhère dans les grandes lignes avec le contenu de l'article et je ne partage pas non plus l'engouement actuel pour le "vibe coding", mais on ne peut pas dire non plus qu'ils sont fondamentalement inutiles et/ou inefficaces.
Bien utilisés, ils permettent d'augmenter la productivité.
Personnellement j'utilise très rarement des llm pour la génération de code, (je trouve pénible de devoir relire).
Par contre ils sont très utiles pour être questionnés, explorer de nouveaux concepts que l'on ne maîtrise pas bien.
Ils peuvent se tromper, mais ça donne toujours une base sur laquelle s'appuyer, qui peut ensuite être complétée par une recherche web.
Après il faut distinguer la capacité des modèles à générer du code au milieu d'un bloc existant (fill in the middle, donc du complètement) et l'utilisation agentique, où toutes les critiques que l'on peut faire sont à mon sens fondés.
En particulier les attentes autour des agents soit-disant capables de générer des applications complètes à partir de quelques instructions sont totalement déraisonnables à l'heure actuelle.
Maintenant on verra bien dans quelques années, parce que peut être que toutes ces critiques paraîtront bientôt aussi peu inspirées que d’hypothétiques éleveurs de chevaux en 1890 déclamant que l'automobile ne remplacerait jamais le cheval parce que ça pue, ça va pas vite, c'est pas fiable, c'est bruyant, faut du pétrole, etc…
D'ailleurs toutes les critiques que l'on pouvait imaginer sont toujours valables, sauf "ça va pas vite".
Le simple fait que ça aille plus vite justifie tout le reste. Probablement qu'il en sera de même avec les llm…
C'est vrai à certains égards mais un revirement est toujours possible.
Dans un marché où l'on peut faire de nombreux parallèles, celui des navigateurs internet, c'est même arrivé plusieurs fois (Internet Explorer a écrasé Netscape, qui revient en force sous le nom de Firefox avant que Chrome n'écrase tout le monde).
Pourtant à partir de 2001 et la sortie de Window XP, pour la plupart des gens Internet Explorer était indissociablement lié au web.
Après c'est certain que c'est plus facile de changer de navigateur que de système d'exploitation.
Mais si ce dernier propose un réel avantage c'est pas impossible, ça prendra simplement plus de temps.
Il ne s'agit pas forcément d'une nouvelle fonctionnalité magique, mais simplement un meilleur alignement avec le marché.
Je ne sais pas ce que tu entends par "de droite", je suppose qu'on ne s'entendrait jamais sur la définition, mais la droite ne se limite pas à la liberté économique .
Par contre tu dis "les gens votent systématiquement pour l’individualisme".
Si le contraire serait le collectivisme, je dirais que la part des dépenses publiques dans le PIB est passé de moins de 20% dans les années 80 à plus de 65% aujourd'hui (source https://www.ifrap.org/data/les-depenses-publiques-de-la-france-depuis-1978).
Donc non, la vie publique tend de plus en plus vers le collectivisme et non le libéralisme.
Le plus dramatique c'est que tous ceux qui entreprennent se font matraquer d’impôts, ce qui les mets dans difficulté, ça réduit la portion productive, et créé une boucle vers le collectivisme, l'état étant entraîné à maintenir le niveau de vie de la population tant par l'endettement, ce qui ne peut que mal finir à terme.
Mais on nous dit que le problème c'est l'ultralibéralisme ?
Mirosoft qui risquent de voir leurs factures, négociations et contrats s’évaporer.
C'est possible, mais quand tu vois que même en France l’état a préféré Microsoft par rapport à OVH pour héberger nos données médicales, je sais pas si ils ont des alternatives crédibles.
Mais peut être parce que l'Occident a une responsabilité particulière dans le conflit israëlo-palestinien
Donc on est d'accord, tout est une question de subjectivité et de notre propre rapport au conflit…
On peut également considérer que ça ne nous regarde pas.
Après, effectivement la France, a toujours été alliée à Israel, (bien qu'elle soit plus ambiguë que par le passé).
Par contre ça n'a à mon sens pas à être l'un des sujets principaux des débats politiques.
En ce moment le nombre de faillites d'entreprises explose du fait du remboursement des dettes Covid et de l'explosion des factures d’électricité.
Cela devrait être un sujet de discussion majeur.
Mais non, on va tous ne parler que d'un conflit, où par ailleurs, nous n'avons aucune prise, que cela nous plaise ou non nous resterons des spectateurs.
Le fait que Israël a l'arme atomique en théorie, et un soutien militaire direct des USA et de l'armement de pointe venant du monde entier explique en partie aussi leur réaction prudente.
Actuellement beaucoup de pays tournent le dos à l'Occident, notamment au Sahel en prenant appui sur la Chine et la Russie.
C'est aussi le cas d'une partie de l'Asie centrale et du Sud, bien que ça soit plutôt sous la contrainte.
Le monde arabe pourrait tenter la même approche mais le fait pas (ce qui pourrait à terme finir de provoquer un mouvement d'isolement général de l'Occident).
Probablement ont ils leur raisons, peut être que ça viendra plus tard, peut être trouvent ils très bien de pas trop s'en mêler pour le moment mais laisser leur population venir en masse en Occident et récolter les fruits plus tard, j'en sais rien.
Nous avions pour acquis l'essentiel : la santé et le développement[…]
Ca me semble assez nébuleux.
Mais si tu veux mon avis, nos "valeurs" ne valent que si nous sommes puissants.
Quand l'occident illuminait le monde, c'est pas parce qu'il inspiraient tantôt le respect, tantôt la crainte par sa réussite.
Les "valeurs" c'est surtout pour nous même, pour se donner bonne conscience, le reste du monde n'en a rien à faire.
Tous les peuples du monde, toutes les civilisations ont des valeurs, dont un certain nombre nous rebutent.
Par exemple les crimes d'honneur au Pakistan ou en Afghanistan sont à nos yeux injustifiables. C'est pourtant tout à fait normal pour eux.
Si maintenant la France ou l'Europe chute, les "valeurs" à défendre disparaîtront avec, c'est aussi simple que ça.
Mais rien du tout. Ici par exemple c'est Logiciel Libre, alors je me contrefous que tu sois d'extrême droite, de droite, de gauche ou d'extrême gauche […]
On dit souvent que tout est politique.
Mais peut être que pour le bien commun, l'on devrait moins politiser tout un tas de choses et en rester à des grand sujets qui concernent concrètement tout le monde (santé, éducation, infrastructures, justice, impôts, le régalien quoi…).
Donc si tu veux mon avis, peut être que l'on devraient moins parler politique sur Linuxfr, parce que c'est en principe pas le sujet du site .
C'est certain que dans l'absolu ça n'a pas à être un enjeu politique puisque c'est un conflit étranger, donc en dehors de la cité.
Mais c'est une question de gauche dans notre cas puisque la gauche ne parle que de ça depuis l'an dernier.
C'est d'ailleurs mon point de vue, je comprends pas pourquoi.
Même d'un point de vu tactique ça m'a l'air hasardeux comme stratégie, Mélenchon s'en prend autant dans la gueule que le père Le Pen dans les années 80-90…
C'est bien du Jean-Marie Le Pen dans le texte, aucun doute possible. Mettre un problème de pays riche et développé (la désindustrialisation) sur le même plan que des guerres ou les civils meurent en masse, c'est tout simplement stupide.
Je ne vois pas en quoi c'est stupide
Là où se place notre affect est très subjectif. On peut y mettre de la morale mais c'est pas une question d'intellect.
Par exemple, il y a eu il y a quelques années un conflit en Ethiopie qui aurait fait dans les 800 000 morts, soit plus que la population à Gaza.
J'ai pas le souvenir que grand monde en ait eu grand chose à faire. Pas de manifs, pas de relais dans les médias appelant à prendre telle ou telle position, etc…
Si le conflit à Gaza passionne autant c'est qu'il est à certains égards perçu comme singulier.
Et cette singularité est probablement plus en rapport avec de la politique intérieure en Occident qu'une quelconque proximité avec la Gazaouis.
Même les Egyptiens (qui leur sont bien plus proche à tout point de vue) pourraient leur venir en aide mais ne le font pas.
Je sais pas si c'est pertinent de comparer YAML et JSON.
JSON n'est (il me semble) pratiquement utilisé que pour le Javascript/Typescript, et ce pour des raisons évidentes.
Du coup, effectivement que si on aime bien (comme moi) pouvoir mettre des commentaires et avoir des blocs bien aérés à la Python, YAML semble un meilleur choix.
Par contre je pense que tu va plutôt choisir un format en fonction de ton langage, de ses bibliothèques et de l'influence de l'environnement.
J'ai pas de stats sous la main, mais je suis certain de que le fait que Cargo utilise toml a une influence sur les projets Rust, à fortiori libres.
Par contre le service commercial moyen-orient risque d'être fortement perturbé par ce genre de censure.
Le monde a changé, on est plus en 1967 et le moyen orient (au sens large) n'en a pas grand chose à faire.
C'est surtout un sujet en Israel, en Palestine et au Liban (mais réduis au silence).
Même l'Iran évolue. Ils ont bien tentés des frappes en Israel pour montrer leur désapprobation, mais entre les difficultés économiques, la guerre au Yemen à gérer et l'évolution de la relation Etats-Unis/Russie qui pourrait les marginaliser…
Par contre je comprends pas pourquoi ça prends une telle proportion chez la gauche en Occident.
Je peux comprendre la logique de séduire un certain électorat mais de là à ne plus parler que de ça, c'est un coup à finir par ne plus représenter grand monde, surtout aux US…
je trouve cette anecdote symptomatique de ce qui pourrait paraître un changement brutal de régime aux USA
C'est certain, mais faut arrêter les appels à la démocratie.
La technique du shadow-banning a été mise en place contre les "complotistes" ou assimilés jusqu'aux conservateurs (Voir les twitter files révélés par Elon Musk).
Vous connaissez des influenceurs de droite sur Twitch ?
C'est normal qu'il y en ait pas, ils ont tous vu leur compte clôturés.
Et je suis certains que tous les moinsseurs de service trouvent ça très bien !
Peut importe que l'on soit d'accord ou pas, le problème majeur de notre temps est que l'on ne se parle plus, nous vivons dans des bulles d'informations et nous choisissons tous de nous passionner et de placer nos affects sur des sujets particuliers mais virtuels. Nous ne voyons plus le panorama global, pas plus que ce qui nous est physique proche.
Du coup le combat politique est devenu virtuel, surtout à gauche.
Je comprends vraiment pas comment peut l'on peut se sentir à tel point investi pour des choses (Gaza par exemple) que l'on ne vit qu'à travers des écrans et par l'émulation des réseaux sociaux alors que dans le même temps la France perds les dernier morceaux de son industrie (on en est à 8% du PIB à ça continue de plonger).
Nous ne produisons même plus le quart de ce que nous consommons et sans un solide redressement de la situation la banqueroute semble au bout du tunnel mais pour la gauche le sujet principal serait Gaza ?
C'est catastrophique parce qu'on a l’impression que de nombreuses personnes ne changeront de point de vue qu'une fois ruinés, et la collectivité avec eux…
Cette discussion m'a permis d'élargir un peu ma perspective.
J'ai un peu la flemme de lire toutes les sources, mais j'ai fais des essais piégeux sur Claude (que je n'avais jamais trop utilisé avant).
J'ai pu lui faire dire des choses imprécises, (qu'il corrigeait rapidement au message suivant) mais je n'ai pas réussi à le faire dérailler.
Après faudrait voir avec un contexte beaucoup très long.
Donc oui, la qualité du modèle a une énorme influence sur l’horizon temporel des tâches qu’il est capable d’effectuer, bien plus qu’on ne le penserait en évaluant naïvement sur une étape unique.
Là je suis vraiment sceptique.
Peut importe quand survient l'erreur si elle survient fatalement, en particulier dans l'idée de rendre les IA autonomes.
Imaginerait on un serveur en production qu'il tendrait à faire des choses incohérentes passé un certain temps ?
La question de savoir si cela prendra un minute ou une heure importe peu à mon sens.
Dans ce contexte, la priorité ne serait elle pas de repérer l'erreur avant de déclencher une action ?
Si les erreurs soient inévitables, la seul chose à faire est de les rendre inoffensives.
Exactement comme les humains ? Je vois rarement des programmeurs dire "je me suis planté" avant que le compilateur / les tests unitaires / les tests manuels / la revue de code révèlent un problème. […] Et de même que mes juniors finiront par s’améliorer, je ne vois aucune raison de supposer que ces problèmes sont inhérents aux LLMs en général et que la prochaine génération ne fera pas mieux à ce niveau.
Les créateurs sont régulièrement surpris par certains aspects de leur création […], ce qui est pour moi pile poil dans la définition de "propriété émergente" ? Ou tu penses à autre chose ?
L'article d'Anthopic est très intéressant.
J'ai lu en diagonale et ils semblent aborder des phénomènes émergents intéressants, mais assez évidents puisque cela correspond à l'observation (les llm apprennent dans toute langue et restituent la connaissance indépendamment de la langue, les llm planifient leur réponses, etc…).
C'est fascinant à observer, mais ça reste assez limité, ils semblent toujours incapables de dépasser leur données d’entraînement.
Si tu prends par exemple la distillation comme méthode d'apprentissage, ça a permis de très largement améliorer les performances des petits modèles ces derniers mois (avec des modèles de 7 à 14 milliards de paramètres loin d'être ridicules et un rapport capacités/coûts incroyables).
Par contre il y a toujours un plafond de verre.
Plus le modèle maître est performant, plus l'élève l'est, mais l'élève fait toujours moins bien que le maître.
C'est à mon avis parce que les IA apprennent par induction et font au mieux quelques déductions et c'est là où le parallèle avec l'humain atteint ses limites à mon sens.
Je ne dis pas que les wrappers sont entièrement inutiles. Je dis qu’ils sont destinés à être de plus en plus triviaux et comparativement (entre eux) peu impactants à mesure que la qualité des modèles progresse. […] Si tu préfères tourné comme ça : les modèles sont le facteur limitant (et donc critique), pas les wrappers. […] Si tu préfères tourné comme ça : les modèles sont le facteur limitant (et donc critique), pas les wrappers.
Tourné comme ça, tu as raison, c'est implacable.
Par contre je ne dirais pas que la mise en place d'un système expert permettant de valider ce que produit un llm (surtout sur le long terme) soit un problème résolu.
Précisément parce que la validation passe par les llm eux même.
Non, je n'avais jamais entendu parler de ce genre de métrique.
C'est ce qui m'a fait changer de point de vu sur les capacités des modèles à long terme (souvent un simple graphique vaut mieux que 1000 mots), et surtout sur les perspectives que ça nous ouvre.
Je continuerai de suivre ça, merci.
Les humains ne sont très probablement pas purement déterministes non plus.[…]
Vrai. Par contre la nature du fonctionnement est très différente. Prends un humain moyen et demande lui d'arbitrer un problème rationnel et non idéologique, idéalement quand son intérêt et/ou sécurité sont engagées.
Il fera alors des choix très rationnels, basés sur un savoir objectif, tenant compte de la situation et si il a des lacunes, ils peut les analyser de lui même froidement.
Pour qu'un humain dise ou fasse n'importe quoi, il faut un contexte (religieux, idéologique, égotique, manipulation, à priori, etc…)
Les llms eux, peuvent raconter n'importe quoi et il n'y a aucune distinction de nature entre le vrai et le faux.
Ce sont juste des statistiques.
Tu n’as pas besoin d’être totalement fiable, juste plus fiable. Plus tu es fiable, plus tu peux faire des tâches à horizons longs sans te planter[…]
J'en doute (en tout cas dans l'idée de rendre les IA autonomes).
Imaginons que tu ais le meilleur modèle qui commet une erreur 5% du temps et le moins bon (tout en bas des classements à la mode), qui en fait 15% du temps.
Le meilleur modèle est il pour autant réellement plus utilisable dans le vrai monde quand il s'agit de prendre des décisions qui ont un impact financer et sur la vie de vrai personnes ?
Cela sera t'il si différent si ça tombait à 1% ? Et puis, si par malheurs il tombe sur des problèmes nouveaux et imprévus, les 1% théoriques peuvent vite devenir 30% réels.
Tu le dis toi même, repérer ses propres erreur est un truc sur lequel les llms ont beaucoup de mal.
Un début de résolution (très imparfait par ailleurs) passe par la mise en place d'agents qui contrôlent et valident les sorties avec des instructions spécifique pour ça.
Mais sinon je n'ai jamais vu un llm dire de lui même "au fait excuse moi mais je me suis trompé dans mon message précédent".
Pour que ça arrive, il faut lui indiquer l'erreur (via la sortie d'un interpréteur, la réponse d'un appel de fonction ou une remarque humaine).
Bref, il faut les guider, et donc il faut toujours une sorte d'oracle pour valider les résultats (d’où l'idée des agents centrés sur la génération de code Python comme Smolagents de Huggingface, le système de validation étant l'interpréteur) conjugué à une passe récursive de contrôle critique du llm sur sa propre génération via des instructions spécifiques.
Pour moi c’est clairement incorrect en soit ?
C'est pour ça que j'ai parlé de problème d'alignement.
Le modèle raconte peut être n'importe quoi de ton point de vu parce que c'est pas le résultat attendu, mais c'est correct dans le sens où c'est le strict reflet de ses données d'apprentissage, basés sur des transcriptions de films et d’émissions de télé et radio.
On a exactement le même problème avec les llms à qui l'on veut attribuer des propriétés émergentes alors que ça ne sont que des ajustements induits par leurs développeurs.
Si Gemma-3 et Qwen terminent toutes leurs phrases par des émoticône, c'est pas parce qu'ils sont plus joyeux que les autres.
Plus le modèle est capable, plus créer l’application est à la portée du modèle lui même. Et moins le modèle a besoin des "rails" de l’application. À terme je ne vois pas comment l’application peut être un avantage compétitif fiable.
Après, si dans "application" tu mets tout l’aspect juridique/commercial/etc… là oui, on va être d’accord. Mais le code du wrapper en lui-même ? non.
N'as tu pas dû toi même guider Claude ?
Donc tu as fais à la main ce qu'un logiciel serait amené à faire pour tenter de rendre Claude autonome.
Peut être ais je des failles dans mon raisonnement, mais je n'ai pas l'idée d'un seul domaine du monde réél où on prendrait un llm à qui on demanderait de rendre des services en totale autonomie sans que ça ne tourne rapidement en rond (dans le meilleur des cas), ou en hors sujet (plus probablement).
Ce sont de formidables outils, mais en dehors d'être des agents conversationnels, je reste sceptique quant à leur capacité à être réellement autonomes par eux même.
Je me suis peut être mal exprimé, mais j'ai l'impression qu'on ne parle pas de la même chose.
Évidemment que les llms s'améliorent par itération.
Ils ont toujours plus de connaissance et font moins d'erreurs qu’auparavant.
Par contre, de par leur nature probabiliste, ils ne seront jamais totalement fiables (encore une fois, à moins de changer de techno).
Et surtout, une hallucination peut intoxiquer le contexte à tout moment et rendre les générations suivantes caduques, si bien que plus le contexte traîne en longueur, moins c'est fiable. Et ce ne sont pas des bugs, c'est directement induit par la techno.
En vérité, les llms se sont améliorés sur tous les aspects qui ont rendu ChatGPT révolutionnaire (relative compréhension d'instructions, extraction de données et génération de réponses plausibles, etc…).
Mais n'ont pas vraiment avancés sur le reste (planification et vision à long terme, raisonnement abstrait, etc…).
Je pense que ces limites vont obliger à utiliser des applications chargées de fiabiliser les modèles génératifs.
Si tu prends par exemple Whisper, qui est un des meilleurs modèles voix vers texte actuel et que tu fais une inférence avec du bruit blanc (ou du silence capté par un micro), il te génère quelque chose du genre "Sous-titrage Société Radio-Canada", ce qui est correct en soit (exemple type d'un problème d'alignement).
Le seul moyen de fiabiliser la génération en pratique est de supprimer logiciellement ces blancs (éventuellement en découpant l'audio et en envoyant plusieurs générations).
Pour les llm, tout un tas de systèmes agentiques sont en cours de développement avec des boucles récursives types génération -> contrôle -> action et les modèles de Rerank.
Du coup je vois les IA comme des moteurs, mais un moteur seul sert pas à grand chose tant que tu peux pas le mettre dans une voiture.
Pour l'effet de plateau, il est à mon sens indéniable que les meilleurs modèles ont des performances proches entre eux, avec une division en deux groupes (ceux qui raisonnent" comme les GPT o1 et DeepSeek-r1 et les autres, qui font du chat).
Dans la seconde catégorie, discute avec QwQ 32B, GPT-4 et Mistral-Small. Si il ne s'agit que de discussion et de suivre des instructions, je vois pas de différence en pratique. Pas plus qu'il n'y en a entre eux et les 30 premières entrées du lmarena (pour le dire vite).
Certains s'en sortiront mieux que d'autres pour certaines tâches (génération de code par exemple avec Claude), sans que ça soit non plus extraordinaire.
Bref, tout ce que je voulais signifier, c'est qu'on ne parle toujours que des modèles alors qu'il faudrait à mon avis un peu plus parler d'applications pratiques.
Par exemple aucune entreprise ne confierait sa comptabilité à la meilleure des IA les yeux fermés sans aucun contrôle.
Par contre, le jour où une entreprise propose ce service via des IA et s'engage juridiquement pour en assurer la fiabilité, là il y aura un changement de paradigme. Et je suis certain que si c'est possible avec la techno actuelle, c'est uniquement avec des modèles modeste mais spécialisés, et pilotés par des logiciels qui contrôlent absolument tout.
Dans cet exemple, l'IA est le moteur, sans elle rien ne se fait, mais tu n'as une application pratique que par le logiciel qui l'englobe.
Et ça ne passera pas à mon avis par les gros modèles généralistes comme GPT-4.5, peu importe leur score sur MMLU-Pro et autre comparatif à la mode.
Au contraire. Sur des horizons long, la capacité d’un modèle à ne pas se "perdre soi-même", remettre en question des hypothèses, utiliser efficacement le contexte deviennent critique.
Je n'ai pas dis qu'il n'y avait plus de marges de progression, mais la techno actuelle à base de transformeurs semble atteindre un plateau et le groupe des principaux modèles semblent avoir des capacités qui tendent à s'uniformiser.
Seul OpenAI cherche à sortir du lot au prix de milliards d’investissements pour des résultats au mieux notables, mais sans rien révolutionner, et ne leur donnant que quelques mois d'avance.
Pour reprendre ton exemple, lié à la même problématique de la planification, c'est justement ce que cherchent à combler les agents (via souvent du bourrinage s'apparentant à du brute-force).
Mais les llms semblent avoir des limites indépassables lié à leur fonctionnement propre. Ils peuvent notamment à tout moment polluer leur propre contexte de façon aléatoire.
Donc soit il y a une rupture par des technos complètement différentes, soit l'IA agentique reste pour longtemps un domaine de llm.
Et dans ce cas, je vois pas comment on peut éviter la stagnation des performances et l'effet de plateau.
Et c'est dans ce contexte qu'à mon sens qui instrumentent les llms sont au moins aussi importantes que les modèles eux même (on pourrait prendre pour analogie le lien entre un moteur et une voiture).
Et ne pas oublier d'autres types de modèles annexes qui commencent à apparaître pour filtrer les réponses et fiabiliser les résultats (via le Rerank notamment).
[^] # Re: Intérêt du débat ?
Posté par Florian.J . En réponse au lien Fil Mastodon : comment la réforme de l’orthographe de 1990 a été massacrée . Évalué à -5.
Et pourtant elle tourne…
[^] # Re: Mr Phi est un expert en IA ?
Posté par Florian.J . En réponse au lien critique de l'audition de Luc Julia par la commission sénatoriale sur la chaîne de Mr Phi. Évalué à 8.
Pour le coup personne ne lui donnera tort sur le fond concernant Laurent Alexandre.
Cependant il me semble mal placé pour donner des leçons de compétences.
Si tu parles du discours ambiant, tu as probablement raison. Par contre il fait probablement parti des "expert" les plus présents sur les plateaux.
En fait c'est même le seul à être régulièrement invité à ma connaissance.
Si tu compares avec un gars comme Arthur Mensch (qui est lui un réel expert du domaine, personne ne le niera), tapes les deux noms sur Youtube, la différence saute aux yeux.
Luc Julia profite probablement d'avoir été présent sur des plateaux depuis plusieurs années, avant même l'explosion de ChatGPT, et de pas trop s’appesantir sur des détails techniques, ce qui en fait probablement un "bon client".
Maintenant ça ne me parait pas à la hauteur des enjeux.
Aux Etats-Unis, les entrepreneurs du secteur comme Sam Altman ou Jensen Huang ont une présence médiatique largement supérieure à ce que l'on peut voir en France, où l'on préfère généralement passer par des "experts", des intermédiaires au discours convenu et prévisible.
Oui, Renault, la fameux entreprise connue pour ses recherches et avancées techniques en IA et autres LLM…
[^] # Re: Intérêt du débat ?
Posté par Florian.J . En réponse au lien Fil Mastodon : comment la réforme de l’orthographe de 1990 a été massacrée . Évalué à 1. Dernière modification le 14 août 2025 à 23:00.
Merci pour la correction -^ (trop tard pour éditer).
J'ai effectivement quelques lacune, et c'est d'ailleurs la difficulté de l’exercice quand il s'agit de critiquer les autres, mais tu admettra qu'il y a quand une différence entre mal formuler certaines tournures de phrases, faire quelques fautes de ci, de là et systématiquement détruire la structure des phrases, et en utilisant le minimum de vocabulaire.
Concernant l'idée selon laquelle ont n'écrit pas de la même façon sur une plateforme de micro-blogging, il est évident que le format n'aide pas à l'élaboration de la pensée abstraite et que les utilisateurs tendent à s'exprimer de la même façon qu'à l'oral.
Donc ça ne change rien à mon propos, puisqu'on peut difficilement imaginer que des posteurs indigents sur Twitter se révèlent comme par magie être de fin lettrés une fois leur téléphone en veille…
[^] # Re: Mr Phi est un expert en IA ?
Posté par Florian.J . En réponse au lien critique de l'audition de Luc Julia par la commission sénatoriale sur la chaîne de Mr Phi. Évalué à 9.
Je ne sais pas de quelle vidéo tu parles exactement. Son audition au sénat ou le débat chez Le Futurologue ?
L'argument de l'écologie est pertinent.
Et effectivement, Monsieur Phi ne l'a pas mis à son crédit.
Maintenant, Luc Julia se contente d'appliquer toujours la même méthode, à savoir qu'une large partie de la population est anxieuse vis à vis de l'écologie, donc il appui sur cet aspect (ce qu'il ne faisait pas en 2023 par ailleurs, c'est visiblement plus récent).
Pour moi ça ne change rien au fait que le gars semble avoir une visibilité trop important au vu de ses compétences réelles, ce qui n'aide pas à éclairer le débat.
Et plus que tout, où sont ses contradicteurs dans le débat publique ?
La vidéo de monsieur Phi met également l'accent sur le fait que le gars soit invité partout et qu'il a rarement des contradicteurs (l'exception étant chez le Futurologue, où il s'est révélé être particulièrement désagréable par ailleurs).
Et il me semble donc nécessaire d'insister que c'est un scandale qu'il puisse être auditionné au sénat alors qu'il semble avoir de profondes lacunes techniques.
# Intérêt du débat ?
Posté par Florian.J . En réponse au lien Fil Mastodon : comment la réforme de l’orthographe de 1990 a été massacrée . Évalué à -2. Dernière modification le 14 août 2025 à 21:46.
Je doute de l'intérêt du débat dans le sens où je ne sais pas si une simple réforme aurait pu changer grand chose à la situation actuelle.
Il suffit de créer un compte Twitter vierge (ce que j'ai fais très récemment) pour tomber au hasard sur des discussions insoupçonnée.
Les conjonctions et la ponctuation semblent avoir disparues en nouvelle France.
De nouvelle formes de ponctuations apparaissent, tels que "sah".
Ainsi il est admis d'énoncer "Les frères je crois pas on va aller au ciné" (fautes d'orthographes non incluses).
Dans ces conditions, je ne vois pas ce qu'une réforme aurait pu changer puisque que la force du changement est principalement démographique.
[^] # Re: Mr Phi est un expert en IA ?
Posté par Florian.J . En réponse au lien critique de l'audition de Luc Julia par la commission sénatoriale sur la chaîne de Mr Phi. Évalué à 7.
Pour le coup j'ai trouvé la vidéo de Monsieur Phi travaillée, sourcée et plus factuelle que Luc Julia qui répète les même histoires depuis la sortie initiale de ChatGPT, alors que le monde change à grande vitesse (il n'y a qu'à voir ce qui se passe en ce moment autour du protocole MCP).
Si j'ai pu regarder certaines de des conférences de Luc Julia (sans être convaincu), j'avais vu la série de reportages sur la Silicon Valley qu'il avait commis pour Arte. Et je l'avais trouvé insupportable !
Sa façon soixante-huitarde de faire passer son insolence et son irrévérence pour de la "coolitude" (notamment le moment où il pousse le journaliste à entrer dans le bâtiment d'une entreprise sans y être invité), c'était vraiment malsain.
Bon vous me direz que c'est hors sujet, mais j'ai rien de plus à ajouter que ce qui a été dit dans la vidéo de Monsieur Phi…
Je suis gré envers Monsieur Phi d'avoir tiré un missile en direction ce pitre (décoré de la légion d'honneur), dont l'influence dans le débat sur l'IA en France surpasse de loin celle des fondateurs de Mistral AI, ce qui en dit beaucoup sur l'état catastrophique du débat.
Nous fûmes l'une des nations à la pointe de la science, nous sombrons dans l'obscurantisme et la peur de l'innovation.
Et de ce point de vu, un gars tel que Luc Julia est parfait pour assurer le rôle du "en même temps".
Appliqué à l'IA ça devient "ne vous inquiétez pas, c'est rien du tout finalement".
Alors que si, tout est en train de changer, qu'on le veuille ou non.
Il faut prendre la techno à bras le corps, sinon les conséquences seront bien pire que l'inaction…
[^] # Re: Le hasard
Posté par Florian.J . En réponse au lien Le parquet européen poursuit le RN et ses alliés européens sur des soupçons de financement occulte. Évalué à -4.
L'un des problèmes auquel a été confronté le RN depuis des décennies est que les banques refusaient de lui prêter de l'argent pour financer ses campagnes présidentielles et législatives (c'est illégal mais personne n'en parle là).
Donc il y a pas de quoi pavoiser avec la moraline du type "le FN/RN se fait financer par des banques Russes" ou "le RN appel à des particuliers" quand les autres partis en dehors du RN et Reconquête qui sont assurés de faire plus de 5% n'ont aucun problème de financement.
Pour l'affaire qui a provoquée l'inéligibilité de MLP je me permet de rappeler que Bayrou a été condamné pour les mêmes faits, ce qui ne l'a pas empêché d'être premier ministre par la suite et que Mélenchon est également poursuivi pour la même raison (son affaire est au point mort pour le moment).
Pour information je suis même pas spécialement pro RN, mais faut faire la part des chose et savoir être honnête.
Si Mélenchon était rendu inéligible je trouverai ça aussi scandaleux (le principe de la démocratie, c'est que c'est au peuple de juger, non ?).
Taper au porte-monnaie est une chose, mais si on accepte que la justice s'invite dans toutes les campagnes électorales ont commence à ouvrir une boite de pandore dangereuse (ça avait commencé en 2017 avec Fillon).
Je me souviens d'un reportage il y a une dizaine d'années environ qui parlait des magouilles de Poutine pour se maintenir au pouvoir en décrédibilisant ses adversaire les plus sérieux, notamment le chantage via des caméra cachées compromettante (après une recherche il s'agirait de Mikhail Kasyanov).
On fonctionne un peu différemment mais fondamentalement le résultat est le même actuellement en France et il n'y a pas lieu de se réjouir.
Et merci pour l'énième article du monde à charge contre Stérin, mais je n'accorde qu'une crédibilité toute relative à ce journal partial qui ne s'est jamais penché sur tout l'entourage oligarchiques de Macron dès la sortie de l'ENA avec Jean-Pierre Jouyet, Alain Minc et Jacques Attali puis plus tard des gens comme Matthieu Pigasse et Xavier Niel, entre autres.
Là le "journal de référence" semble avoir fait preuve d'une cécité tout à fait étonnante.
[^] # Re: Le hasard
Posté par Florian.J . En réponse au lien Le parquet européen poursuit le RN et ses alliés européens sur des soupçons de financement occulte. Évalué à -3.
Votre grille de lecture datée vous aveugle, mais, outre tout ce qui a été accompli par la commission von der leyen ces dernières années, elle travaille en ce moment à l'accès aux données chiffrées sans mandat de justice:
https://ec.europa.eu/commission/presscorner/detail/fr/ip_25_1599
Nous glissons vers la dictature, la justice en France comme en Europe est de plus en plus utilisé pour attaquer les opposition (de gauche comme de droite), des gens qui se nomment entre eux peuvent décider pour tout le continent et exploitent chaque crise pour se doter sans cesse de nouvelle compétences en dehors des traités initiaux et sans contre pouvoir possible.
Dans ces conditions, s'il leur suffit de dire "n'écoutez pas l'opposition, elles est d’extrême droite" pour que des gens modérés et sérieux comme vous gobent tout, contrairement à ces ploucs franchouillards qui ont piqués des millions dans la caisse, votre mépris est une distinction.
# Le hasard
Posté par Florian.J . En réponse au lien Le parquet européen poursuit le RN et ses alliés européens sur des soupçons de financement occulte. Évalué à -10.
Le fait que la procédure ait été ouverte pile au moment où circulait une pétition entre députés européens pour ouvrir une motion de censure contre la commission von der Leyen est probablement tout à fait fortuit et n'a absolument aucun rapport, pas plus que l’abstention massive des députés patriotes français pour la soutenir (et qui se feront probablement discrets lors du vote).
Tout va bien la démocratie est sauve, la motion de censure est tuée dans l’œuf et tout ceci participe d'un monde meilleur, n'en doutons pas !
[^] # Re: Quelques façons de devenir stupide
Posté par Florian.J . En réponse au lien ChatGPT rend-il « stupide » ? [sur une étude américaine, démystification]. Évalué à -2.
Et moi qui ne veut pas être stupide, que dois je faire ?
Dans le doute, je vais de ce pas me taper la tête contre les murs, ça peut pas être pire que discuter avec un llm si j'en crois ce que dit la science.
# Attendons de voir
Posté par Florian.J . En réponse au journal [HS] La commission européenne envisage de dégager Microsoft Azure. Évalué à 0.
Quand je vois "Commission Européenne", j'ai les poils qui se hérissent !
En particulier si la commission Von des Layen venait à plébisciter un acteur français, ça serait une vrai surprise.
Je suis très sceptique mais si ça venait à se concrétiser, je gage que l'on apprendra dans quelques temps le revers de la médaille…
[^] # Re: -75%
Posté par Florian.J . En réponse au lien Matignon choisit une entreprise étrangère pour surveiller les réseaux sociaux . Évalué à 7.
En sachant que choisir un prestataire français coûte généralement moins cher parce que l'état récupère la différence en impôts et prélèvement indirects.
Faire appel à l'étranger pour un service réalisé à distance sur internet est une perte sèche.
Le transfert de nos données de santé sur Azure n'a pas déclenché de scandale, donc de l'analyse de données sur les RS, on est vraiment sur un non problème pour nos décideurs.
Le problème est que l'on a tellement attaqué le principe d'état nation en Europe que c'est même plus un problème, c'est devenu normal.
Après il y a peut être aussi un non dit qui est la minimisation du risque de fuite de la presse en France sur la nature des investigation du gouvernement…
# Programmes qui programment ?
Posté par Florian.J . En réponse au lien Les programmes programment sans intelligence. Évalué à 3. Dernière modification le 07 juin 2025 à 18:41.
D'ailleurs programment t'ils vraiment ?
Moi j'appelle ça pisser du code.
J'adhère dans les grandes lignes avec le contenu de l'article et je ne partage pas non plus l'engouement actuel pour le "vibe coding", mais on ne peut pas dire non plus qu'ils sont fondamentalement inutiles et/ou inefficaces.
Bien utilisés, ils permettent d'augmenter la productivité.
Personnellement j'utilise très rarement des llm pour la génération de code, (je trouve pénible de devoir relire).
Par contre ils sont très utiles pour être questionnés, explorer de nouveaux concepts que l'on ne maîtrise pas bien.
Ils peuvent se tromper, mais ça donne toujours une base sur laquelle s'appuyer, qui peut ensuite être complétée par une recherche web.
Après il faut distinguer la capacité des modèles à générer du code au milieu d'un bloc existant (fill in the middle, donc du complètement) et l'utilisation agentique, où toutes les critiques que l'on peut faire sont à mon sens fondés.
En particulier les attentes autour des agents soit-disant capables de générer des applications complètes à partir de quelques instructions sont totalement déraisonnables à l'heure actuelle.
Maintenant on verra bien dans quelques années, parce que peut être que toutes ces critiques paraîtront bientôt aussi peu inspirées que d’hypothétiques éleveurs de chevaux en 1890 déclamant que l'automobile ne remplacerait jamais le cheval parce que ça pue, ça va pas vite, c'est pas fiable, c'est bruyant, faut du pétrole, etc…
D'ailleurs toutes les critiques que l'on pouvait imaginer sont toujours valables, sauf "ça va pas vite".
Le simple fait que ça aille plus vite justifie tout le reste. Probablement qu'il en sera de même avec les llm…
[^] # Re: l idee est bonne mais helas ca va pas aller tres loin
Posté par Florian.J . En réponse à la dépêche (Début de) la fin de Windows (10). Évalué à 0.
C'est vrai à certains égards mais un revirement est toujours possible.
Dans un marché où l'on peut faire de nombreux parallèles, celui des navigateurs internet, c'est même arrivé plusieurs fois (Internet Explorer a écrasé Netscape, qui revient en force sous le nom de Firefox avant que Chrome n'écrase tout le monde).
Pourtant à partir de 2001 et la sortie de Window XP, pour la plupart des gens Internet Explorer était indissociablement lié au web.
Après c'est certain que c'est plus facile de changer de navigateur que de système d'exploitation.
Mais si ce dernier propose un réel avantage c'est pas impossible, ça prendra simplement plus de temps.
Il ne s'agit pas forcément d'une nouvelle fonctionnalité magique, mais simplement un meilleur alignement avec le marché.
[^] # Re: La différence entre démocratie et totalitarisme
Posté par Florian.J . En réponse au lien Microsoft bloque les emails de ses employés contenant les mots « Palestine », « Gaza », « génocide ». Évalué à -5.
Je ne sais pas ce que tu entends par "de droite", je suppose qu'on ne s'entendrait jamais sur la définition, mais la droite ne se limite pas à la liberté économique .
Par contre tu dis "les gens votent systématiquement pour l’individualisme".
Si le contraire serait le collectivisme, je dirais que la part des dépenses publiques dans le PIB est passé de moins de 20% dans les années 80 à plus de 65% aujourd'hui (source https://www.ifrap.org/data/les-depenses-publiques-de-la-france-depuis-1978).
Donc non, la vie publique tend de plus en plus vers le collectivisme et non le libéralisme.
Le plus dramatique c'est que tous ceux qui entreprennent se font matraquer d’impôts, ce qui les mets dans difficulté, ça réduit la portion productive, et créé une boucle vers le collectivisme, l'état étant entraîné à maintenir le niveau de vie de la population tant par l'endettement, ce qui ne peut que mal finir à terme.
Mais on nous dit que le problème c'est l'ultralibéralisme ?
C'est possible, mais quand tu vois que même en France l’état a préféré Microsoft par rapport à OVH pour héberger nos données médicales, je sais pas si ils ont des alternatives crédibles.
[^] # Re: La différence entre démocratie et totalitarisme
Posté par Florian.J . En réponse au lien Microsoft bloque les emails de ses employés contenant les mots « Palestine », « Gaza », « génocide ». Évalué à -4.
Donc on est d'accord, tout est une question de subjectivité et de notre propre rapport au conflit…
On peut également considérer que ça ne nous regarde pas.
Après, effectivement la France, a toujours été alliée à Israel, (bien qu'elle soit plus ambiguë que par le passé).
Par contre ça n'a à mon sens pas à être l'un des sujets principaux des débats politiques.
En ce moment le nombre de faillites d'entreprises explose du fait du remboursement des dettes Covid et de l'explosion des factures d’électricité.
Cela devrait être un sujet de discussion majeur.
Mais non, on va tous ne parler que d'un conflit, où par ailleurs, nous n'avons aucune prise, que cela nous plaise ou non nous resterons des spectateurs.
Actuellement beaucoup de pays tournent le dos à l'Occident, notamment au Sahel en prenant appui sur la Chine et la Russie.
C'est aussi le cas d'une partie de l'Asie centrale et du Sud, bien que ça soit plutôt sous la contrainte.
Le monde arabe pourrait tenter la même approche mais le fait pas (ce qui pourrait à terme finir de provoquer un mouvement d'isolement général de l'Occident).
Probablement ont ils leur raisons, peut être que ça viendra plus tard, peut être trouvent ils très bien de pas trop s'en mêler pour le moment mais laisser leur population venir en masse en Occident et récolter les fruits plus tard, j'en sais rien.
[^] # Re: La différence entre démocratie et totalitarisme
Posté par Florian.J . En réponse au lien Microsoft bloque les emails de ses employés contenant les mots « Palestine », « Gaza », « génocide ». Évalué à -1.
Ca me semble assez nébuleux.
Mais si tu veux mon avis, nos "valeurs" ne valent que si nous sommes puissants.
Quand l'occident illuminait le monde, c'est pas parce qu'il inspiraient tantôt le respect, tantôt la crainte par sa réussite.
Les "valeurs" c'est surtout pour nous même, pour se donner bonne conscience, le reste du monde n'en a rien à faire.
Tous les peuples du monde, toutes les civilisations ont des valeurs, dont un certain nombre nous rebutent.
Par exemple les crimes d'honneur au Pakistan ou en Afghanistan sont à nos yeux injustifiables. C'est pourtant tout à fait normal pour eux.
Si maintenant la France ou l'Europe chute, les "valeurs" à défendre disparaîtront avec, c'est aussi simple que ça.
On dit souvent que tout est politique.
Mais peut être que pour le bien commun, l'on devrait moins politiser tout un tas de choses et en rester à des grand sujets qui concernent concrètement tout le monde (santé, éducation, infrastructures, justice, impôts, le régalien quoi…).
Donc si tu veux mon avis, peut être que l'on devraient moins parler politique sur Linuxfr, parce que c'est en principe pas le sujet du site .
[^] # Re: La différence entre démocratie et totalitarisme
Posté par Florian.J . En réponse au lien Microsoft bloque les emails de ses employés contenant les mots « Palestine », « Gaza », « génocide ». Évalué à -6.
C'est certain que dans l'absolu ça n'a pas à être un enjeu politique puisque c'est un conflit étranger, donc en dehors de la cité.
Mais c'est une question de gauche dans notre cas puisque la gauche ne parle que de ça depuis l'an dernier.
C'est d'ailleurs mon point de vue, je comprends pas pourquoi.
Même d'un point de vu tactique ça m'a l'air hasardeux comme stratégie, Mélenchon s'en prend autant dans la gueule que le père Le Pen dans les années 80-90…
[^] # Re: La différence entre démocratie et totalitarisme
Posté par Florian.J . En réponse au lien Microsoft bloque les emails de ses employés contenant les mots « Palestine », « Gaza », « génocide ». Évalué à 2.
Je ne vois pas en quoi c'est stupide
Là où se place notre affect est très subjectif. On peut y mettre de la morale mais c'est pas une question d'intellect.
Par exemple, il y a eu il y a quelques années un conflit en Ethiopie qui aurait fait dans les 800 000 morts, soit plus que la population à Gaza.
J'ai pas le souvenir que grand monde en ait eu grand chose à faire. Pas de manifs, pas de relais dans les médias appelant à prendre telle ou telle position, etc…
Si le conflit à Gaza passionne autant c'est qu'il est à certains égards perçu comme singulier.
Et cette singularité est probablement plus en rapport avec de la politique intérieure en Occident qu'une quelconque proximité avec la Gazaouis.
Même les Egyptiens (qui leur sont bien plus proche à tout point de vue) pourraient leur venir en aide mais ne le font pas.
[^] # Re: Précédemment sur linuxfr
Posté par Florian.J . En réponse au lien YAML et alternatives. Évalué à 2.
Je sais pas si c'est pertinent de comparer YAML et JSON.
JSON n'est (il me semble) pratiquement utilisé que pour le Javascript/Typescript, et ce pour des raisons évidentes.
Du coup, effectivement que si on aime bien (comme moi) pouvoir mettre des commentaires et avoir des blocs bien aérés à la Python, YAML semble un meilleur choix.
Par contre je pense que tu va plutôt choisir un format en fonction de ton langage, de ses bibliothèques et de l'influence de l'environnement.
J'ai pas de stats sous la main, mais je suis certain de que le fait que Cargo utilise toml a une influence sur les projets Rust, à fortiori libres.
[^] # Re: La différence entre démocratie et totalitarisme
Posté par Florian.J . En réponse au lien Microsoft bloque les emails de ses employés contenant les mots « Palestine », « Gaza », « génocide ». Évalué à -10.
Le monde a changé, on est plus en 1967 et le moyen orient (au sens large) n'en a pas grand chose à faire.
C'est surtout un sujet en Israel, en Palestine et au Liban (mais réduis au silence).
Même l'Iran évolue. Ils ont bien tentés des frappes en Israel pour montrer leur désapprobation, mais entre les difficultés économiques, la guerre au Yemen à gérer et l'évolution de la relation Etats-Unis/Russie qui pourrait les marginaliser…
Par contre je comprends pas pourquoi ça prends une telle proportion chez la gauche en Occident.
Je peux comprendre la logique de séduire un certain électorat mais de là à ne plus parler que de ça, c'est un coup à finir par ne plus représenter grand monde, surtout aux US…
C'est certain, mais faut arrêter les appels à la démocratie.
La technique du shadow-banning a été mise en place contre les "complotistes" ou assimilés jusqu'aux conservateurs (Voir les twitter files révélés par Elon Musk).
Vous connaissez des influenceurs de droite sur Twitch ?
C'est normal qu'il y en ait pas, ils ont tous vu leur compte clôturés.
Et je suis certains que tous les moinsseurs de service trouvent ça très bien !
Peut importe que l'on soit d'accord ou pas, le problème majeur de notre temps est que l'on ne se parle plus, nous vivons dans des bulles d'informations et nous choisissons tous de nous passionner et de placer nos affects sur des sujets particuliers mais virtuels. Nous ne voyons plus le panorama global, pas plus que ce qui nous est physique proche.
Du coup le combat politique est devenu virtuel, surtout à gauche.
Je comprends vraiment pas comment peut l'on peut se sentir à tel point investi pour des choses (Gaza par exemple) que l'on ne vit qu'à travers des écrans et par l'émulation des réseaux sociaux alors que dans le même temps la France perds les dernier morceaux de son industrie (on en est à 8% du PIB à ça continue de plonger).
Nous ne produisons même plus le quart de ce que nous consommons et sans un solide redressement de la situation la banqueroute semble au bout du tunnel mais pour la gauche le sujet principal serait Gaza ?
C'est catastrophique parce qu'on a l’impression que de nombreuses personnes ne changeront de point de vue qu'une fois ruinés, et la collectivité avec eux…
[^] # Re: Et Mistral ?
Posté par Florian.J . En réponse à la dépêche Nouvelles sur l’IA de mars 2025. Évalué à 0.
Cette discussion m'a permis d'élargir un peu ma perspective.
J'ai un peu la flemme de lire toutes les sources, mais j'ai fais des essais piégeux sur Claude (que je n'avais jamais trop utilisé avant).
J'ai pu lui faire dire des choses imprécises, (qu'il corrigeait rapidement au message suivant) mais je n'ai pas réussi à le faire dérailler.
Après faudrait voir avec un contexte beaucoup très long.
Là je suis vraiment sceptique.
Peut importe quand survient l'erreur si elle survient fatalement, en particulier dans l'idée de rendre les IA autonomes.
Imaginerait on un serveur en production qu'il tendrait à faire des choses incohérentes passé un certain temps ?
La question de savoir si cela prendra un minute ou une heure importe peu à mon sens.
Dans ce contexte, la priorité ne serait elle pas de repérer l'erreur avant de déclencher une action ?
Si les erreurs soient inévitables, la seul chose à faire est de les rendre inoffensives.
L'article d'Anthopic est très intéressant.
J'ai lu en diagonale et ils semblent aborder des phénomènes émergents intéressants, mais assez évidents puisque cela correspond à l'observation (les llm apprennent dans toute langue et restituent la connaissance indépendamment de la langue, les llm planifient leur réponses, etc…).
C'est fascinant à observer, mais ça reste assez limité, ils semblent toujours incapables de dépasser leur données d’entraînement.
Si tu prends par exemple la distillation comme méthode d'apprentissage, ça a permis de très largement améliorer les performances des petits modèles ces derniers mois (avec des modèles de 7 à 14 milliards de paramètres loin d'être ridicules et un rapport capacités/coûts incroyables).
Par contre il y a toujours un plafond de verre.
Plus le modèle maître est performant, plus l'élève l'est, mais l'élève fait toujours moins bien que le maître.
C'est à mon avis parce que les IA apprennent par induction et font au mieux quelques déductions et c'est là où le parallèle avec l'humain atteint ses limites à mon sens.
Tourné comme ça, tu as raison, c'est implacable.
Par contre je ne dirais pas que la mise en place d'un système expert permettant de valider ce que produit un llm (surtout sur le long terme) soit un problème résolu.
Précisément parce que la validation passe par les llm eux même.
Non, je n'avais jamais entendu parler de ce genre de métrique.
C'est ce qui m'a fait changer de point de vu sur les capacités des modèles à long terme (souvent un simple graphique vaut mieux que 1000 mots), et surtout sur les perspectives que ça nous ouvre.
Je continuerai de suivre ça, merci.
[^] # Re: Et Mistral ?
Posté par Florian.J . En réponse à la dépêche Nouvelles sur l’IA de mars 2025. Évalué à 0. Dernière modification le 11 avril 2025 à 00:26.
Vrai. Par contre la nature du fonctionnement est très différente. Prends un humain moyen et demande lui d'arbitrer un problème rationnel et non idéologique, idéalement quand son intérêt et/ou sécurité sont engagées.
Il fera alors des choix très rationnels, basés sur un savoir objectif, tenant compte de la situation et si il a des lacunes, ils peut les analyser de lui même froidement.
Pour qu'un humain dise ou fasse n'importe quoi, il faut un contexte (religieux, idéologique, égotique, manipulation, à priori, etc…)
Les llms eux, peuvent raconter n'importe quoi et il n'y a aucune distinction de nature entre le vrai et le faux.
Ce sont juste des statistiques.
J'en doute (en tout cas dans l'idée de rendre les IA autonomes).
Imaginons que tu ais le meilleur modèle qui commet une erreur 5% du temps et le moins bon (tout en bas des classements à la mode), qui en fait 15% du temps.
Le meilleur modèle est il pour autant réellement plus utilisable dans le vrai monde quand il s'agit de prendre des décisions qui ont un impact financer et sur la vie de vrai personnes ?
Cela sera t'il si différent si ça tombait à 1% ? Et puis, si par malheurs il tombe sur des problèmes nouveaux et imprévus, les 1% théoriques peuvent vite devenir 30% réels.
Tu le dis toi même, repérer ses propres erreur est un truc sur lequel les llms ont beaucoup de mal.
Un début de résolution (très imparfait par ailleurs) passe par la mise en place d'agents qui contrôlent et valident les sorties avec des instructions spécifique pour ça.
Mais sinon je n'ai jamais vu un llm dire de lui même "au fait excuse moi mais je me suis trompé dans mon message précédent".
Pour que ça arrive, il faut lui indiquer l'erreur (via la sortie d'un interpréteur, la réponse d'un appel de fonction ou une remarque humaine).
Bref, il faut les guider, et donc il faut toujours une sorte d'oracle pour valider les résultats (d’où l'idée des agents centrés sur la génération de code Python comme Smolagents de Huggingface, le système de validation étant l'interpréteur) conjugué à une passe récursive de contrôle critique du llm sur sa propre génération via des instructions spécifiques.
C'est pour ça que j'ai parlé de problème d'alignement.
Le modèle raconte peut être n'importe quoi de ton point de vu parce que c'est pas le résultat attendu, mais c'est correct dans le sens où c'est le strict reflet de ses données d'apprentissage, basés sur des transcriptions de films et d’émissions de télé et radio.
On a exactement le même problème avec les llms à qui l'on veut attribuer des propriétés émergentes alors que ça ne sont que des ajustements induits par leurs développeurs.
Si Gemma-3 et Qwen terminent toutes leurs phrases par des émoticône, c'est pas parce qu'ils sont plus joyeux que les autres.
N'as tu pas dû toi même guider Claude ?
Donc tu as fais à la main ce qu'un logiciel serait amené à faire pour tenter de rendre Claude autonome.
Peut être ais je des failles dans mon raisonnement, mais je n'ai pas l'idée d'un seul domaine du monde réél où on prendrait un llm à qui on demanderait de rendre des services en totale autonomie sans que ça ne tourne rapidement en rond (dans le meilleur des cas), ou en hors sujet (plus probablement).
Ce sont de formidables outils, mais en dehors d'être des agents conversationnels, je reste sceptique quant à leur capacité à être réellement autonomes par eux même.
[^] # Re: Et Mistral ?
Posté par Florian.J . En réponse à la dépêche Nouvelles sur l’IA de mars 2025. Évalué à 0. Dernière modification le 10 avril 2025 à 18:11.
Je me suis peut être mal exprimé, mais j'ai l'impression qu'on ne parle pas de la même chose.
Évidemment que les llms s'améliorent par itération.
Ils ont toujours plus de connaissance et font moins d'erreurs qu’auparavant.
Par contre, de par leur nature probabiliste, ils ne seront jamais totalement fiables (encore une fois, à moins de changer de techno).
Et surtout, une hallucination peut intoxiquer le contexte à tout moment et rendre les générations suivantes caduques, si bien que plus le contexte traîne en longueur, moins c'est fiable. Et ce ne sont pas des bugs, c'est directement induit par la techno.
En vérité, les llms se sont améliorés sur tous les aspects qui ont rendu ChatGPT révolutionnaire (relative compréhension d'instructions, extraction de données et génération de réponses plausibles, etc…).
Mais n'ont pas vraiment avancés sur le reste (planification et vision à long terme, raisonnement abstrait, etc…).
Je pense que ces limites vont obliger à utiliser des applications chargées de fiabiliser les modèles génératifs.
Si tu prends par exemple Whisper, qui est un des meilleurs modèles voix vers texte actuel et que tu fais une inférence avec du bruit blanc (ou du silence capté par un micro), il te génère quelque chose du genre "Sous-titrage Société Radio-Canada", ce qui est correct en soit (exemple type d'un problème d'alignement).
Le seul moyen de fiabiliser la génération en pratique est de supprimer logiciellement ces blancs (éventuellement en découpant l'audio et en envoyant plusieurs générations).
Pour les llm, tout un tas de systèmes agentiques sont en cours de développement avec des boucles récursives types génération -> contrôle -> action et les modèles de Rerank.
Du coup je vois les IA comme des moteurs, mais un moteur seul sert pas à grand chose tant que tu peux pas le mettre dans une voiture.
Pour l'effet de plateau, il est à mon sens indéniable que les meilleurs modèles ont des performances proches entre eux, avec une division en deux groupes (ceux qui raisonnent" comme les GPT o1 et DeepSeek-r1 et les autres, qui font du chat).
Dans la seconde catégorie, discute avec QwQ 32B, GPT-4 et Mistral-Small. Si il ne s'agit que de discussion et de suivre des instructions, je vois pas de différence en pratique. Pas plus qu'il n'y en a entre eux et les 30 premières entrées du lmarena (pour le dire vite).
Certains s'en sortiront mieux que d'autres pour certaines tâches (génération de code par exemple avec Claude), sans que ça soit non plus extraordinaire.
Bref, tout ce que je voulais signifier, c'est qu'on ne parle toujours que des modèles alors qu'il faudrait à mon avis un peu plus parler d'applications pratiques.
Par exemple aucune entreprise ne confierait sa comptabilité à la meilleure des IA les yeux fermés sans aucun contrôle.
Par contre, le jour où une entreprise propose ce service via des IA et s'engage juridiquement pour en assurer la fiabilité, là il y aura un changement de paradigme. Et je suis certain que si c'est possible avec la techno actuelle, c'est uniquement avec des modèles modeste mais spécialisés, et pilotés par des logiciels qui contrôlent absolument tout.
Dans cet exemple, l'IA est le moteur, sans elle rien ne se fait, mais tu n'as une application pratique que par le logiciel qui l'englobe.
Et ça ne passera pas à mon avis par les gros modèles généralistes comme GPT-4.5, peu importe leur score sur MMLU-Pro et autre comparatif à la mode.
[^] # Re: Et Mistral ?
Posté par Florian.J . En réponse à la dépêche Nouvelles sur l’IA de mars 2025. Évalué à 0.
Je n'ai pas dis qu'il n'y avait plus de marges de progression, mais la techno actuelle à base de transformeurs semble atteindre un plateau et le groupe des principaux modèles semblent avoir des capacités qui tendent à s'uniformiser.
Seul OpenAI cherche à sortir du lot au prix de milliards d’investissements pour des résultats au mieux notables, mais sans rien révolutionner, et ne leur donnant que quelques mois d'avance.
Pour reprendre ton exemple, lié à la même problématique de la planification, c'est justement ce que cherchent à combler les agents (via souvent du bourrinage s'apparentant à du brute-force).
Mais les llms semblent avoir des limites indépassables lié à leur fonctionnement propre. Ils peuvent notamment à tout moment polluer leur propre contexte de façon aléatoire.
Donc soit il y a une rupture par des technos complètement différentes, soit l'IA agentique reste pour longtemps un domaine de llm.
Et dans ce cas, je vois pas comment on peut éviter la stagnation des performances et l'effet de plateau.
Et c'est dans ce contexte qu'à mon sens qui instrumentent les llms sont au moins aussi importantes que les modèles eux même (on pourrait prendre pour analogie le lien entre un moteur et une voiture).
Et ne pas oublier d'autres types de modèles annexes qui commencent à apparaître pour filtrer les réponses et fiabiliser les résultats (via le Rerank notamment).