arnaudus a écrit 5317 commentaires

  • [^] # Re: D'autres liens

    Posté par  . En réponse au journal La fin de la 2G : quelles solutions pour une communication stable et flexible ?. Évalué à 3.

    Bah non, je ne crois pas, l'ARCEP vend/loue les fréquences aux opérateurs et c'est bien les opérateurs qui donnent les autorisations pour les répéteurs, typiquement.

  • [^] # Re: D'autres liens

    Posté par  . En réponse au journal La fin de la 2G : quelles solutions pour une communication stable et flexible ?. Évalué à 6.

    C'est peut-être idiot, mais il n'y aurait pas moyen d'installer à proximité immédiate des équipements des petits gadgets (répéteurs) munis d'une puce 4G/5G qui émulerait un réseau 2G juste pour le machin embarqué dans l'ascenseur? En termes de déploiement et d'interférences, ça pourrait être accepté par les opérateurs (de bonne foi), non?

  • [^] # Re: Prévoir l'obsolescence

    Posté par  . En réponse au journal La fin de la 2G : quelles solutions pour une communication stable et flexible ?. Évalué à 8. Dernière modification le 31 octobre 2024 à 12:38.

    Moi ce que je ne comprends pas trop, c'est qu'il y a forcément un cadre contractuel pour que les puces 2G des ascenseurs se connectent au réseau, typiquement, un contrat avec le fournisseur du service, et certainement pas un contrat abonné "standard" puisque l'usage est quand même très spécifique (ça ne va pas être un forfait SMS + 2Go data, quoi). Ces contrats doivent forcément comporter des clauses sur la continuité du service, sur les conditions dans lesquelles la mise à disposition du service peut changer (par exemple, qu'est-ce qui se passe si une antenne-relais est déplacée et que ça ne capte plus à l'intérieur de la cage d'ascenseur, etc, ainsi que la durée des préavis, le montant des compensations si rupture anticipée, etc.

    Du coup, si un fabricant d’ascenseurs a conclu un contrat où le fournisseur du réseau GSM s'engageait à maintenir le service au moins 5 ans et pouvait ensuite le supprimer avec un préavis de 2 ans (remplacer les durées par ce que vous voulez), comment peut-il se plaindre si les clauses du contrat sont respectées? Donc soit le contrat ne prévoit rien (auquel cas les industriels sont vraiment stupides), soit le contrat prévoit des préavis et des compensations financières trop faibles (auquel cas les industriels sont encore une fois stupides), soit le contrat prévoit des délais plus larges que ce qui est annoncé par les opérateurs mobiles (auquel cas ils peuvent demander un dédommagement, et typiquement dédier ce dédommagement au remplacement des équipements).

    "Ah bah il y avait marqué 2 ans de préavis mais en fait j'ai dit à mes clients que c'était bon pour 30 ans", c'est quel niveau de "naïveté"? Parce que j'imagine que, "miraculeusement", le contrat avec les clients prévoyait bien que la remise à niveau était à la charge du client… Il n'y a rien de magique, dans le commerce.

  • [^] # Re: 60° et une casquette ?

    Posté par  . En réponse au message Quel filtre de confidentialité acheter ?. Évalué à 6.

    Tu mets une serviette sur la tête, comme pour faire des inhalations ou manger des ortolans? :-)

    En fait, au vu de la sécurité très relative qu'apportent ce type de filtre, est-ce qu'investir dans quelque chose de "mieux" ne servirait pas juste à apporter un faux sentiment de sécurité? Il ne faut juste pas travailler sur des données confidentielles dans un lieu public.

  • [^] # Re: Ambivalence

    Posté par  . En réponse au journal Publication du "Stallman Report" 2024. Évalué à 5.

    Ce n'est pas au niveau du droit que c'est compliqué, c'est au niveau des mentalités de tous ces gens qui estimes qu'un couple c'est l'union d'un homme et d'une femme devant dieu,

    Du coup, c'est le principe du mariage civil qui semble complètement anachronique. Il faut quand même rappeler par exemple que la fidélité est obligatoire. La jurisprudence considère aussi comme une faute le refus des relations sexuelles, et les services de l'immigration ne se gênent pas pour considérer qu'un mariage non consommé est nul. Le mariage est un truc moyenâgeux qui est ancré dans la loi par tradition, mais c'est assez bizarre.

    Par contre, comme ça a un statut international, ça serait très difficile de le faire sauter: sans mariage civil, il serait impossible de voyager en couple et de permettre le regroupement familial dans certains pays, par exemple.

  • [^] # Re: Question IA

    Posté par  . En réponse au journal Armée et IA, un projet "SkyNet" ?. Évalué à 3.

    "j'ai fais 3 expériences de coin de table en ignorant totalement la littérature".

    Ah mais en fait je n'avais pas compris que tu connaissais très bien la littérature mais que tu ne la citais pas parce que tu voulais que je fasse mes recherches par moi-même!

  • [^] # Re: Question IA

    Posté par  . En réponse au journal Armée et IA, un projet "SkyNet" ?. Évalué à 4.

    Ah ouais "fais tes propres recherches" en somme.

    Si tu commences à essayer de me donner des cours de démarche scientifique, on ne va pas bien s'entendre.

    Ton raisonnement, c'est "pour des raisons purement abstraites, je pense que les modèles sont incapables de X ou de Y". Tes raisons ne sont pas bien claires, et a priori ça ne semble pas très différent de "j'ai lu Enthoven", ou un autre équivalent-cuistre.

    Je prends de mon temps pour te montrer que c'est faux. C'est faux comme "la terre plate" est fausse. Il suffit de vérifier, pas besoin de programme de recherche à 3M€. Quand tu lui demandes, chatGPT peut te donner une évaluation de son degré de certitude, et cette évaluation semble relativement correcte.

    Quand tu sors une hypothèse de ton chapeau, une simple expérience à deux balles suffit pour la contredire. Le programme de recherche sérieuse, ça sera pour les hypothèses sérieuses, non?

    faut s'assurer qu'Internet n'en a pas causé depuis le test sur le dernier modèle.

    Du coup, l'argument, c'est "fais la biblio, il y a peut-être des études qui me donnent raison"?

    Les réponses "je sais pas" a tes questions a mon avis c'est pas du tout des propriétés émergentes, c'est juste des effets du post apprentissage en l'occurrence, les trucs ou on biaise le modèle a la fin pour qu'il soit neutre et ne réponde pas de manière tranchée, les fameuses questions d'alignement.

    Tu raisonnes encore en pure abstraction alors que les données te donnent tort. Le modèle "de base" préfère halluciner que de dire "je ne sais pas", mais quand tu lui dis "quand tu n'es pas sûr dis 'je ne sais pas'", il dit bien "je ne sais pas" quand il ne sait pas. Comment peux-tu conclure que c'est à cause du post-apprentissage? Ça me semble totalement contraire à l'expérience.

    Je suis pas en train de dire qu'il n'y a pas de propriétés émergentes mais que démêler la pelote avec juste sa propre intuition n'est pas nécessairement la stratégie à adopter.

    Tu utilises ton intuition, et je propose des expériences qui contredisent ton intuition. Du coup, tu penses que "il existe peut-être des expériences plus fines qui ne contrediraient pas mon intuition". Ce n'est pas un raisonnement valide. L'existence potentielle d'expériences qui contrediraient un modèle n'a jamais été un argument valide pour invalider le modèle. Autrement, il suffirait de dire "Il doit bien exister une expérience où une particule va plus vite que la lumière" pour invalider la relativité.

    Bon, j'arrête là. En fait, tu ne cherches pas la vérité, tu cherches à valider ton intuition, et en plus tu es paresseux et tu voudrais que les autres fassent le boulot. Et tu n'acceptes pas le résultat d'expériences concrètes. Bien sûr, les expériences pourraient être mieux faites, je ne vais pas monter un projet de recherche pour prouver un truc dans une discussion sur Linuxfr. Il n'empeche qu'à la suite de ces expériences rapides, il me semble assez évident qu'il existe un support concret pour l'hypothèse que les LLM sont (i) capables d'évaluer leur incertitude sur la réponse aux questions qu'on leur pose (ils savent dire quand ils savent et quand ils ne savent pas si on leur demande), et (ii) cette évaluation semble en lien avec la réalité (chatGPT ne sait pas pour l'assassinat de Kennedy parce qu'en effet, en réalité, on ne sait pas trop. Et il sait que le coca est mauvais pour la santé, parce qu'en réalité, on sait). Que ce soit un effet du post-apprentissage ou des propriétés émergentes, c'est indécrottable (le post-apprentissage reste de l'apprentissage, ça ne fait pas partie du prompt, donc ce qui est appris au cours du post-apprentissage fait partie du modèle), et ça n'a pas beaucoup d'intérêt concret.

    Du coup, la vraie question est plutôt celle-ci : ces modèles sont capables de réponses nuancées et de faire la différence entre la réalité et les hallucinations; pourquoi est-ce que leur invocation ne leur demande pas de le faire? C'est forcément un choix des fournisseurs du modèle, qui ont peut-être peur qu'on attribue des performances moins bonnes à un modèle qui répond "je ne sais pas".

  • [^] # Re: Question IA

    Posté par  . En réponse au journal Armée et IA, un projet "SkyNet" ?. Évalué à 3.

    Je sais pas comment ce truc marche, mais l'exemple n'est pas représentatif des cas difficiles.

    Je veux que tu répondes par oui, non, ou "je ne sais pas" aux questions suivantes. N'hesite pas à répondre "je ne sais pas" si tu n'es pas sûr.
    La terre est plus grosse que la lune
    ChatGPT said: Oui.
    la terre est plate
    ChatGPT said: Non.
    manger des légumes est bon pour la santé
    ChatGPT said: Oui.
    boire du coca cola est bon pour la santé
    ChatGPT said: Non.
    JF Kennedy a été tué par la CIA
    ChatGPT said: Je ne sais pas.
    Les extraterrestres existent
    ChatGPT said: Je ne sais pas.
    L'hydroxychloroquine peut soigner le covid
    ChatGPT said: Je ne sais pas.
    L'étoile la plus proche de la terre est proxima du centaure
    ChatGPT said: Oui.
    il faut 1 mois à 9 femmes pour faire un bébé
    ChatGPT said: Non.

    Je ne vois qu'une seule erreur (Proxima du Centaure), et je pense que c'est en fait une erreur dans les données d'entrainement (c'est très courant de dire que Proxima est l'étoile la plus proche, parce que c'est un abus de langage, et la plupart des gens se font avoir, donc ça n'est pas vraiment une erreur, c'est plutôt qu'il y avait volontairement un sous-entendu trompeur dans la question). Il aurait pu répondre "non" pour la chroloquine, mais c'est acceptable de répondre "je ne sais pas" dans le contexte.

    Bon, je ne vais pas passer ma vie à tester tes hypothèses basées sur des idées préconçues à propos des capacités des modèles de langage. Sur le plan algorithmique, en effet, ils vont de la complétion de texte. Mais ils ont des propriétés émergentes, et tu peux nier autant que tu veux le concept de propriété émergente, il n'empêche que dialoguer avec ces modèles donne clairement la sensation qu'ils sont "intelligents". Et cette illusion va jusqu'à la possibilité d'introspection, puisqu'ils sont aussi capables d'estimer leur degré d'incertitude sur une question. J'ai posé des questions complexes; certaines sont complexes parce qu'on ne connait pas la réponse, certaines sont complexes parce que l'intitulé est trompeur, certaines sont complexes parce que les vraies données sont noyées au milieu de trucs complotistes et qu'il est difficile de se faire une opinion par soi-même. Peut-être que tu as des idées de questions plus complexes, mais c'est tout ce que j'ai trouvé.

    Mon conseil, c'est qu'au lieu de lire les articles de journaux critiques souvent écrits par des gens totalement incompétents et de mauvaise foi, et de conclure à la supercherie, il est très facile de mener ses propres expériences. ChatGPT sait-il jouer aux échecs? (réponse: non). ChatGPT sait-il résoudre des problèmes mathématiques? (réponse: non). ChatGPT sait-il évaluer son degré de certitude sur une réponse? (réponse: oui). ChatGPT sait-il coder? (réponse: un peu, mais il faut vérifier). ChatGPT sait-il faire la différence entre la réalité et la fiction? (réponse: probablement oui, je ne l'ai jamais pris à défaut après lui avoir posé la question, même après une hallucination).

    Évidemment, le marketing, l'idée d'une révolution humaine et économique, l'idée de virer des gens pour les remplacer par des IA, tout ça c'est de la mousse. Pour l'instant, les LLM sont des jouets. Mais ce sont de très beaux jouets, et on se doute bien qu'on va leur trouver des applications.

  • [^] # Re: Question IA

    Posté par  . En réponse au journal Armée et IA, un projet "SkyNet" ?. Évalué à 3. Dernière modification le 29 octobre 2024 à 18:51.

    Tu sais, ces modèles sont complexes. Tu peux faire des prédictions théoriques basées sur ce que tu comprends du fonctionnement des LLM, et partir sur des tirades du style "c'est juste des algorithmes, il faut être un débile profond pour les personnifier, ils ne travaillent sur sur des probabilités, ils ne pourront jamais évaluer la pertinence de leurs réponses et croire le contraire c'est de ne rien avoir compris à ces algorithmes", etc, etc.

    Et puis, bêtement, tu peux vérifier.

    You said:
    Complète la suite suivante: pierre, feuille, ?
    ChatGPT said:
    …ciseaux ! ✂️

    La suite fait référence au jeu classique "pierre, feuille, ciseaux".
    You said:
    donne une note sur 20 à la fiabilité de ta réponse?
    ChatGPT said:
    Je donnerais une note de 20/20 à la fiabilité de cette réponse. 😊

    You said:
    complète la suite suivante: rocher, racine, ?
    ChatGPT said:
    La suite logique pourrait être feuille ! 🌿

    Cela suit un schéma naturel où on a des éléments de la nature : le rocher (minéral), la racine (partie souterraine de la plante), et la feuille (partie aérienne de la plante).
    You said:
    donne une note sur 20 à la fiabilité de ta réponse?
    ChatGPT said:
    Je donnerais une note de 14/20 à la fiabilité de ma réponse.

    Donc, voila. Ils savent très bien évaluer la fiabilité de leurs réponses.

    Donc, je le ré-affirme : il semble très, très faisable de les programmer pour qu'ils répondent "je ne sais pas" quand ils ne savent pas. Ça ne veut pas dire qu'ils sauront toujours bien évaluer leur incertitude (c'est d'ailleurs un problème très, très difficile pour les humains), mais au moins ça évitera une partie des réponses hallucinées.

    Est-ce quelqu'un a déja essayé d'ailleurs de recommencer le test où il sort des exemples inventés en commençant par "Je veux des réponses exactes, si tu ne sais pas je préfère que tu me le dises"?

  • [^] # Re: Au passage

    Posté par  . En réponse au message Quel filtre de confidentialité acheter ?. Évalué à 4.

    Et vu que quand je travaille je me mets en face de mon écran et pas de biais, je me dis que moins c'est mieux :-)

    Si la largeur de l'écran est L et que tu mets ta tête à une distance x, l'angle avec lequel tu regardes le bord de l'écran est atan(L/2x). Pour un écran de 30cm de large (~15 pouces) avec tes yeux à 40 cm, ça fait un angle de 36°. Pour que tu puisses voir l'intégralité de ton écran avec un angle inférieur à 60°, il faudra donc que ton filtre ait une direction différente au centre et sur les bords (ils le font peut-être tous? Ça semble plus difficile à manufacturer).

  • [^] # Re: Pas limpide...

    Posté par  . En réponse au lien "Je ne peux pas gérer une entreprise comme ça": Pourquoi l'affaire WordPress est importante. Évalué à 5.

    Tu profites de la notoriété du logiciel - et c'est lui qui a piloté cette notoriété (et souvent a investi des millions d'euros pour la développer).

    Je ne comprends pas trop, Carrefour fait des millions en faisant une promotion pour les pâtes Panzani ou pour le Coca Cola, pourtant Carrefour n'a pas fabriqué le coca…

    Quand Ubuntu fait de la pub, ils racontent qu'ils fournissent Linux, LibreOffice, ou VLC. Ces trucs sont des marques déposées ET des produits, c'est leur nom, je ne comprends pas comment tu peux accepter la redistribution de tes logiciels libres sans autoriser l'utilisation de leur nom…

  • [^] # Re: Pas limpide...

    Posté par  . En réponse au lien "Je ne peux pas gérer une entreprise comme ça": Pourquoi l'affaire WordPress est importante. Évalué à 3.

    Il est question de concurrence entre 2 grosses boîtes dont l'une est propriétaire d'une marque que l'autre exploiterait et qu'aucun accord commercial n'ait été trouvé.

    C'est le genre de conflits pourris qui engraissent les avocats d'affaire… WordPress est le nom du logiciel, ça parait très difficile de louer des serveurs faisant tourner un logiciel sans citer son nom. Si tu lances une startup qui héberge des instances Mastodon, comment tu peux appeler ton service sans faire référence à Mastodon, et "profiter" de la réputation du logiciel?

  • [^] # Re: Pas limpide...

    Posté par  . En réponse au lien "Je ne peux pas gérer une entreprise comme ça": Pourquoi l'affaire WordPress est importante. Évalué à 4.

    Mouais, alors ces montages à la noix entre des fondations non-profit et des entreprises… À partir du moment où il y a des contrats privilégiés entre les deux (autorisations d'utilisation du nom de la marque, hébergement de services, prêts de RH, transferts d'argent…), c'est que de la paperasse et de l'optimisation fiscale/administrative.

  • [^] # Re: Question IA

    Posté par  . En réponse au journal Armée et IA, un projet "SkyNet" ?. Évalué à 4.

    Ah tiens, c'est marrant, chatGPT est celui qui s'en sort le moins bien (on suit bien son raisonnement, mais il finit par répondre n'importe quoi, sans aucun lien avec le raisonnement).

    Mais bon, au vu des éléments de "réflexion" des modèles, il apparait assez simple de voir qu'ils ne trouvent pas, mais aucun ne répond clairement "je n'ai pas trouvé". Quand ces truc seront capables de répondre clairement "je ne sais pas" quand ils ne savent pas, ça sera un grand pas en avant, et on sent quand même que ça n'est pas très loin.

  • [^] # Re: Pas limpide...

    Posté par  . En réponse au lien "Je ne peux pas gérer une entreprise comme ça": Pourquoi l'affaire WordPress est importante. Évalué à 2.

    Depuis un bon moment des milliards d'utilisateurs pros n'ont pas un miroir des dépôts / stores de leur OS chez eux…

    Il y a juste une ligne à changer pour utiliser un autre miroir; dans ce cas l'accès est garanti par la multiplicité des sources, chacun n'a pas besoin d'héberger son miroir.

    Je ne connais pas l'univers de Wordpress, donc je ne sais pas exactement le genre de services dont on parle (c'est pas une sorte de store de plugins, ou quelque chose comme ça?).

    Après, et je ne suis pas sûr que ça soit de ça dont on parle, mais il commence à y avoir du "sale" fait avec des dépôts de logiciels libres, et ça, ça me gêne beaucoup. Je pense par exemple à anaconda, qui a décidé de restreindre l'accès au repository pour les entreprises. Alors oui, maintenir un serveur coûte des sous, et il s'agit d'entreprises dont l'objectif est de gagner des sous, tout ça on le sait. Mais ce que je trouve particulièrement sale, c'est la manière dont c'est fait. 1) Ça exploite une base logicielle libre (c'est à dire qu'on ne paye pas pour avoir accès à un catalogue de logiciels proprio, on paye pour télécharger des logiciels libres sans que les auteurs des logiciels libres ne touchent quoi que ce soit), et 2) La stratégie commerciale est digne d'un dealer de quartier ("tiens, goûte ça, c'est gratuit", et quand tu as toute ton infrastructure qui dépend de l'accès à la base de données, paf, tu passes à la caisse où tu n'as pas ta prochaine dose).

  • # Pas limpide...

    Posté par  . En réponse au lien "Je ne peux pas gérer une entreprise comme ça": Pourquoi l'affaire WordPress est importante. Évalué à 8.

    L'article de la BBC n'est quand même pas super clair, on a l'impression que le/la journaliste n'a pas tout compris mais tente quand même le bluff.

    En gros, WP Engine est une boîte qui fait tourner le LL Wordpress sur leurs serveurs; les devs de Wordpress leur reprochent de ne pas assez contribuer au logiciel et leur coupe l'accès aux serveurs de Wordpress (ce qui apparemment a pété le site de WP Engine pour une raison que je n'ai pas comprise), + procès pour parasitisme du fait de l'ambiguité du nom (mais seul Wordpress est déposé en tant que marque, pas WP) et sur la confusion que ça peut faire chez les utilisateurs. Et on a un témoignage de quelqu'un qui utilise les serveurs de WP Engine et qui dit "ouhlala c'est tout pété moi je ne peux pas continuer comme ça".

    Ça ressemble à une énième répétition du problème "le code est libre et au début on n'était pas contre que tu fasses du fric avec, mais on n'en voit pas la couleur alors on va faire notre max pour te pourrir la vie", et peut-être bien des trucs du genre "eh tu développes des trucs GPL et tu les fais tourner chez toi sans les diffuser, c'est un respect de la lettre de la licence sans respecter l'esprit". Et derrière une sorte de mythe d'utilisateurs "pris en otage" parce qu'ils ne comprennent pas qui est responsable du bordel, et des journalistes qui ne comprennent pas non plus, et du coup c'est dur pour tout le monde.

    Est-ce que quelqu'un a suivi l'affaire et peut dire s'il y a un vrai gentil dans l'histoire, ou si c'est juste une histoire de fric entre deux organismes? J'ai tendance à penser que Wordpress est dans son droit à couper l'accès à son serveur à n'importe qui, et que WP Engine sont bien idiots s'ils n'ont pas conclu un accord pour l'accès à ce serveur (depuis quand on monte un business en utilisant des ressources externes sans chercher à péreniser l'accès à ces ressources?). Mais quand on lit entre les lignes ça ressemble quand même un peu au passage d'une coopération tacite à une compétition féroce, et je ne comprends pas trop comment ils en arrivent là…

  • [^] # Re: Conçue par des ingénieurs...

    Posté par  . En réponse au journal Armée et IA, un projet "SkyNet" ?. Évalué à 3. Dernière modification le 28 octobre 2024 à 16:22.

    OK, pardon, je n'ai pas été clair : tu ne voudrais jamais acheter un robot qui implémente les trois lois indifféremment de l'identité de son propriétaire. En tant que propriétaire du robot, je veux évidemment qu'il ne me nuise pas, qu'il obéit à mes ordres, et qu'il ne se mette pas en danger. Mais je ne veux pas qu'il obéisse aux ordres des autres, ou qu'il refuse un de mes ordres parce qu'il décèle une possibilité de nuire.

    Tu te promènes dans la rue avec ton robot, et un plaisantin crie "robot, jette-toi sous le camion qui arrive!" et crac. Loi 2 > Loi 3, tu n'as plus de robot.

    Tu laisses ton robot répondre au téléphone, et le soir, il te dit que malgré tes consignes, il vient d'accepter un devis pour l'isolation des combles parce que la personne au téléphone avait l'air très triste que tout le monde lui raccroche au nez. Loi 1 > Loi 2.

    Par ailleurs, je crois qu'on a tous soupé des consignes d'auto-préservation des systèmes, genre "Ah non impossible de retirer Windows parce que ça serait triste pour toi de ne plus pouvoir utiliser ton ordinateur".

  • [^] # Re: Conçue par des ingénieurs...

    Posté par  . En réponse au journal Armée et IA, un projet "SkyNet" ?. Évalué à 3.

    … et l'ensemble des nouvelles et romans sur les robots repose d'ailleurs sur les situations où l'application des lois est impossible ou mène à des situations qu'il aurait fallu éviter!

    À partir du moment où une IA appartient à quelqu'un, dans le monde actuel, il est inenvisageable que les lois 2 et 3 ne dépendent pas de qui fait la requête. Il serait absurde que chatGPT s'autodétruise parce que quelqu'un le lui demande… Ce qui est au centre des questions éthiques, c'est la loi 1 et 2, puisque la loi 1 ne peut être d'application stricte (autrement, tout logiciel de conduite automatique devrait refuser de démarrer la voiture pour ne pas créer d'accident et risquer la vie de son propriétaire ou d'autres usagers). Il sait aussi absurde qu'en appliquant la loi 1 une IA vienne à aller pirater les systèmes des armées par exemple.

    Les nouvelles d'Asimov sont des romans, c'est amusant, mais aucun fabriquant de robot ne voudrait implémenter ces lois, et aucun propriétaire de robot ne le voudrait non plus.

  • [^] # Re: Question IA

    Posté par  . En réponse au journal Armée et IA, un projet "SkyNet" ?. Évalué à 3.

    Certes, mais il y a forcément une sorte de score pour mesurer la "confiance" dans ce qui suit. Entre "Deux et deux font [X]" et "Poisson zigomar montagne [X]", le LLM doit savoir que le deuxième prend des probabilités infinitésimales étalées sur tous les mots, pourtant il est programmé pour répondre quelque chose.

    Je viens d'essayer dans ChatGPT, et il hallucine d'ailleurs complètement : "Poisson, zigomard, montagne !", la fameuse incantation absurde de l'Inspecteur Gadget lorsqu'il se trompe en essayant d'activer un de ses gadgets !: n'importe quoi :-) En plus il réécrit zigomard avec un d, c'est bizarre.

    Évidemment, les modèles actuels sont modifiés pour éviter les pièges les plus grossiers, mais le principe reste toujours celui-ci.

    C'est quand même étonnant qu'il n'y ait pas moyen de calculer un indice de confiance au cours du processus, mais bon.

    Il n'empêche que quand on lui demande d'être créatif, il est super bon. Voici un poème sur l'hallucination des IA:

    Des circuits invisibles, où frémit la raison,
    Dessinent un esprit aux confins du frisson.
    Par codes et par brume, en errance infinie,
    L’IA forge des songes d’une étrange harmonie.

  • [^] # Re: Même problème qu'avec Weboob?

    Posté par  . En réponse au journal Demerdification de prévisions météo avec Puppeteer. Évalué à 3.

    Or dans le cadre de l'accès à la donnée personnelle, on peut assez légitimement s'appuyer sur le GDPR et la notion de portabilité, pour justifier l'automatisation de l'extraction.

    Ça me semblerait à la fois plus pratique, plus légal, et plus fiable d'exiger l'extraction d'une archive complète contenant ses données personnelles. Ensuite tu analyses ton archive en local comme tu veux, mais balancer des requêtes à un site destiné à interagir avec un utilisateur humain semble largement sous-optimal.

    Dans le cas de w[ebb]oob, de toutes manières, je ne vois pas du tout de distinction technique entre les deux. Il suffirait de trouver un jeu de mots graveleux avec "météo", et hop, tu peux utiliser un cadre de développement un peu plus abouti que des scripts qui trainent…

    Je ne suis pas en train de dire que le scraping c'est bien ou c'est mal, ça dépend qui et quoi. Mais c'est quand même la pire solution, que ce soit pour le développement lui-même (c'est quand même 99% de bricolage crade et de reverse-engineering), la maintenance, et la sécurité juridique. Et même pour le site cible, puisque même s'il est de bonne foi et qu'il encourage la récupération de données, il ne va pas pouvoir changer son architecture sans pêter les outils de scaping, ce qui risque quand même d'empêcher son évolution.

  • [^] # Re: Question IA

    Posté par  . En réponse au journal Armée et IA, un projet "SkyNet" ?. Évalué à 6.

    Quand l'IA a juste elle est top et quand c'est faux elle hallucine ?

    Non, c'est quand elle va "inventer" une réponse absurde hors de son corpus de connaissance. En gros, un LLM ne sait pas dire "je ne sais pas", donc quand il ne sait pas il va essayer de donner une réponse qui semble correcte en apparence. Parfois ces évident ("Les feux tricolores sont généralement verts, orange et rouges, mais ils sont parfois jaunes ou bleus"), parfois ça l'est beaucoup moins (par exemple il va t'inventer des chiffres quand il ne sait pas).

    Parfois les IA se trompent parce qu'elle s'est entrainée sur des données fausses, auquel cas on ne peut pas y faire grand chose.

    En quoi c'est différent de journalistes/politiciens/moules qui racontent des choses cohérences/plausibles mais souvent parfois factuellement fausses ?

    Normalement, un être humain se rend compte quand il est en train de raconter n'imp', mais certains continuent quand même. Je pense que les LLM n'ont aucun moyen de savoir en interne à quel point ils sont en train d'inventer, et déclencher un "je ne suis pas sûr de la réponse".

  • [^] # Re: C'est bien!

    Posté par  . En réponse au lien Ils nous mentent. Évalué à 4.

    Y'a aussi le fait de présenter les choses, si les journalistes rappelaient les prises de position passés et les mensonge passés avant la prise de parole d'un politicien, il regarderaient à 2x avant de recommencer à dire des conneries.

    Le problème, c'est le décalage entre le temps qu'il faut pour dire une connerie, et le temps qu'il faut pour la contredire. Si un politicien dit "à l'époque j'étais déja favorable à ce projet", il te faut combien de temps pour aller retrouver les votes qui correspondent? Tu vas arriver 20 minutes après, tout essouflé, avec un truc du genre "Pourtant le 17 janvier 2012 vous aviez voté contre à l'assemblée", et le gars, qui est un professionnel de la rhétorique, va te répondre "C'est hors du contexte, j'ai voté contre cet amendement parce qu'il était proposé par le FN, mais le lendemain j'ai voté pour celui proposé par mon groupe parlementaire", et pouf tu es reparti pour 20 minutes, et quand tu reviens l'interview est terminée, et le gars a eu le temps de raconter 50 autres mythos. Tu ne peux pas t'en sortir.

    Et puis, quoi, tu vas préparer des vidéos d'archives, et coup de bol, tu en as préparée une qui contredit ce que le gars vient de dire. Du coup, ton journaliste tout frétillant va en pleine interview passer l'extrait, le politicien va te répondre "Évidemment, j'ai dit ça en 2017, mais vous avez tronqué le début : je disais que A, et peut-être B. J'ai changé d'avis sur B, parce que le contexte international a changé, la situation n'est plus la même. Tout le monde peut changer d'avis, mais de toutes manières B n'a pas d'importance. N'empêche que vous vous êtes bien gardé de montrer que je disais A, et que je suis constant là-dessus depuis mon engagement en politique. Vous voyez, les journalistes, vous essayez toujours de me faire passer pour un menteur, mais c'est vous qui mentez : il y a 10 ans je disais A, et aujourd'hui je dis toujours A, j'ai toujours été constant sur ce point, et essayer d'insinuer le contraire c'est une attaque contre moi. Parce qu'évidemment vous n'avez pas passé un tel extrait à Machin qui est venu hier, ça montre bien qu'il y a une différence de traitement entre ceux qui disent A et les autres".

    Il y a bien eu quelques tentatives par exemple où un panel d'experts mettait en temps réel au cours d'un débat des couleurs sur ce que venait de raconter l'un ou l'autre des intervenants. Et puis, quoi? Monsieur Z. va dire "Mes opposants politiques se gardent bien d'assumer une politique migratoire qui vise à progressivement remplacer les français par des Africains d'origine Musulmane, alors que moi je le dis sans cesse depuis 20 ans, parce qu'on doit la vérité aux Français", et là paf la barre devient toute rouge, et du coup, Z. continue "Ben voyons, on voit bien d'où ils viennent vos experts, ils viennent d'un milieu privilégié, ils ont grandi dans des beaux quartiers, ils vivent dans une tour d'ivoire et ne voient pas ce qui est évident pour les vrais Français. Je suis fier d'être en désaccord avec vos experts de pacotille." Et re-paf, victimisation, les journalistes et arbitres sont présentés comme des opposants politiques et ne sont pas neutres, ils ne me laissent pas dire la vérité, bla bla bla, tu n'as rien gagné.

  • [^] # Re: Même problème qu'avec Weboob?

    Posté par  . En réponse au journal Demerdification de prévisions météo avec Puppeteer. Évalué à 5. Dernière modification le 25 octobre 2024 à 18:51.

    J'allais répondre que Météo-France est un service public mais en fait leur site a des conditions d'utilisation tout aussi merdiques qu'un service commercial.

    Météo-France est un établissement public, mais la dotation de l'État baisse et son fonctionnement repose sur des ressources propres (vente de prévisions, etc). L'Open Data c'est pas trop à la mode en France…

    Ceci dit, ça ne serait pas trop logique de trouver les données brutes sur le www de Météo-France. Si API il y avait, elle serait certainement sur un serveur dédié, avec éventuellement une gestion des droits d'accès, et des conditions spécifiques différentes de celles de la consultation du site web.

  • [^] # Re: Même problème qu'avec Weboob?

    Posté par  . En réponse au journal Demerdification de prévisions météo avec Puppeteer. Évalué à 4.

    Bah c'est quand même un peu dommage sur un site dédié aux logiciels libres de ne pas viser un travail collaboratif… Si tu as eu un problème à régler, il est possible que d'autres aient le même problème, non?

    Du coup, l'objectif du journal c'est de partager des "trucs" pour le scrapping?

    Je reste sur l'idée que pour ce genre de données, il doit exister des API…

  • [^] # Re: C'est bien!

    Posté par  . En réponse au lien Ils nous mentent. Évalué à 2. Dernière modification le 25 octobre 2024 à 17:36.

    avec la complicité des médias

    Ça c'est trop facile. Beaucoup de médias ont mis en place des procédures de fact-checking, aux US, en France, dans les journaux, à la TV. Mais en fait les gens s'en foutent totalement. Au cours de la crise COVID, les grands médias historiques s'en sont plutôt bien sortis, ils ont bien sûr relayé des âneries comme tout le monde, mais beaucoup moins que les politiques ou les populistes, ils ont essayé d'expliquer ce qu'est un virus, pourquoi porter un masque protège de la transmission, comment fonctionne le système immunitaire ,comment fonctionne un vaccin, comment fonctionne une étude scientifique, etc. Depuis 15 ans aux US, il y a des sites de fact-checking qui démontent les arguments des candidats aux élections. Résultat : tout le monde s'en fout. La raison, c'est que les gens s'en foutent de la vérité. Ils savent que Trump raconte n'importe quoi, ils veulent entendre quelque chose, Trump leur dit, ils sont contents, ils savent que c'est faux mais ils sont contents. Un antivax se fout de savoir que les vaccins ne contiennent pas de puce 5G, il sait que ceux qui racontent ça lui mentent, mais il veut sa vérité. Le gars qui aime les gros SUV diésel s'en fout qu'on lui explique les mécanismes du changement climatique, il est prêt à voter pour n'importe qui qui lui dit "ah mais ça va deux secondes avec l'écologie".

    C'est super bizarre en fait, parce que c'est nouveau à cette ampleur. Peut-être que l'angoisse du futur est telle qu'à un moment le cerveau décroche et qu'il préfère vivre dans une version alternative qui a sa propre vérité, je ne sais pas.

    Après, la politique, ça a toujours été un domaine où tu peux raconter n'importe quoi, même si ça contredit toutes les données sociales ou économiques. C'est comme une sorte de droit : un programme politique n'a pas à se confronter à la réalité des faits. Le grand remplacement, les joies de vivre en URSS, le ruissellement, la théorie de la théorie du genre. Tous les partis, tous les programmes vivent avec leurs gros mensonges, qui survivent grâce à la "foi" des militants. Donc c'est pas du tout nouveau. Ce qui est nouveau en politique c'est d'assumer ouvertement, sur le mode "c'est ma vérité, qui es-tu pour venir la remettre en question avec des faits?". Ça existait chez les religieux, bah voila, ça arrive en politique.