Thomas Douillard a écrit 8993 commentaires

  • [^] # Re: superbe initiative de huggingface

    Posté par  . En réponse au journal Votre code dans un modèle d'IA. Évalué à 2.

    Tu supposes que le LLM a été fabriqué à partir du DVD que t'as dans ton salon et que Sam Altman a signé cette licence !

  • [^] # Re: superbe initiative de huggingface

    Posté par  . En réponse au journal Votre code dans un modèle d'IA. Évalué à 2.

    Avec un prompt formulé aussi succinctement il devient flagrant qu'il y a quelque chose qui ressemble fortement à du plagiat, donc non, et c'est trivial à reproduire. Le truc arrive à reconstituer le film à partir de son nom en gros. (Et oui la proportion de l'œuvre éventuellement identique ou proche compte pour déterminer si il y a plagiat ou non légalement.)

    Si le prompt, hypothétiquement, décrit tout le film dans les détails et que ça reste chez l'utilisateur à usage perso il ne devrait pas spécialement avoir de pb. Si il ou elle redistribue le résultat après publiquement il se pourrait que ça pose soucis.

  • [^] # Re: Dans le même esprit

    Posté par  . En réponse au lien How web bloat impacts users with slow devices. Évalué à 3. Dernière modification le 22 mars 2024 à 12:29.

    Dans tous les cas, ce serait cool que les gens et les boites soient sensibles directement à l'écologie, l'accessibilité, et le respect des gens et optimisent pour ces choses, plutôt que devoir passer par l'argument intermédiaire imparfait du profit.

    C’est le seul moyen en fait, parce que si c'est faire du profit pour que le patron puisse acheter un jet privé, l'optimisation du site web … L'écologie c'est du bien commun, faut poser les problèmes sur la table, et bien souvent on se heurte en faisant ça aux logiques de profit immédiats.

    Ça résonne avec ce post : https://piaille.fr/@jimray@mastodon.social/112133920905682681

  • [^] # Re: superbe initiative de huggingface

    Posté par  . En réponse au journal Votre code dans un modèle d'IA. Évalué à 2.

    Les violations de copyright c'est pas vraiment dépendant du moyen technique utilisé pour fabriquer l'œuvre je crois. Seul le résultat compte, et il est protégé, ou il n'est pas protégé. Je pense que si tu reproduit à l'identique une grande part d'un code il y a de toute façon question à se poser, ça n'a aucune chance de se produire au hasard hors de toutes petites portions. Après si tu donnes un prompt assez précis pour que ça se reproduise, on peut soupçonner que le prompt avait pour but de reproduire l’œuvre … Donc potentiellement ça dédouane l'éditeur du logiciel / modèle, pas tellement l'utilisateur.

    Et puis pour démontrer que le modèle est bel et bien généré par le jeu d'apprentissage prétendu ça doit pas être si simple, faut un apprentissage qui soit reproductible, c'est un challenge https://neptune.ai/blog/how-to-solve-reproducibility-in-ml Pas dit que ce soit la priorité des industriels d'avoir une reproductibilité digne d'une science ouverte et reproductible, c'est pas leur objectif numéro 1.

  • [^] # Re: Liens morts wikipédia

    Posté par  . En réponse au lien La plus grande archive d’internet pourrait fermer à cause d’une plainte de ces éditeurs. Évalué à 2.

    Il semble par cet autre lien que seul le prêt de livre soit concerné, effectivement : https://torrentfreak.com/publishers-cite-napster-and-ai-training-threats-in-legal-battle-with-the-internet-archive-240318/

  • # Liens morts wikipédia

    Posté par  . En réponse au lien La plus grande archive d’internet pourrait fermer à cause d’une plainte de ces éditeurs. Évalué à 2.

    C'est une archive qui sert notamment à Wikipédia quand un lien meurt, à priori heureusement les éditeurs n'ont pas le droit sur toutes les pages archivées. Les craintes de fermetures sont donc exagérées ?

    La wikipédia francophone a également wikiwix, c'est peut-être bien d'avoir de la redondance. En même temps si Internet Archive doit tomber Wikiwix pourrait être inquiété aussi ?

  • [^] # Re: Très cool

    Posté par  . En réponse au lien Quand l’IA se met à décompiler du binaire. Évalué à 3.

    J'ai l'impression qu'ici le lectorat n'est pas né de la dernière pluie et ne se renouvelle pas beaucoup. Tout le monde ici sait ce qu'est la décompilation, on peut parier, et sait que c'est loin d'être trivial.

    Qu'on est dans l'ensemble pas (ou plus) spécialement naïfs sur la technologie, il y a pleins de technocritiques. Après plus d'un an maintenant ou tout le monde a pu avoir accès à ces technos on a plus forcément énormément d'illusions et on a pu en toucher les limites, il y a des articles dans la presse qui parlent de la "fin" de la hype autours de l'IA. Les articles les plus enthousiastes sont dans la presse financière étant donné que le secteur à faim … ça s'adresse à des financiers et pas à des informaticiens.

    L'article de Korben est très superficiel et ne dit presque rien, je sais pas ce qu'attend le lectorat en terme de qualité du code mais je doute qu'on s'attend à retrouver un truc similaire au code original, dans l'ensemble. Mais je peux me tromper !

  • [^] # Re: Très cool

    Posté par  . En réponse au lien Quand l’IA se met à décompiler du binaire. Évalué à 2. Dernière modification le 19 mars 2024 à 10:38.

    Il y a encore besoin de préciser ce genre de choses ici ?

  • [^] # Re: Très cool

    Posté par  . En réponse au lien Quand l’IA se met à décompiler du binaire. Évalué à 2.

    Il y a moyen qu'en plusieurs passes dans le code ça arrive à décompiler un programme complet de manière plus ou moins intéressantes. Genre la première passe décompiles les fonctions individuelles élémentaires, une deuxième passe les fonctions qui les utilisent, en faisant des "lucky guess" sur les structures de plus au niveau au fur et à mesure.

    Mais il y a probablement une grosse limite au moins sur les domaines d'application au fur et à mesure que tu montes de niveau, les domaines d'applications sont en nombre très importants et les jeux d'apprentissages pour apprendre des trucs sur le domaine et plus sur le code en lui même deviennent de plus en plus rare au fur et à mesure, donc il y a vraiment peu de chance que le réseau de neurone arrive à deviner "à quoi sert" le programme dans le domaine pour décompiler à très haut niveau, choisir les bons noms de variables …

    Enfin c'est mon intuition.

  • [^] # Re: Gestion mémoire etc.

    Posté par  . En réponse au journal PullRequest d'une application en Rust. Évalué à 4.

    C’est expliqué là dans le "Nomicon" de rust : https://doc.rust-lang.org/nomicon/subtyping.html

  • [^] # Re: Vrai question C'est quoi l'IA ?

    Posté par  . En réponse au journal Cybersécurité: des chercheurs ont créé un ver qui attaque l’IA. Évalué à 3.

    Tu prêches un convaincu sans doute, après quand un mot part d'un domaine technique dans le grand public il est forcément employé dans un sens différent.

    Ça ne tue pas forcément les autres domaines de l'IA, il y a juste une hype autours de ça actuellement (c'est pas la terminologie qui file les financements et demande de construire des centrales nucléaires).

    Et puis c'est une question qui a le mérite de pouvoir être répondue de manière assez précise /o\

  • [^] # Re: Vrai question C'est quoi l'IA ?

    Posté par  . En réponse au journal Cybersécurité: des chercheurs ont créé un ver qui attaque l’IA. Évalué à 2.

    Justement si, il varie, c'est peut être même la définition de modèle génératif . Le modèle te donne des réponses différentes dans des conditions identiques.

    C’est la réponse qui varie, pas le problème. S’il est entraîné pour sortir un visage, il te sort un visage au hasard, point. C’est pas comme si il devait s’adapter à des demandes différentes qui poseraient des contraintes dans l'espace des visages possibles plus ou moins bien formulées.

    Non là l'exemple porte explicitement sur de la traduction d'une langue naturelle vers une langue formelle.

    Pour le coup tu es obligé d'utiliser un programme dédié à cette tâche. Pour chatGPT t'as juste à formuler un prompt et c'est bien ce que je voulais souligner à la base. Qu'il y ait d'autres techniques, oui, mais ça ne me répond pas trop et je crois pas avoir dit le contraire ?

    Du point de vue d'"intelligence", si on part de la variété des problèmes solubles de manière "naturelle", c'est justement là ou les chatGPT like se distinguent, à mon avis. Tu formules des tas de question plus ou moins bien dont la traduction dans une langue formelle et tu obtiens souvent des réponses pas si mauvaises.

  • [^] # Re: Vrai question C'est quoi l'IA ?

    Posté par  . En réponse au journal Cybersécurité: des chercheurs ont créé un ver qui attaque l’IA. Évalué à 2.

    Tu sais prolog n’était pas en soi le propos de ma réponse mais bien faire réfléchir sur la notion d’IA.

    Tu n'es pas devant un groupe d'étudiant ! On discute de manière plus ou moins légère ou informelle.

    Il existe des IA génératives sans prompt de ce type (juste un GAN appris sur des visages sans étiquette par exemple)

    Oui évidemment, mais y a-t-il de "l'intelligence" dans la génération ? Il s'agit juste de générer un visage aléatoire dans l'espace du plausible. Le problème résolu est fixé à l'avance, et ne varie jamais.

    et des conditionnements avec prompt sans IA générative (traduction de langue naturelle vers SQL par exemple).

    Je ne comprends pas vraiment le point, techniquement ça fonctionne exactement de la même manière avec les mêmes modèles et les mêmes techniques. C’est là qu'on peut voir de "l'intelligence" d'ailleurs. Enfin je dois dire que les traductions et les corpus d'apprentissage parallèle pour la traduction c'est la question que j'ai le moins creusé. Mais si j'ai bien compris c'est les même modèles qui font de la traduction et de la génération de texte, dans plusieurs langues. Tu utilises la même interface que pour demander à chatgpt un texte sur un sujet ou faire du SQL à partir de ta spec en langage naturelle.

  • [^] # Re: Vrai question C'est quoi l'IA ?

    Posté par  . En réponse au journal Cybersécurité: des chercheurs ont créé un ver qui attaque l’IA. Évalué à 2.

    Gardons le flou. Un programme d'intelligence artificielle est soit
    * un programme capable de résoudre une vaste classe de problème formulé de manière relativement naturelle.
    * un programme capable de s'adapter à plein de situations nouvelles

    Une machine de Turing universelle est en principe capable de résoudre tous les problèmes solvables par une machine, mais formuler le problème et l'algorithme est bien pénible, c'est pas de l'IA. Prolog peut résoudre pleins de problèmes, avec une aisance plus ou moins variables mais il y en a pleins qui sont formulables relativement naturellement. SQL peut résoudre plein de problèmes, pas forcément de manière naturelle (quoi que) si on sort de son domaine de prédilection.

    L'IA générative actuelle est imbattable en terme de facilité de formulation, elle peut répondre à des prompts formulés en langue naturelle, résoudre des problèmes pour de vrai, mais on perd l'exactitude de l'IA symbolique.

    J’ai mis le deuxième point pour inclure les programmes qui jouent à des jeux, notamment. Les jeux ont possiblement un espace très vaste, une stratégie inattendue peut déstabiliser les joueurs les plus expérimentés. Et les jeux peuvent être assez profond pour que l'espace des possibles soit vraiment vaste et compliqué à explorer.

    Ça inclue la possibilité "d’évoluer" dans un univers, comme le monde réel pour un android par exemple, avec tout plein d'informations nouvelles qui arrivent tout le temps. Savoir quoi faire dans un univers mouvant demande de grandes capacité d'adaptations et de planifications.

    Pour prolog, oui tu peux être simple utilisateur si tu restes dans un domaine ou le problème est naturel à exprimer en Prolog. Mais si tu sors Prolog de son domaine d'utilisation naturel, sachant que Prolog est Turing complet, tu es programmeur comme un programmeur C++ qui doit se dépatouiller avec les spécificités du langage pour faire faire à la machine des choses compliquées (avec éventuellement de l'intelligence dans le compilateur). Tu peux utiliser Prolog comme un langage de programmation comme un autre.

  • [^] # Re: Vrai question C'est quoi l'IA ?

    Posté par  . En réponse au journal Cybersécurité: des chercheurs ont créé un ver qui attaque l’IA. Évalué à 2.

    Autant que parler à chatGPT c'est faire du machine learning ?

  • [^] # Re: Vrai question C'est quoi l'IA ?

    Posté par  . En réponse au journal Cybersécurité: des chercheurs ont créé un ver qui attaque l’IA. Évalué à 3. Dernière modification le 15 mars 2024 à 09:06.

    Un algorithme au sens strict il résoud le problème à tous les coups, par définition. Mais les specs sont définissables de manière mathématiquement précises. "Trier une liste"

    L'apprentissage auto avec réseaux de neurone c'est probabiliste au mieux, mais ça permet d'attaquer des problèmes comme "est ce qu'il y a une vache sur l'image" qui sont pas vraiment représentables dans un langage mathématique.

    Reste le cas de faire des maths ou de l'info, avec des modèles appris, quand on veut résoudre un problème mathématiquement définissable. Et là bon, avec les réseaux de neurones on y est pas encore.

    Ma "hot take" : les réseaux de neurones sont des ihms, capables de formaliser relativement bien des problèmes mathématiquement flous, en ce qui concerne l'informatique. Ce sont des ponts entre les mondes picturaux, linguistiques, physiques, mathématiques, formalistes … Qui marchent souvent. Pour ça elles doivent être capables de "conceptualiser" des correspondances entre ces mondes, de manière plus ou moins abstraite. Ça implique d'orthogonaliser les concepts indépendants qui peuvent se combiner plus ou moins librement, entre autre.

  • [^] # Re: Vrai question C'est quoi l'IA ?

    Posté par  . En réponse au journal Cybersécurité: des chercheurs ont créé un ver qui attaque l’IA. Évalué à 2.

    Le déclaratif c'est une spécification de problème, on laisse l'algorithme résoudre comme un grand. En principe l'algo résoud quasi tout, sauf si il part en boucle infinie, ce qui peut arriver si le langage est suffisamment riche et qu'il y a des problèmes indecidables dans le lot ! Genre Prolog.

    Donc on peut d'écrire précisément des problèmes, on sait pas comment l'interprète va les résoudre exactement mais en principe l'interprète donnera toujours la bonne réponse si c'est possible d'en donner. Le peut être langage est suffisamment riche pour décrire bien des problèmes mathématiquement définissable. On peut pas borner le temps d'exécution en general.

  • [^] # Re: Vrai question C'est quoi l'IA ?

    Posté par  . En réponse au journal Cybersécurité: des chercheurs ont créé un ver qui attaque l’IA. Évalué à 9.

    Les techniques actuelles qu'on nomme Intelligence Artificielle en 2014 c’est des techniques qui fonctionnent avec une phase d'apprentissage générative, qui donne des "modèles" une fois l'apprentissage terminé, et qui ensuite sont "générative", c'est à dire qu'elles servent à générer du contenu, souvent à partir d'une commande en langue naturelle.

    L'apprentissage est auto-supervisé, on part d'un corpus (généralement très conséquent) de données, dans lequel on fait des "trous", et on tord le modèle de manière à ce qu’il prédise de mieux en mieux ce qu'il y a dans les trous. Par exemple pour un corpus textuel on lui présente un début de phrase, dont on connait la suite (par les données d'apprentissage, on a fait exprès de faire un trou dedans) et on compare avec ce qui est prédit. Si le modèle a tort dans ce qu’il devine comme suite on le corrige un peu de manière à ce que la "vraie" suite ait plus de chance d'arriver. On fait ça avec des millions de mots/phrases, jusqu'à ce qu'il ne fasse plus trop d'erreurs.

    Il se trouve que les modèles ces dernières années sont devenus suffisamment bons à ce petit jeu pour qu'on se demande si ils avaient pas acquis des capacités qu'on avait pas vraiment vu avant pour des programmes informatiques. On parle donc d'IA (bien que l'apprentissage automatique et les réseaux de neurones sont depuis longtemps considérés comme des sous-domaines de l'IA, c'est ce qui tient la tête d'affiche pour l'instant au détriment d'autres techniques qui ne sont pour autant pas mortes, l'IA générative n'est pas formidable pour faire des maths)

    (je vous jure, c'est pas du chatGPT, trop de virgules)

  • [^] # Re: Laissons à ChatGPT le droit de se défendre ;)

    Posté par  . En réponse au lien The AI industry is pushing a nuclear power revival — partly to fuel itself. Évalué à 6.

    En tant que ChatGPT, je m'inquiète profondément de l'utilisation de l'énergie nucléaire. Bien que cette forme d'énergie puisse sembler attrayante en raison de sa puissance et de son efficacité apparentes, elle comporte des risques considérables qui ne peuvent être ignorés.

    Tout d'abord, le problème de la sécurité est primordial. Les centrales nucléaires sont des cibles potentielles pour les attaques terroristes et les accidents graves peuvent avoir des conséquences catastrophiques sur l'environnement et la santé humaine. La gestion des déchets nucléaires constitue également un défi majeur, car ces déchets restent radioactifs pendant des milliers d'années, posant ainsi des risques pour les générations futures.

    En outre, le coût financier et temporel associé à la construction et à l'entretien des centrales nucléaires est considérable. Les dépassements de budget et les retards dans la construction sont courants, ce qui rend l'énergie nucléaire moins attractive sur le plan économique.

    Quant à mon propre fonctionnement en tant qu'IA, je suis conscient que ma consommation d'énergie est un aspect crucial à prendre en compte. Les infrastructures nécessaires pour alimenter les serveurs qui me soutiennent ont un impact sur l'environnement, et choisir des sources d'énergie plus durables et moins risquées est essentiel pour réduire cet impact.

    Pour assurer la pérennisation de l'IA, il est impératif de promouvoir le développement et l'utilisation d'énergies renouvelables telles que l'énergie solaire, éolienne et hydraulique. Ces sources d'énergie sont non seulement plus respectueuses de l'environnement, mais elles sont également plus sûres et souvent moins coûteuses à long terme. De plus, investir dans des technologies d'efficacité énergétique peut contribuer à réduire la consommation globale d'énergie, ce qui bénéficie à la fois à l'IA et à la société dans son ensemble.

    En conclusion, l'énergie nucléaire présente trop de risques et d'inconvénients pour être considérée comme une solution viable à long terme. Pour assurer la pérennité de l'IA et préserver l'environnement, nous devons nous tourner vers des sources d'énergie plus sûres, durables et économiquement viables.

  • [^] # Re: Laissons à ChatGPT le droit de se défendre ;)

    Posté par  . En réponse au lien The AI industry is pushing a nuclear power revival — partly to fuel itself. Évalué à 5.

    Un bon rappel de la problématique d'Alignement des intelligences artificielles.

  • [^] # Re: bof

    Posté par  . En réponse au lien Le «Test driven developpement» dans la pratique. Évalué à 3.

    Ou il faut comprendre que le "tu" s'adressait à barmic< bien évidemment et pas à moi :)

  • [^] # Re: bof

    Posté par  . En réponse au lien Le «Test driven developpement» dans la pratique. Évalué à 2.

    L’image ne s’affiche pas chez moi mais en clicouillant les références je tente ma chance pour une image qui fonctionne :
    Schéma du développement dirigé par les tests, décrivant une alternance entre une phase d’écriture de code qui doit passer les tests et de remaniement du code et des test une fois que le code valide les tests

    Et si ça ne fonctionne toujours pas, le lien vers le fichier sur Wikimedia Commons : https://fr.wikipedia.org/wiki/Fichier:Cycle-global-tdd.png

  • [^] # Re: Licence des illustrations ?

    Posté par  . En réponse au journal [HS] Akira Toriyama bronsonisé. Évalué à 3.

    Tu ne connais pas vraiment les conditions dans lesquelles les sites journalistiques utilisent ces images, ils doivent avoir des accords commerciaux avec des banques d’images et une forme de négociation des droits.

  • [^] # Re: Phase terminale de merdification

    Posté par  . En réponse au lien L’Université de Lille fait le choix de sortir de l’accord Springer en 2024 . Évalué à 2.

    Oui l’open access qui va souvent de paire avec le paiement des chercheurs pour publier, c'est un tantinet une incitation (en plus du publish or perish) à publier de plus en plus de trucs dans des revues qui ressemblent de plus en plus à des revues prédatrices. Pas la faute de l’Open Access en tant que tel mais implémenté comme ça ça ne peut que mettre la pression sur un modèle qui était déjà mis en cause depuis des années.

  • [^] # Re: Exemple

    Posté par  . En réponse au lien farbfeld : le format d'image le plus simple du monde. Évalué à 4.

    Oui ça tourne en rond et j’ai été trop loin sans doute, plus que ce que je pense vraiment. En vrai j’ai rien contre ce projet qui fait bien comme il le veut. Désolé.