Je ne vois pas trop pourquoi cela tomberait dans la contrefaçon
C'est le code de la propriété intellectuelle qui le dit:
Toute édition d'écrits, de composition musicale, de dessin, de peinture ou de toute autre production, imprimée ou gravée en entier ou en partie, au mépris des lois et règlements relatifs à la propriété des auteurs, est une contrefaçon et toute contrefaçon est un délit.
La contrefaçon en France d'ouvrages publiés en France ou à l'étranger est punie de trois ans d'emprisonnement et de 300 000 euros d'amende.
Le code de la propriété intellectuelle est très clair : toute reproduction non autorisée est une contrefaçon.
Il faut ensuite regarder les exceptions ; il y en a 13, et aucune ne s'applique ici.
Après, il y a peut-être une tolérance; soit les sites en question sont hébergés à l'étranger et qu'il y a peu de recours pour leur faire respecter la loi française, soit ils ont conclu un accord avec les ayant-droit (partage des ressources publicitaires avec la SACEM, etc), soit il y a une forme de tolérance vis-à-vis de l'utilisation non-commerciale (connaissant la SACEM, j'en doute, mais bon). D
Ah, et j'avais oublié un argument super-important : si on imagine développer un LLM libre et utile, il faudra forcément le nourrir de contenu sous droit d'auteur sans rien reverser aux ayant-droits (à commencer par la littérature scientifique). Il est donc très important que la justice détermine clairement ce qui peut et ne peut pas être utilisé pour entrainer un modèle, et cette clarification permettra de déterminer s'il est possible pour l'humanité d'avoir des IA publiques et de qualité (une sorte de LLM Wikipédia par exemple) ou si les LLM sont pour toujours destinés à être privés/privatifs, fermés, et financés par des publicités plus ou moins visibles.
À titre d'analogie un peu foireuse, Wikipédia est libre mais construite sur une biliographie largement privée, et personne ne vérifie si les auteurs des articles ont payé les livres qu'ils citent. S'il était interdit de sourcer Wikipédia à partir de livres non-libres, alors Wikipédia n'existerait pas.
Tu peux imaginer que la jurisprudence puisse considérer que le fair-use ne s'applique qu'aux personnes humaines et pas aux algorithmes. Dans ce cas, les personnes sont protégées de la voracité de ceux qui "possèdent" la propriété intellectuelle; ils peuvent par contre exercer cette voracité contre les machines et contre ceux qui possèdent ces machines.
Mais sur le fond, je suis d'accord avec toi. Ceux qui prétendent lutter contre le capitalisme en assimilant l'entrainement des modèles avec la contrefaçon ne font que renforcer les tenants d'une propriété intellectuelle forte: une oeuvre appartient à ses ayant-droits et seulement à ses ayant-droits, qui possèderaient une sorte de pouvoir absolu sur toutes les réutilisations et modifications, mêmes fragmentaires, mêmes partielles, même indirectes. Je ne vois pas le rapport avec l'extrême droite, mais par contre ça ressemble beaucoup à la version falsifiée du libéralisme telle que défendue par la droite conservatrice : la loi ne servirait qu'à garantir la propriété, et la liberté ne s'applique qu'à ceux qui possèdent.
Dans tous les cas, je ne considèrerais pas du tout qu'une victoire des vautours de la propriété intellectuelle ne soit une bonne nouvelle. L'IA ne peut pas exister sans la culture populaire, et la culture populaire est de plus en plus séquestrée et privatisée par l'industrie de la culture.
J'aurais donc tendance à dire que oui, il connaît très bien les paroles originales.
En tout cas, il connait très bien le droit d'auteur puisqu'il sait que c'est la contrefaçon qui est illégale (reproduire les paroles ou la musique), pas le fait de les connaitre ou d'y avoir été confronté.
Ce qui est interdit c'est d'utiliser des données acquises illégalement pour entraîner une IA.
Bah ça semble beaucoup plus compliqué que ça.
Ce qui est clairement interdit, c'est la contrefaçon, c'est à dire de republier les oeuvres protégées sans l'autorisation des auteurs. Si tu demandes à un LLM "donne-moi les paroles de Comme d'Habitude" et qu'elle te les donnes, c'est de la contrefaçon, et c'est interdit. Pareil pour les musiques.
Le reste semble beaucoup moins clair. Accéder ponctuellement à des données protégées sans y avoir accès dépend de comment on y a accès. Si on pirate un serveur, on peut être accusé d'intrusion dans un système informatique, si on les récupère "sur Internet" sans les stocker sur son disque dur, ça ne tombe pas vraiment sous le coup de la loi (comme d'une manière générale la détention "de bonne foi" d'un produit contrefait). Par conséquent, il ne semble pas si évident que ça qu'un LLM qui aspirerait le web pour s'entrainer puisse être condamné s'il est "tombé" sur de la contrefaçon. C'est le contrefacteur qui est condamnable, pas ses clients.
Il faut aussi prendre en compte la notion anglo-saxonne de "fair use", qui va au-delà des exceptions qui existent en Europe (droit de citation, usage pédagogique, etc). Entrainer un LLM avec des contenus protégés sans demander l'autorisation des auteurs peut très bien être justifié par le "fair use", qui autorise l'usage qui ne nuit pas aux auteurs. C'est par exemple grâce au principe du "fair use" que les Wikipédia anglosaxonnes reproduisent des oeuvres protégées qui ne sont pas sous licence libre, chose que de nombreuses autres Wikipédias dans d'autres langues se refusent de faire. Et pour le coup, si tu ne peux pas prouver que les LLM produisent du contenu qui puisse concurrencer les auteurs (en gros, diminuer leurs revenus, puisque le droit US ne s'embarrasse pas réellement d'autres considérations que les $$), le fair-use semble largement plaidable.
C'est justement cet énorme flou que les tribunaux et les législateurs vont devoir éclaircir ces prochaines années. Si tout était clair, alors il n'y aurait pas de discussions.
à l'entré de 0,000001% des site porno, fussent-ils les plus visités du moment.
Il ne faut pas non plus surestimer la compétence informatique moyenne d'un adolescent; rien que taper une URL c'est une aventure pour beaucoup d'entre eux.
mais faut pas faire culpabiliser les parents parait-il
La société est quand même censée protéger tous les enfants, y compris ceux dont les parents sont défaillants.
Après, la sécurité, c'est multi-couche. Le contrôle parental est une couche de sécurité, qui n'est pas suffisante en tant que telle.
Demander, mais pas obliger, sinon on exclue les parents qui veulent éduquer leurs enfants (autrement que comme des animaux domestiques avec un collier à électrochoc).
Donner accès à du porno à tes enfants est passible de prison ferme, donc la loi porte quand même des limites à l'éducation que tu souhaites donner à tes enfants.
Sauf que c'est vrai statistiquement. Quand les armes sont en vente libre, elles circulent plus que quand leur commerce est interdit. Quand la drogue est interdite, elle circule moins que quand elle est autorisée. Quand on met des radars partout sur les routes, il y a moins d'excès de vitesse. La restriction de l'accès n'a jamais eu pour objectif de bloquer quoi que ce soit; on sait tous que les mineurs achètent des clopes ou de l'alcool en demandant à leur grand frère, et on a tous eu accès à des trucs porno quand on était ados et que c'était théoriquement impossible. Mais rendre le processus difficile d'accès limite les opportunités, et c'est ça qui compte. Un mineur va avoir moins accès aux clopes, à l'alcool, aux jeux d'argent, et au porno; il va bien sûr probablement réussir de temps en temps à y accéder, mais il ne va pas y avoir accès autant qu'il le souhaiterait. Donc l'objectif de santé public est atteint.
C'est d'ailleurs comme ça que fonctionnent toutes les couches de sécurité. Bannir certaines IP, faire des mises à jour régulières, mettre des bons mots de passe, etc., tout ça ne rend pas les attaques impossibles, mais ça les rend moins probables et ça limite leurs effets. C'est pareil dans la société, et c'est un objectif tout à fait louable. En tout cas, l'argument qui tourne autour de "ça resterait possible de le faire" me semble particulièrement douteux (dans le sens où il s'agit d'une pourriture argumentaire qui n'a pas pour objectif d'apporter un élément objectif au débat, mais de détourner la question sur un point annexe).
Enfin en tant que technicien, j'ai suivi une formation RSE, donc je me demande si c'est faisable de facon responsable du point de vue social et environnemental.
Alors c'est un mensonge d'avancer des arguments liés à la vie privée. On ne lit que ça sur cette page : "c'est attentatoire à ma vie privée, etc etc". Bah non, c'est faux, il existe tout un tas de protocoles qui peuvent attester de la majorité d'un utilisateur sans aucune atteinte à sa vie privée.
Il n'y a aucune raison que tu n'acceptes pas toute une galaxie de sites certificateurs, y compris des sites étrangers.
donne au gouvernement le moyen de savoir à quelle fréquence ses citoyens vont consulter des site pour adulte
Ou achètent de l'alcool sur Amazon, ou font des paris en ligne, ou font une demande de crédit à la consommation, ou louent une bagnole… Sans compter que tu peux très bien choisir un autre organisme certificateur, ta banque par exemple.
Sans oublier le risque de ddos
Le risque de panne en général, mais tu peux aussi imaginer que tu puisses avoir accès à plusieurs organismes certificateurs (banque, assurance…) qui peuvent attester de ton âge.
pourquoi cette vie privée serait filtrée par un site de l'administration fiscale
Je ne vois vraiment pas où tu veux en venir. Personne ne filtre quoi que ce soit, tu as un serveur qui te renvoie une preuve de majorité sur demande. Personne ne sait pourquoi tu demandes ça, d'où vient la demande, ni même si ce n'est pas un test ou un truc qui ne correspond à aucune réalité de la vie réelle.
Il y a de multiples applications à la preuve de majorité : louer une voiture, signer une demande de crédit, acheter de l'alcool, accéder à des jeux d'argent… La loi dit que seuls les majeurs peuvent accéder à ces services, et la preuve de majorité permettrait aux sites de se conformer à la loi sans aucune intrusion dans ta vie privée, ni de la part de ces sites, ni de la part du site qui certifie ton âge. Franchement, je ne comprends même pas où tu vois un problème.
L'affaire devient guignolesque…
J'ai l'impression encore une fois que deux choses totalement indépendantes sont mélangées : les aspects techniques et les aspects sociétaux ou politiques. Tu peux trouver que la restriction d'âge pour acheter des clopes, de l'alcool, ou mater des vidéos pornographiques est liberticide ou je ne sais pas quoi, mais ces restrictions existent depuis longtemps dans la loi, elles sont appliquées dans le "monde réel", et il n'y a aucune raison pour imaginer une seule seconde qu'elles n'ont pas vocation à être appliquées quand on commande des clopes, de l'alcool, ou un film porno sur Internet. Que ce contrôle se fasse d'une manière qui ne viole pas la vie privée est une demande complètement légitime; en tant qu'adulte tu as le droit de jouer à des jeux d'argent, et tu as le droit que personne, pas même l'administration, ne soit au courant. Et la preuve de majorité par un serveur de confiance te fournit exactement ça : la possibilité de prouver ta majorité sans qu'aucune information ne circule entre le site certificateur et le site commercial, ce qui, a priori, garantit autant que possible le respect de ta vie privée, en tout cas bien mieux que de devoir montrer une pièce d'identité quand tu achètes des clopes.
Comment peut-on associer la preuve de majorité d'une personne à une connexion internet, ou à un terminal connecté à internet?
Je ne comprends pas trop le problème; c'est évident qu'une fois identifié sur le site, si tu passes ton téléphone à un gamin il pourra y accéder, mais c'est évident que ça n'est pas à ce genre de situations que le contrôle de la majorité est destinée.
J'imagine que le plus simple c'est un protocole de validation de token anonyme au moment de la connexion, pas forcément liée au login. Au moment où tu cliques sur "je suis majeur" le site te renvoie un ID unique à faire chiffrer par un site de confiance (par exemple France Connect). Le machin reste valide le temps de la session, et tu peux renouveler la validation indépendamment du login sur le site.
Les cookies tout comme les adresses IP sont relativement facile à partager entre plusieurs personnes.
Sans la complicité de l'adulte qui s'est identifié c'est quand même chaud. La vente de clopes est interdite aux mineurs et les mineurs peuvent fumer s'ils trouvent un majeur qui va leur en acheter, la responsabilité du buraliste n'est plus engagée et c'est ça qui compte.
inefficacité de la solution technique, dépendance à une entreprise étrangère
Comprends pas. Si tu n'as pas confiance dans le js de redirection du site, tu peux même imaginer un truc qui marcherait en copier-coller, style signature électronique (on chiffre avec la clé privée, on déchiffre avec la clé publique): le site de boules te files un token unique que tu copies-colles dans FranceConnect, qui le chiffre, te renvoie le résultat que tu redonnes au site de boules, qui peut confirmer que tu l'as fait chiffrer par FranceConnect et que tu es donc majeur. Je suis certain qu'il existe des protocoles beaucoup plus adaptés, d'ailleurs. Mais en tout cas tu ne dépends de rien du tout et tu ne fais fuiter aucune information autre que le nom du tiers de confiance (et le tiers sait que tu as authentifié une connexion, mais il ne sait pas laquelle).
La situation actuelle (envoyer des copies de ses ID à des tiers mal identifiés) est merdissimale, mais en théorie des solutions alternatives sont tout à fait sûres et acceptables, et c'est d'ailleurs inadmissible qu'elles ne soient pas déja en place.
Imposer la vérification d'âge sur internet, c'est l'équivalent dans le monde physique de demander un brevet de natation à toute personne désirant se rendre près d'une piscine, sur une plage ou au bord d'une rivière.
Je trouve que dans le libre on a souvent tendance à confondre la technique et la politique. Indépendamment de la question de si c'est souhaitable, on doit répondre à la question de si c'est possible. Et effectivement, c'est possible. Il faut avoir des organismes certificateurs qui ont une preuve de ta majorité (par exemple, l'État, ta banque, etc), et un algorithme qui permet de transmettre la preuve de majorité au site cible sans que le site cible n'ait aucune autre information sur toi, et que l'organisme certificateur n'ait aucune information sur le site cible. Et ça, c'est tout à fait possible. Donc, pourvu que les protocoles en place soient bien conçus, la preuve de majorité n'est absolument pas contradictoire avec le respect de la vie privée ou des libertés fondamentales (sauf à la liberté d'accéder à un service pour lequel on n'a pas l'âge requis).
Ensuite, pour l'histoire du brevet de natation, je ne suis pas sûr de savoir où tu veux en venir exactement. La loi encadre l'accès aux contenus pornographiques, et permettre ou faciliter l'accès à la pornographie à un mineur expose à une peine de prison. Ce risque se transmet partout; le propriétaire de l'ordinateur, de la connexion Internet, le FAI, le fournisseur du VPN ou du noeud de sortie Tor… en théorie, toutes ces activités te font porter un risque. C'est donc naturel que les acteurs du système souhaitent se protéger, surtout ceux qui n'ont aucun intérêt économique à ne pas le faire. Or, à ma connaissance, permettre à quelqu'un qui ne sait pas nager d'approcher une rivière n'expose pas à une peine de prison, donc on ne peut pas tellement comparer. Peut-être que "conduire une voiture sans permis" est plus proche : en effet, on demande une copie du permis avant de prêter une voiture, avant de faire un essai dans une concession, etc.
le modifier […] aux seules fins d'exploitation, de promotion et d'amélioration du Service.
Donc ce que je comprends, c'est que tu peux changer la résolution, tu peux extraire une vignette statique pour donner envie de cliquer, tu peux appliquer des filtres pour diminuer les effets de la compression, ce genre de choses. Mais comme la clause est pas mal délimitée, je ne vois pas en quoi elle serait automatiquement abusive.
En même temps, j'ai du mal à trouver quelque chose d'abusif dans la liste de droits accordés étant donné la finalité du service. Peut-être sur la cession de la licence, avec un risque de perte de contrôle sur la diffusion?
Je veux dire, c'est bien d'éplucher les CGU, mais si tu mets une vidéo sur Youtube, c'est normal que tu leur cèdes le droit de la diffuser…
Il y a la "hype" de l'AI, et il y a aussi la "hype" de l'anti-AI. Pour l'instant, si on s'en tient aux éléments qu'on trouve dans ces articles, il ne s'agit que de traitements automatiques portant sur la qualité des vidéos, ce qui est essentiellement la même chose que fait Youtube depuis 20 ans, avec des algorithmes de compression/décompression avec pertes, diffusion sous plusieurs résolutions, compression du son, etc. Les rendus non-naturels peuvent être obtenus par l'application de filtres trop agressifs sur la netteté, le flou, la correction du moiré, ou n'importe quel traitement d'image, qu'il implique un algo de machine learning ou non. Par contre, on est bien d'accord que si ça se voit, c'est qu'il y a un problème. En principe ça ne devrait être que des filtres techniques.
Les arguments à base de "l'AI modifie le monde selon ses critères" me semblent assez moisis. Parce que si on va par là, JPEG modifie aussi le monde selon ses critères, l'algorithme choisit quels genre de détails doivent être conservés et quels détails peuvent être effacés. C'est d'ailleurs assez étonnant à quel point on peut devenir tolérants aux artefacts de compression JPEG ou MP3, par exemple. On est peut-être très sensibles aux artefacts de correction d'image par des algos de ML, parce qu'on n'a pas l'habitude d'en voir.
Je ne comprends toujours pas l'intérêt des "objets connectés".
L'intérêt pour qui? Pour toi, pour Mr/Mme tout le monde, pour les fabricants, ou pour ceux qui collectent les données?
Un certain nombre de ces trucs sont des gadgets, leur possession relève d'une balance entre le prix, l'intérêt personnel qu'on porte au gadget en question, et l'importance qu'on porte aux données partagées. Tout le monde n'est pas totalement hermétique à l'intérêt des gadgets; même quand on est au courant des problématiques de partage de données, l'être humain aime à transgresser les interdits pour un peu d'amusement. Typiquement, le traceur GPS au collier du chat (et je n'ai même pas demandé au chat pour la violation caractérisée de sa vie privée).
Il y a aussi plein de trucs assez utiles qui n'ont de sens que s'ils sont accessibles de l'extérieur, ce qui veut probablement dire pour la plupart des gens une application propriétaire sur un smartphone + un intermédiaire dans le cloud du fournisseur. Ça va du pilotage du chauffage, des prises de courant, aux systèmes de capteurs et caméras. La sonnette connectée avec possibilité d'interagir à partir du smartphone, ça résoud un certain nombre de problèmes de la vie quotidienne par exemple. C'est toujours difficile de dire que c'est indispensable, puisqu'évidemment l'être humain a su se dispenser de tout avant que ça soit disponible, mais voila, ces outils comblent des besoins.
Qu'est-ce qui t'ennuis dans ce texte (tronqué, la suite et bien plus inintéressante)
Comme je n'ai dit, je ne suis pas sûr de le comprendre. Si l'idée est de dire que certains scientifiques sont meilleurs que d'autres, c'est difficile de le nier. Mais Einstein semble impliquer quelque chose de bien plus tortueux à mon sens, c'est l'idée que les scientifiques géniaux n'appartiennent qu'à une catégorie (que j'ai du mal à cerner parce qu'il semble que ça concerne le rapport que les gens ont avec la démarche scientifique). Disons que je ne comprends pas sa sociologie de la science, peut-être d'ailleurs parce que ça correspond à une époque lointaine et que le fonctionnement de la science a beaucoup changé depuis.
Elle est celle de ceux qui, comme pierre essentielle, font la Science.
Avec des majuscules, on a toujours l'impression que ça rend les trucs vachement profonds. Disons que la "starification" de la science est quelque chose qui plait énormément au public, ainsi qu'aux politiques (qui peuvent en profiter pour utiliser des critères bureaucratiques d'"excellence" pour piloter les financements). Mais en tout cas à l'heure actuelle, on se rend bien compte que les mécanismes de starification sont assez déconnectés de la contribution scientifique des individus en question (on peut penser à un un prof de médecine Marseillais par exemple). L'histoire des sciences est truffée d'exemples où la postérité à attribué à une personne plus médiatique le résultat d'un travail collectif, ou a "choisi" au hasard parmi un ensemble de travaux équivalents publiés au même moment.
En plus, je ne suis même pas sûr que ça soit vrai. Par exemple, est-ce que Mendel fait partir de "Ceux qui font la Science"? Ses travaux étaient en avance sur son temps, mais il n'a été lu ni par ses contemporains qui auraient pu en profiter (notamment Darwin et Wallace), ni par ses successeurs qui ont redécouvert indépendamment les lois de la génétique. Du coup, on attribue à Mendel une découverte qu'il a été en effet le premier à faire, mais qui n'a eu aucune influence sur la progression des connaissances. Non, franchement, je ne comprends pas cette idée de lier des traits de personnalité avec un potentiel de construction de l'édifice scientifique, elle avait peut-être un sens il y a 120 ans, mais en tout cas ce sens a dû se perdre parce que je ne vois rien dans la réalité de la science moderne qui puisse l'étayer.
ceux qui sont remplaçables par un automate n'aurait jamais pu édifier et ne contribuerons que marginalement à l'édification du temple de la Science
La vision d'Einstein est quand même celle d'un élitisme scientifique assez vertigineux, et je en suis même pas certain de bien comprendre ce qu'il entend avec ses deux catégories. Il y a un rôle pour beaucoup dans la science, pour le tâcheron qui collecte des données, pour celui qui fait beaucoup de bruit avec de nombreuses idées toutes aussi fausses les unes que les autres, mais qui obligent la communauté à réfléchir aux raisons pour lesquelles ces idées sont fausses, pour celui ou celle qui consacre sa vie à un problème obscur qui n'intéresse personne pour le moment, ceux qui parlent aux politiques, aux journalistes, au grand public; ceux qui s'investissent dans l'enseignement et l'encadrement des étudiants, ceux qui assurent le fonctionnement des institutions, ceux qui ramènent beaucoup d'argent, ceux qui conçoivent des expériences qui coûtent très cher, ceux qui conçoivent des expériences qui ne coûtent pas cher…
Après, c'est sûr que l'histoire des sciences ne se rappelle que de Newton ou d'Einstein, mais Einstein a par exemple énormément bénéficié de l'aide de mathématiciens et calculateurs dont la plupart seraient aujourd'hui remplacés par des automates.
Après, le risque que je vois se profiler à assez courte échéance, c'est que dans beaucoup de domaines le travail scientifique consiste à exécuter des plans d'expérience conçus par des systèmes automatiques. Ça n'est pas très gratifiant.
Cela dépend de ce qu'on met derrière ces termes mais en terme de créativité il y a malgré tout des limites.
Évidemment, mais il y a des années lumières entre "niveau créatif c'est le néant" et "construire des nouveaux paradigmes dans les domaines scientifiques". En fait, là, on parle de *superintelligence artificielle", et à ma connaissance aucun des modèles existants prétend à la superintelligence.
Dans tous les cas, tu fais bien d'insister sur le fait qu'il ne faut pas confondre les versions des modèles utilisées pour les tests et les benchmarks, qui sont des versions de développement avec souvent beaucoup de ressources disponibles, et les versions gratuites grand public. Même si l'écart se compte parfois en mois ou en quelques années, donc ça n'est quand même pas comparer une navette spatiale et une twingo.
Par ailleurs le boulot d'un mathématicien est de repousser l'état de l'art des maths quitte à créer de nouveaux concepts et pour l'instant on n'en est pas là.
Démontrer des théorèmes sans créer de nouvelles formes de maths c'est aussi le boulot des mathématiciens, et on en est là.
Évidemment, on peut discuter longtemps de la hauteur de la marche pour passer de "niveau moyen d'un expert sur le sujet" à "meilleur que le meilleur expert". Pour certains c'est juste une question quantitative (plus de neurones, plus de données…), pour d'autres, c'est qualitatif est potentiellement bloquant. La réalité est qu'on n'en sait rien. Je ne vois rien en tout cas qui rendrait impossible l'atteinte d'une singularité technologique dans les années qui viennent.
Or, c'est faux. L'IA ne fait que régurgiter ce qu'on lui a donné à manger, en version étiolée/modifiée. Mais en raisonnement créatif pur, c'est le néant.
Ça n'est pas évident à suivre parce que ça évolue à une vitesse vertigineuse, mais le fonctionnement d'une IA récente n'a plus grand chose à voir avec les chatbots d'il y a 3 ans. C'est toujours un peu basé sur le même principe, mais il y a des surcouches très complexes qui font que non, les IA ne sont pas du tout des machines à recracher. Il y a eu ces derniers mois des progrès qualitatifs sur les benchmarks sophistiqués (construits sur des problèmes originaux qui ne sont pas dans les données d'entrainement), et il semble que les experts trouvent de plus en plus dur de trouver des tâches où l'humain est supérieur. Donc oui, la recherche en IA progresse, non, les IA ne sont plus des machines à régurgiter.
Sur le côté créatif, même les premières versions de chatGPT ont montré leur capacité à créer : de la musique, du texte, des images, des objets 3D, etc. Je trouve que la question ne se pose même pas, ces logiciels peuvent créer des "oeuvres" de manière bien plus efficace qu'un humain moyen (bien sûr, ça n'est pas du Zola, mais encore une fois le critère d'une IA n'est pas de surpasser le meilleur humain dans tous les domaines!).
Je suis surpris qu'une IA n'ait pas encore résolu un problème de maths
Cette année, l'IA de Google a résolu 5 problèmes sur 6 des "International Math Olympiades", ce qui la classe dans les 30 premiers (c'est une compétition hyper-balaise). Les IA spécialisées ont le niveau des tous meilleurs mathématiciens du monde.
perroquets stochastiques
Le déni ne te mènera nulle part.
Il faut juste décorréler le buzz et les annonces autour de l'économie, des $$$, des problèmes écologiques liés à l'IA, et les performances réelles. On peut trouver que l'IA est trop chère, qu'elle n'a pas de business model, qu'on lui confie des tâches qu'elle n'est pas capable d'assumer, que les problèmes légaux écologiques et sociétaux posés sont énormes, etc. Tout le monde est d'accord avec ça. Mais tout ça ne justifie absolument pas de dénigrer les performances de ces modèles, et la vitesse à laquelle leurs performances évoluent. On peut se plaindre de la manière dont les gens les utilisent, mais pas de leur capacité à repousser quasiment tous les jours les limites de la complexité des tâches qu'on pensait pour très longtemps hors de portée d'un ordinateur. Utiliser des sobriquets comme "perroquet stochastique", c'est juste admettre qu'en fait tu ne sais absolument pas de quoi ces logiciels sont capables, ce qui fait que le choc sera encore plus grand quand tu les verras s'immiscer dans ta vie.
Ça n'est pas comme ça que ça marche; les salariés ne sont pas payés par rapport à leur contribution marginale au chiffre d'affaire (heureusement pour les comptables et les femmes de ménage …), mais par rapport à l'offre et la demande du marché du travail. D'ailleurs, les salariés ne sont pas non plus rémunérés par rapport à leur production, mais par rapport à la quantité d'heures travaillées.
Pour la répartition des gains de productivité, j'imagine que ça dépend énormément du secteur d'activité. Dans les secteurs très concurrentiels, les gains de productivité vont passer essentiellement dans la baisse des prix par exemple.
Ah non, pardon, "Les patrons c'est tous que des pourris, leur tête au bout d'une pique toussa toussa", c'était plutôt ça l'idée, non?
[^] # Re: Droits
Posté par arnaudus . En réponse au journal Anthropic accepte de payer $1.5 milliard pour atteinte au droit d'auteur. Évalué à 5 (+2/-0).
C'est le code de la propriété intellectuelle qui le dit:
Toute édition d'écrits, de composition musicale, de dessin, de peinture ou de toute autre production, imprimée ou gravée en entier ou en partie, au mépris des lois et règlements relatifs à la propriété des auteurs, est une contrefaçon et toute contrefaçon est un délit.
La contrefaçon en France d'ouvrages publiés en France ou à l'étranger est punie de trois ans d'emprisonnement et de 300 000 euros d'amende.
Le code de la propriété intellectuelle est très clair : toute reproduction non autorisée est une contrefaçon.
Il faut ensuite regarder les exceptions ; il y en a 13, et aucune ne s'applique ici.
Après, il y a peut-être une tolérance; soit les sites en question sont hébergés à l'étranger et qu'il y a peu de recours pour leur faire respecter la loi française, soit ils ont conclu un accord avec les ayant-droit (partage des ressources publicitaires avec la SACEM, etc), soit il y a une forme de tolérance vis-à-vis de l'utilisation non-commerciale (connaissant la SACEM, j'en doute, mais bon). D
[^] # Re: quel connerie
Posté par arnaudus . En réponse au journal Anthropic accepte de payer $1.5 milliard pour atteinte au droit d'auteur. Évalué à 6 (+4/-1).
Ah, et j'avais oublié un argument super-important : si on imagine développer un LLM libre et utile, il faudra forcément le nourrir de contenu sous droit d'auteur sans rien reverser aux ayant-droits (à commencer par la littérature scientifique). Il est donc très important que la justice détermine clairement ce qui peut et ne peut pas être utilisé pour entrainer un modèle, et cette clarification permettra de déterminer s'il est possible pour l'humanité d'avoir des IA publiques et de qualité (une sorte de LLM Wikipédia par exemple) ou si les LLM sont pour toujours destinés à être privés/privatifs, fermés, et financés par des publicités plus ou moins visibles.
À titre d'analogie un peu foireuse, Wikipédia est libre mais construite sur une biliographie largement privée, et personne ne vérifie si les auteurs des articles ont payé les livres qu'ils citent. S'il était interdit de sourcer Wikipédia à partir de livres non-libres, alors Wikipédia n'existerait pas.
[^] # Re: quel connerie
Posté par arnaudus . En réponse au journal Anthropic accepte de payer $1.5 milliard pour atteinte au droit d'auteur. Évalué à 7 (+4/-0).
Tu peux imaginer que la jurisprudence puisse considérer que le fair-use ne s'applique qu'aux personnes humaines et pas aux algorithmes. Dans ce cas, les personnes sont protégées de la voracité de ceux qui "possèdent" la propriété intellectuelle; ils peuvent par contre exercer cette voracité contre les machines et contre ceux qui possèdent ces machines.
Mais sur le fond, je suis d'accord avec toi. Ceux qui prétendent lutter contre le capitalisme en assimilant l'entrainement des modèles avec la contrefaçon ne font que renforcer les tenants d'une propriété intellectuelle forte: une oeuvre appartient à ses ayant-droits et seulement à ses ayant-droits, qui possèderaient une sorte de pouvoir absolu sur toutes les réutilisations et modifications, mêmes fragmentaires, mêmes partielles, même indirectes. Je ne vois pas le rapport avec l'extrême droite, mais par contre ça ressemble beaucoup à la version falsifiée du libéralisme telle que défendue par la droite conservatrice : la loi ne servirait qu'à garantir la propriété, et la liberté ne s'applique qu'à ceux qui possèdent.
Dans tous les cas, je ne considèrerais pas du tout qu'une victoire des vautours de la propriété intellectuelle ne soit une bonne nouvelle. L'IA ne peut pas exister sans la culture populaire, et la culture populaire est de plus en plus séquestrée et privatisée par l'industrie de la culture.
[^] # Re: Claude connait la chanson
Posté par arnaudus . En réponse au journal Anthropic accepte de payer $1.5 milliard pour atteinte au droit d'auteur. Évalué à 5 (+2/-0).
En tout cas, il connait très bien le droit d'auteur puisqu'il sait que c'est la contrefaçon qui est illégale (reproduire les paroles ou la musique), pas le fait de les connaitre ou d'y avoir été confronté.
[^] # Re: Droits
Posté par arnaudus . En réponse au journal Anthropic accepte de payer $1.5 milliard pour atteinte au droit d'auteur. Évalué à 5 (+2/-0).
Bah ça semble beaucoup plus compliqué que ça.
Ce qui est clairement interdit, c'est la contrefaçon, c'est à dire de republier les oeuvres protégées sans l'autorisation des auteurs. Si tu demandes à un LLM "donne-moi les paroles de Comme d'Habitude" et qu'elle te les donnes, c'est de la contrefaçon, et c'est interdit. Pareil pour les musiques.
Le reste semble beaucoup moins clair. Accéder ponctuellement à des données protégées sans y avoir accès dépend de comment on y a accès. Si on pirate un serveur, on peut être accusé d'intrusion dans un système informatique, si on les récupère "sur Internet" sans les stocker sur son disque dur, ça ne tombe pas vraiment sous le coup de la loi (comme d'une manière générale la détention "de bonne foi" d'un produit contrefait). Par conséquent, il ne semble pas si évident que ça qu'un LLM qui aspirerait le web pour s'entrainer puisse être condamné s'il est "tombé" sur de la contrefaçon. C'est le contrefacteur qui est condamnable, pas ses clients.
Il faut aussi prendre en compte la notion anglo-saxonne de "fair use", qui va au-delà des exceptions qui existent en Europe (droit de citation, usage pédagogique, etc). Entrainer un LLM avec des contenus protégés sans demander l'autorisation des auteurs peut très bien être justifié par le "fair use", qui autorise l'usage qui ne nuit pas aux auteurs. C'est par exemple grâce au principe du "fair use" que les Wikipédia anglosaxonnes reproduisent des oeuvres protégées qui ne sont pas sous licence libre, chose que de nombreuses autres Wikipédias dans d'autres langues se refusent de faire. Et pour le coup, si tu ne peux pas prouver que les LLM produisent du contenu qui puisse concurrencer les auteurs (en gros, diminuer leurs revenus, puisque le droit US ne s'embarrasse pas réellement d'autres considérations que les $$), le fair-use semble largement plaidable.
C'est justement cet énorme flou que les tribunaux et les législateurs vont devoir éclaircir ces prochaines années. Si tout était clair, alors il n'y aurait pas de discussions.
[^] # Re: La tour de Babel a encore frappé
Posté par arnaudus . En réponse à la dépêche La Commission européenne publie une feuille de route sur le logiciel libre. Évalué à 4 (+1/-0). Dernière modification le 05 septembre 2025 à 13:50.
[^] # Re: La tour de Babel a encore frappé
Posté par arnaudus . En réponse à la dépêche La Commission européenne publie une feuille de route sur le logiciel libre. Évalué à 3 (+1/-1).
Au moins, il n'y a pas de déclinaisons en Anglais…
[^] # Re: Résumé de la situation
Posté par arnaudus . En réponse au lien Mastodon says it doesn’t ‘have the means’ to comply with age verification laws. Évalué à 3 (+0/-0).
Il ne faut pas non plus surestimer la compétence informatique moyenne d'un adolescent; rien que taper une URL c'est une aventure pour beaucoup d'entre eux.
La société est quand même censée protéger tous les enfants, y compris ceux dont les parents sont défaillants.
Après, la sécurité, c'est multi-couche. Le contrôle parental est une couche de sécurité, qui n'est pas suffisante en tant que telle.
[^] # Re: Résumé de la situation
Posté par arnaudus . En réponse au lien Mastodon says it doesn’t ‘have the means’ to comply with age verification laws. Évalué à 3 (+0/-0).
Donner accès à du porno à tes enfants est passible de prison ferme, donc la loi porte quand même des limites à l'éducation que tu souhaites donner à tes enfants.
[^] # Re: Résumé de la situation
Posté par arnaudus . En réponse au lien Mastodon says it doesn’t ‘have the means’ to comply with age verification laws. Évalué à 6 (+3/-0).
Sauf que c'est vrai statistiquement. Quand les armes sont en vente libre, elles circulent plus que quand leur commerce est interdit. Quand la drogue est interdite, elle circule moins que quand elle est autorisée. Quand on met des radars partout sur les routes, il y a moins d'excès de vitesse. La restriction de l'accès n'a jamais eu pour objectif de bloquer quoi que ce soit; on sait tous que les mineurs achètent des clopes ou de l'alcool en demandant à leur grand frère, et on a tous eu accès à des trucs porno quand on était ados et que c'était théoriquement impossible. Mais rendre le processus difficile d'accès limite les opportunités, et c'est ça qui compte. Un mineur va avoir moins accès aux clopes, à l'alcool, aux jeux d'argent, et au porno; il va bien sûr probablement réussir de temps en temps à y accéder, mais il ne va pas y avoir accès autant qu'il le souhaiterait. Donc l'objectif de santé public est atteint.
C'est d'ailleurs comme ça que fonctionnent toutes les couches de sécurité. Bannir certaines IP, faire des mises à jour régulières, mettre des bons mots de passe, etc., tout ça ne rend pas les attaques impossibles, mais ça les rend moins probables et ça limite leurs effets. C'est pareil dans la société, et c'est un objectif tout à fait louable. En tout cas, l'argument qui tourne autour de "ça resterait possible de le faire" me semble particulièrement douteux (dans le sens où il s'agit d'une pourriture argumentaire qui n'a pas pour objectif d'apporter un élément objectif au débat, mais de détourner la question sur un point annexe).
[^] # Re: Adult swim
Posté par arnaudus . En réponse au lien Mastodon says it doesn’t ‘have the means’ to comply with age verification laws. Évalué à 2 (+0/-1).
Alors c'est un mensonge d'avancer des arguments liés à la vie privée. On ne lit que ça sur cette page : "c'est attentatoire à ma vie privée, etc etc". Bah non, c'est faux, il existe tout un tas de protocoles qui peuvent attester de la majorité d'un utilisateur sans aucune atteinte à sa vie privée.
[^] # Re: Adult swim
Posté par arnaudus . En réponse au lien Mastodon says it doesn’t ‘have the means’ to comply with age verification laws. Évalué à 3 (+0/-0). Dernière modification le 02 septembre 2025 à 14:30.
Il n'y a aucune raison que tu n'acceptes pas toute une galaxie de sites certificateurs, y compris des sites étrangers.
Ou achètent de l'alcool sur Amazon, ou font des paris en ligne, ou font une demande de crédit à la consommation, ou louent une bagnole… Sans compter que tu peux très bien choisir un autre organisme certificateur, ta banque par exemple.
Le risque de panne en général, mais tu peux aussi imaginer que tu puisses avoir accès à plusieurs organismes certificateurs (banque, assurance…) qui peuvent attester de ton âge.
[^] # Re: Adult swim
Posté par arnaudus . En réponse au lien Mastodon says it doesn’t ‘have the means’ to comply with age verification laws. Évalué à 2 (+0/-1).
Je ne vois vraiment pas où tu veux en venir. Personne ne filtre quoi que ce soit, tu as un serveur qui te renvoie une preuve de majorité sur demande. Personne ne sait pourquoi tu demandes ça, d'où vient la demande, ni même si ce n'est pas un test ou un truc qui ne correspond à aucune réalité de la vie réelle.
Il y a de multiples applications à la preuve de majorité : louer une voiture, signer une demande de crédit, acheter de l'alcool, accéder à des jeux d'argent… La loi dit que seuls les majeurs peuvent accéder à ces services, et la preuve de majorité permettrait aux sites de se conformer à la loi sans aucune intrusion dans ta vie privée, ni de la part de ces sites, ni de la part du site qui certifie ton âge. Franchement, je ne comprends même pas où tu vois un problème.
J'ai l'impression encore une fois que deux choses totalement indépendantes sont mélangées : les aspects techniques et les aspects sociétaux ou politiques. Tu peux trouver que la restriction d'âge pour acheter des clopes, de l'alcool, ou mater des vidéos pornographiques est liberticide ou je ne sais pas quoi, mais ces restrictions existent depuis longtemps dans la loi, elles sont appliquées dans le "monde réel", et il n'y a aucune raison pour imaginer une seule seconde qu'elles n'ont pas vocation à être appliquées quand on commande des clopes, de l'alcool, ou un film porno sur Internet. Que ce contrôle se fasse d'une manière qui ne viole pas la vie privée est une demande complètement légitime; en tant qu'adulte tu as le droit de jouer à des jeux d'argent, et tu as le droit que personne, pas même l'administration, ne soit au courant. Et la preuve de majorité par un serveur de confiance te fournit exactement ça : la possibilité de prouver ta majorité sans qu'aucune information ne circule entre le site certificateur et le site commercial, ce qui, a priori, garantit autant que possible le respect de ta vie privée, en tout cas bien mieux que de devoir montrer une pièce d'identité quand tu achètes des clopes.
[^] # Re: Adult swim
Posté par arnaudus . En réponse au lien Mastodon says it doesn’t ‘have the means’ to comply with age verification laws. Évalué à 4 (+1/-0). Dernière modification le 01 septembre 2025 à 17:45.
Je ne comprends pas trop le problème; c'est évident qu'une fois identifié sur le site, si tu passes ton téléphone à un gamin il pourra y accéder, mais c'est évident que ça n'est pas à ce genre de situations que le contrôle de la majorité est destinée.
J'imagine que le plus simple c'est un protocole de validation de token anonyme au moment de la connexion, pas forcément liée au login. Au moment où tu cliques sur "je suis majeur" le site te renvoie un ID unique à faire chiffrer par un site de confiance (par exemple France Connect). Le machin reste valide le temps de la session, et tu peux renouveler la validation indépendamment du login sur le site.
Sans la complicité de l'adulte qui s'est identifié c'est quand même chaud. La vente de clopes est interdite aux mineurs et les mineurs peuvent fumer s'ils trouvent un majeur qui va leur en acheter, la responsabilité du buraliste n'est plus engagée et c'est ça qui compte.
Comprends pas. Si tu n'as pas confiance dans le js de redirection du site, tu peux même imaginer un truc qui marcherait en copier-coller, style signature électronique (on chiffre avec la clé privée, on déchiffre avec la clé publique): le site de boules te files un token unique que tu copies-colles dans FranceConnect, qui le chiffre, te renvoie le résultat que tu redonnes au site de boules, qui peut confirmer que tu l'as fait chiffrer par FranceConnect et que tu es donc majeur. Je suis certain qu'il existe des protocoles beaucoup plus adaptés, d'ailleurs. Mais en tout cas tu ne dépends de rien du tout et tu ne fais fuiter aucune information autre que le nom du tiers de confiance (et le tiers sait que tu as authentifié une connexion, mais il ne sait pas laquelle).
La situation actuelle (envoyer des copies de ses ID à des tiers mal identifiés) est merdissimale, mais en théorie des solutions alternatives sont tout à fait sûres et acceptables, et c'est d'ailleurs inadmissible qu'elles ne soient pas déja en place.
[^] # Re: Adult swim
Posté par arnaudus . En réponse au lien Mastodon says it doesn’t ‘have the means’ to comply with age verification laws. Évalué à 4 (+1/-0).
Je trouve que dans le libre on a souvent tendance à confondre la technique et la politique. Indépendamment de la question de si c'est souhaitable, on doit répondre à la question de si c'est possible. Et effectivement, c'est possible. Il faut avoir des organismes certificateurs qui ont une preuve de ta majorité (par exemple, l'État, ta banque, etc), et un algorithme qui permet de transmettre la preuve de majorité au site cible sans que le site cible n'ait aucune autre information sur toi, et que l'organisme certificateur n'ait aucune information sur le site cible. Et ça, c'est tout à fait possible. Donc, pourvu que les protocoles en place soient bien conçus, la preuve de majorité n'est absolument pas contradictoire avec le respect de la vie privée ou des libertés fondamentales (sauf à la liberté d'accéder à un service pour lequel on n'a pas l'âge requis).
Ensuite, pour l'histoire du brevet de natation, je ne suis pas sûr de savoir où tu veux en venir exactement. La loi encadre l'accès aux contenus pornographiques, et permettre ou faciliter l'accès à la pornographie à un mineur expose à une peine de prison. Ce risque se transmet partout; le propriétaire de l'ordinateur, de la connexion Internet, le FAI, le fournisseur du VPN ou du noeud de sortie Tor… en théorie, toutes ces activités te font porter un risque. C'est donc naturel que les acteurs du système souhaitent se protéger, surtout ceux qui n'ont aucun intérêt économique à ne pas le faire. Or, à ma connaissance, permettre à quelqu'un qui ne sait pas nager d'approcher une rivière n'expose pas à une peine de prison, donc on ne peut pas tellement comparer. Peut-être que "conduire une voiture sans permis" est plus proche : en effet, on demande une copie du permis avant de prêter une voiture, avant de faire un essai dans une concession, etc.
[^] # Re: Sans consentement vraiment ?
Posté par arnaudus . En réponse au lien YouTube édite automatiquement et sans consentement des vidéos avec de l'IA. Évalué à 3 (+0/-0).
le modifier […] aux seules fins d'exploitation, de promotion et d'amélioration du Service.
Donc ce que je comprends, c'est que tu peux changer la résolution, tu peux extraire une vignette statique pour donner envie de cliquer, tu peux appliquer des filtres pour diminuer les effets de la compression, ce genre de choses. Mais comme la clause est pas mal délimitée, je ne vois pas en quoi elle serait automatiquement abusive.
[^] # Re: Sans consentement vraiment ?
Posté par arnaudus . En réponse au lien YouTube édite automatiquement et sans consentement des vidéos avec de l'IA. Évalué à 1 (+1/-3). Dernière modification le 26 août 2025 à 10:23.
En même temps, j'ai du mal à trouver quelque chose d'abusif dans la liste de droits accordés étant donné la finalité du service. Peut-être sur la cession de la licence, avec un risque de perte de contrôle sur la diffusion?
Je veux dire, c'est bien d'éplucher les CGU, mais si tu mets une vidéo sur Youtube, c'est normal que tu leur cèdes le droit de la diffuser…
# Un peu de recul...
Posté par arnaudus . En réponse au lien YouTube édite automatiquement et sans consentement des vidéos avec de l'IA. Évalué à 8 (+8/-3).
Il y a la "hype" de l'AI, et il y a aussi la "hype" de l'anti-AI. Pour l'instant, si on s'en tient aux éléments qu'on trouve dans ces articles, il ne s'agit que de traitements automatiques portant sur la qualité des vidéos, ce qui est essentiellement la même chose que fait Youtube depuis 20 ans, avec des algorithmes de compression/décompression avec pertes, diffusion sous plusieurs résolutions, compression du son, etc. Les rendus non-naturels peuvent être obtenus par l'application de filtres trop agressifs sur la netteté, le flou, la correction du moiré, ou n'importe quel traitement d'image, qu'il implique un algo de machine learning ou non. Par contre, on est bien d'accord que si ça se voit, c'est qu'il y a un problème. En principe ça ne devrait être que des filtres techniques.
Les arguments à base de "l'AI modifie le monde selon ses critères" me semblent assez moisis. Parce que si on va par là, JPEG modifie aussi le monde selon ses critères, l'algorithme choisit quels genre de détails doivent être conservés et quels détails peuvent être effacés. C'est d'ailleurs assez étonnant à quel point on peut devenir tolérants aux artefacts de compression JPEG ou MP3, par exemple. On est peut-être très sensibles aux artefacts de correction d'image par des algos de ML, parce qu'on n'a pas l'habitude d'en voir.
[^] # Re: La fin de la bulle ?
Posté par arnaudus . En réponse au lien IA - Le pari de Sam Altman est-il voué à l’échec ? . Évalué à 6 (+3/-0).
Investir dans l'économie réelle? C'est pas un très bon produit financier…
[^] # Re: Quel intérêt ?
Posté par arnaudus . En réponse au lien Belkin balance ses objets connectés Wemo aux orties. Évalué à 2 (+2/-3).
L'intérêt pour qui? Pour toi, pour Mr/Mme tout le monde, pour les fabricants, ou pour ceux qui collectent les données?
Un certain nombre de ces trucs sont des gadgets, leur possession relève d'une balance entre le prix, l'intérêt personnel qu'on porte au gadget en question, et l'importance qu'on porte aux données partagées. Tout le monde n'est pas totalement hermétique à l'intérêt des gadgets; même quand on est au courant des problématiques de partage de données, l'être humain aime à transgresser les interdits pour un peu d'amusement. Typiquement, le traceur GPS au collier du chat (et je n'ai même pas demandé au chat pour la violation caractérisée de sa vie privée).
Il y a aussi plein de trucs assez utiles qui n'ont de sens que s'ils sont accessibles de l'extérieur, ce qui veut probablement dire pour la plupart des gens une application propriétaire sur un smartphone + un intermédiaire dans le cloud du fournisseur. Ça va du pilotage du chauffage, des prises de courant, aux systèmes de capteurs et caméras. La sonnette connectée avec possibilité d'interagir à partir du smartphone, ça résoud un certain nombre de problèmes de la vie quotidienne par exemple. C'est toujours difficile de dire que c'est indispensable, puisqu'évidemment l'être humain a su se dispenser de tout avant que ça soit disponible, mais voila, ces outils comblent des besoins.
[^] # Re: Inédit pour les métiers qualifiés
Posté par arnaudus . En réponse au journal Coder avec l'IA : le déclin du plaisir. Évalué à 4 (+1/-0).
Comme je n'ai dit, je ne suis pas sûr de le comprendre. Si l'idée est de dire que certains scientifiques sont meilleurs que d'autres, c'est difficile de le nier. Mais Einstein semble impliquer quelque chose de bien plus tortueux à mon sens, c'est l'idée que les scientifiques géniaux n'appartiennent qu'à une catégorie (que j'ai du mal à cerner parce qu'il semble que ça concerne le rapport que les gens ont avec la démarche scientifique). Disons que je ne comprends pas sa sociologie de la science, peut-être d'ailleurs parce que ça correspond à une époque lointaine et que le fonctionnement de la science a beaucoup changé depuis.
Avec des majuscules, on a toujours l'impression que ça rend les trucs vachement profonds. Disons que la "starification" de la science est quelque chose qui plait énormément au public, ainsi qu'aux politiques (qui peuvent en profiter pour utiliser des critères bureaucratiques d'"excellence" pour piloter les financements). Mais en tout cas à l'heure actuelle, on se rend bien compte que les mécanismes de starification sont assez déconnectés de la contribution scientifique des individus en question (on peut penser à un un prof de médecine Marseillais par exemple). L'histoire des sciences est truffée d'exemples où la postérité à attribué à une personne plus médiatique le résultat d'un travail collectif, ou a "choisi" au hasard parmi un ensemble de travaux équivalents publiés au même moment.
En plus, je ne suis même pas sûr que ça soit vrai. Par exemple, est-ce que Mendel fait partir de "Ceux qui font la Science"? Ses travaux étaient en avance sur son temps, mais il n'a été lu ni par ses contemporains qui auraient pu en profiter (notamment Darwin et Wallace), ni par ses successeurs qui ont redécouvert indépendamment les lois de la génétique. Du coup, on attribue à Mendel une découverte qu'il a été en effet le premier à faire, mais qui n'a eu aucune influence sur la progression des connaissances. Non, franchement, je ne comprends pas cette idée de lier des traits de personnalité avec un potentiel de construction de l'édifice scientifique, elle avait peut-être un sens il y a 120 ans, mais en tout cas ce sens a dû se perdre parce que je ne vois rien dans la réalité de la science moderne qui puisse l'étayer.
[^] # Re: Inédit pour les métiers qualifiés
Posté par arnaudus . En réponse au journal Coder avec l'IA : le déclin du plaisir. Évalué à 4 (+1/-0).
La vision d'Einstein est quand même celle d'un élitisme scientifique assez vertigineux, et je en suis même pas certain de bien comprendre ce qu'il entend avec ses deux catégories. Il y a un rôle pour beaucoup dans la science, pour le tâcheron qui collecte des données, pour celui qui fait beaucoup de bruit avec de nombreuses idées toutes aussi fausses les unes que les autres, mais qui obligent la communauté à réfléchir aux raisons pour lesquelles ces idées sont fausses, pour celui ou celle qui consacre sa vie à un problème obscur qui n'intéresse personne pour le moment, ceux qui parlent aux politiques, aux journalistes, au grand public; ceux qui s'investissent dans l'enseignement et l'encadrement des étudiants, ceux qui assurent le fonctionnement des institutions, ceux qui ramènent beaucoup d'argent, ceux qui conçoivent des expériences qui coûtent très cher, ceux qui conçoivent des expériences qui ne coûtent pas cher…
Après, c'est sûr que l'histoire des sciences ne se rappelle que de Newton ou d'Einstein, mais Einstein a par exemple énormément bénéficié de l'aide de mathématiciens et calculateurs dont la plupart seraient aujourd'hui remplacés par des automates.
Après, le risque que je vois se profiler à assez courte échéance, c'est que dans beaucoup de domaines le travail scientifique consiste à exécuter des plans d'expérience conçus par des systèmes automatiques. Ça n'est pas très gratifiant.
[^] # Re: Inédit pour les métiers qualifiés
Posté par arnaudus . En réponse au journal Coder avec l'IA : le déclin du plaisir. Évalué à 3 (+0/-0).
Évidemment, mais il y a des années lumières entre "niveau créatif c'est le néant" et "construire des nouveaux paradigmes dans les domaines scientifiques". En fait, là, on parle de *superintelligence artificielle", et à ma connaissance aucun des modèles existants prétend à la superintelligence.
Dans tous les cas, tu fais bien d'insister sur le fait qu'il ne faut pas confondre les versions des modèles utilisées pour les tests et les benchmarks, qui sont des versions de développement avec souvent beaucoup de ressources disponibles, et les versions gratuites grand public. Même si l'écart se compte parfois en mois ou en quelques années, donc ça n'est quand même pas comparer une navette spatiale et une twingo.
Démontrer des théorèmes sans créer de nouvelles formes de maths c'est aussi le boulot des mathématiciens, et on en est là.
Évidemment, on peut discuter longtemps de la hauteur de la marche pour passer de "niveau moyen d'un expert sur le sujet" à "meilleur que le meilleur expert". Pour certains c'est juste une question quantitative (plus de neurones, plus de données…), pour d'autres, c'est qualitatif est potentiellement bloquant. La réalité est qu'on n'en sait rien. Je ne vois rien en tout cas qui rendrait impossible l'atteinte d'une singularité technologique dans les années qui viennent.
[^] # Re: Inédit pour les métiers qualifiés
Posté par arnaudus . En réponse au journal Coder avec l'IA : le déclin du plaisir. Évalué à 5 (+2/-0).
Ça n'est pas évident à suivre parce que ça évolue à une vitesse vertigineuse, mais le fonctionnement d'une IA récente n'a plus grand chose à voir avec les chatbots d'il y a 3 ans. C'est toujours un peu basé sur le même principe, mais il y a des surcouches très complexes qui font que non, les IA ne sont pas du tout des machines à recracher. Il y a eu ces derniers mois des progrès qualitatifs sur les benchmarks sophistiqués (construits sur des problèmes originaux qui ne sont pas dans les données d'entrainement), et il semble que les experts trouvent de plus en plus dur de trouver des tâches où l'humain est supérieur. Donc oui, la recherche en IA progresse, non, les IA ne sont plus des machines à régurgiter.
Sur le côté créatif, même les premières versions de chatGPT ont montré leur capacité à créer : de la musique, du texte, des images, des objets 3D, etc. Je trouve que la question ne se pose même pas, ces logiciels peuvent créer des "oeuvres" de manière bien plus efficace qu'un humain moyen (bien sûr, ça n'est pas du Zola, mais encore une fois le critère d'une IA n'est pas de surpasser le meilleur humain dans tous les domaines!).
Cette année, l'IA de Google a résolu 5 problèmes sur 6 des "International Math Olympiades", ce qui la classe dans les 30 premiers (c'est une compétition hyper-balaise). Les IA spécialisées ont le niveau des tous meilleurs mathématiciens du monde.
Le déni ne te mènera nulle part.
Il faut juste décorréler le buzz et les annonces autour de l'économie, des $$$, des problèmes écologiques liés à l'IA, et les performances réelles. On peut trouver que l'IA est trop chère, qu'elle n'a pas de business model, qu'on lui confie des tâches qu'elle n'est pas capable d'assumer, que les problèmes légaux écologiques et sociétaux posés sont énormes, etc. Tout le monde est d'accord avec ça. Mais tout ça ne justifie absolument pas de dénigrer les performances de ces modèles, et la vitesse à laquelle leurs performances évoluent. On peut se plaindre de la manière dont les gens les utilisent, mais pas de leur capacité à repousser quasiment tous les jours les limites de la complexité des tâches qu'on pensait pour très longtemps hors de portée d'un ordinateur. Utiliser des sobriquets comme "perroquet stochastique", c'est juste admettre qu'en fait tu ne sais absolument pas de quoi ces logiciels sont capables, ce qui fait que le choc sera encore plus grand quand tu les verras s'immiscer dans ta vie.
[^] # Re: meta
Posté par arnaudus . En réponse au journal Coder avec l'IA : le déclin du plaisir. Évalué à -1 (+2/-6).
Ça n'est pas comme ça que ça marche; les salariés ne sont pas payés par rapport à leur contribution marginale au chiffre d'affaire (heureusement pour les comptables et les femmes de ménage …), mais par rapport à l'offre et la demande du marché du travail. D'ailleurs, les salariés ne sont pas non plus rémunérés par rapport à leur production, mais par rapport à la quantité d'heures travaillées.
Pour la répartition des gains de productivité, j'imagine que ça dépend énormément du secteur d'activité. Dans les secteurs très concurrentiels, les gains de productivité vont passer essentiellement dans la baisse des prix par exemple.
Ah non, pardon, "Les patrons c'est tous que des pourris, leur tête au bout d'une pique toussa toussa", c'était plutôt ça l'idée, non?