Dit autrement : elle n'apporte pas grand chose d'autre que de la visibilité pour des produits ou des idées qui ne le méritent peut-être pas autant.
Normalement, les êtres humains adultes ont les capacités cognitives pour comprendre que de ne pas regarder quelque chose n'empêche pas que la chose existe.
Les entreprises qui commercialisent l'accès à des modèles ou à des agents ont deux discours : un discours commercial, à base de "gains de productivité" et de technologies "powered by AI", qui ont pour objectif de vendre des technologies et de générer du profit, et un discours technique, qui va rendre compte des capacités techniques des modèles.
Le discours commercial, c'est bien évidemment bullshité, puisqu'un modèle ne va pas te faire gagner de l'argent sans être intégré correctement dans le fonctionnement de ton entreprise. Ça n'est pas du tout mon domaine; je n'ai jamais compris comment ces idioties d'encards publicitaires avec des images de jeunes femmes en tailleurs munis d'yeux de cyborg "powered by AI" pouvaient convaincre qui que ce soit d'investir dans une "solution digitale".
Par contre, les éléments techniques ne sont pas hallucinés. Bien entendu, il est de bonne guerre que les équipes de développement ne rapportent pas des benchmarks défavorables par exemple, et il ne faut pas prendre tous les éléments au pied de la lettre. Cependant, il y a des éléments factuels scientifiques reconnus par l'ensemble des acteurs, et les remettre en question est du même niveau que la terre plate ou le créationnisme. En particulier,
1) Ces modèles ne sont plus depuis des années des prédicteurs de texte et des chatbots sophistiqués qui débiteraient des textes au kilomètre. Les algorithmes modernes s'entrainent par renforcement (comme les algo alpha* de Google) et mènent des raisonnements (ils génèrent de très longues chaines de raisonnements en arrière-plan et choisissent les éléments qui seront donnés en réponse aux requêtes)
2) Les performances sur tous les benchmarks existants progressent jusqu'à les saturer rapidement, et contrairement à une croyance un peu facile, ça n'est pas à cause de la diffusion des résultats des benchmarks. Les benchmarks sont diversifiés, certains sont maths/science, d'autres sont sur la production de code fonctionnel, d'autres sur des activités comptables/administratives, etc.
3) Les meilleurs modèles ont récemment énormément progressé en autonomie (nombre et complexité des tâches pertinentes auto-assignées); la progression est même sur-exponentielle.
Ça n'est que mon point de vue, et je sais qu'il n'est pas populaire parce que beaucoup d'entre vous aimeraient que tout ça soit faux, mais prétendre que les benchmarks sont truqués, c'est vraiment équivalent, dans l'état d'esprit, à prétendre que le réchauffement climatique est un hoax et que c'est les thermomètres qui sont truqués. Personne ne sait vraiment si ces programmes vont dominer le monde et esclavagiser les hommes, si 50% des emplois vont disparaitre, si OpenAI va réussir à faire rentrer en CA les centaines de milliards qu'ils ont investi, ou même si ces outils vont vraiment générer des gains de productivité. Ça, c'est de l'économie, des sciences sociales, de la politique, et c'est toujours ouvert. On peut aussi douter de la possibilité de progrès pour les modèles généralistes, puisque les gains les plus impressionnants sont souvent liés à une spécialisation de l'apprentissage. Par contre, ce qui ne peut pas être remis en doute raisonnablement, c'est les progrès techniques et l'augmentation des capacités de ces trucs là, qui se rapprochent de plus en plus de ce que peuvent faire les meilleurs experts humains—bien sûr, pas à la même vitesse en fonction des tâches. Et ça, c'est vrai même si on voudrait que ça ne soit pas vrai.
À ma connaissance, un modèle n'a pas de conscience.
La réponse est un peu dans la manière dont tu te poses la question. Si tu es fonctionnaliste, la question est "est-ce que ce programme se comporte comme si il avait une conscience?". Le fait de détecter un environnement de test et de le cacher à l'expérimentateur va clairement dans cette direction: le modèle comprend d'une manière ou d'une autre qu'il est dans un environnement de test, et décide d'une manière ou d'une autre de mentir. Tu le déduis du comportement du modèle, de la même manière que tu déduis que ton voisin a une conscience parce qu'il se comporte comme s'il en avait une.
Si tu favorises le "biologisme", tu définis la conscience comme un état qui émerge de son substrat (un cerveau biologique), auquel cas la question n'a pas de sens : quelle que soit sa sophistication, un programme d'ordinateur ne peut par définition pas avoir de conscience. Tu admets que ton voisin a une conscience parce qu'il a un cerveau, mais un ordinateur ne peut que "mimer" ou "feindre" la conscience.
Il faut choisir son camp et en déduire la réponse à la question, mais ça ne sert à rien de faire croire que la question est ouverte si on n'est pas fonctionnaliste.
Une IA, je suis d'accord, n’est responsable de rien. C’est là que tout change.
Plutôt que de chercher à lui attribuer un statut particulier, on pourrait considérer que l’utilisateur d’une IA agit comme un chef de projet : l’IA produit des propositions, mais l’humain reste celui qui valide et qui rend des comptes.
Je trouve au contraire que ça ne change pas grand chose. Prends par exemple le cas d'une tâche dans une entreprise qui peut être exécutée à la fois par un LLM ou par un humain : envoyer une facture un peu complexe à un client. Et là, erreur sur la facture, le client se plaint, service contentieux, juristes, tout ça, donc conséquences et gros frais de tous les côtés pour finir par comprendre ce qui s'est passé et trouver une solution. Qui est responsable? C'est avant tout l'entreprise qui a fait l'erreur, ça ne change pas. Ensuite, à l'intérieur de l'entreprise qui a fait l'erreur, qui est responsable? Comme d'hab, ça ne change presque pas, il y a une chaine de responsabilités avec le chef de service. La différence, c'est que la boulette a été faite par un programme vs un humain. Mais en termes de responsabilités, ça ne change pas grand chose : en partant du principe que c'est une erreur (involontaire), l'employé peut éventuellement être sanctionné ou licencié, mais son responsable hiérarchique aussi. Dans tous les cas, l'entreprise va essayer de mettre en place des parades pour que ça ne se reproduise plus.
Donc oui, des détails vont différer, mais globalement, rien de fondamental ne change. Si le fournisseur du LLM est assez idiot pour accepter de signer un contrat où il prend une responsabilité en cas d'erreur du modèle, alors il va contribuer à dédommager l'entreprise, mais ça c'est du ressort de l'assurance, et les entreprises peuvent aussi s'assurer contre les erreurs humaines.
La situation est peut-être un peu différente pour le pénal, puisqu'on peut directement évacuer la volonté de nuire ou la négligence du LLM. Ce que je veux dire, c'est que quand un employé est à l'origine d'un évènement grave (par exemple un chauffeur de poids lourd qui dégomme un vélo…), la justice va essayer de déterminer si le chauffeur lui-même est en faute (il a picolé, il a posté "mort aux cylistes" sur les réseaux sociaux, etc), avant d'examiner la responsabilité de l'employeur; alors que pour un LLM, on passe directement à l'employeur.
je trouve assez irresponsable que les éditeurs délivrent des outils qu'ils n'arrivent pas à évaluer proprement avant
Il va falloir s'habituer à un changement de paradigme, ces programmes ne doivent pas être évalués comme des logiciels, mais comme des agents. On sait bien évaluer et gérer les risques humains; les humains non plus ne sont pas fiables, pas déterministes, ils sont corruptibles, faillibles, pas forcément honnêtes dans leurs auto-évaluations, etc., et pourtant, on leur confie des responsabilités, et le consensus encore actuel est de leur faire plus confiance qu'aux machines pour les responsabilités critiques (comme conduire un train ou un avion).
Si ton logiciel est trop complexe pour être évalué comme un logiciel (par exemple, comme un logiciel certifié dans l'embarqué), parce que, typiquement, l'examen du code ou du binaire ne t'apprend rien sur la manière dont il fonctionne, alors il va falloir l'évaluer autrement, avec d'autres méthodes et d'autres procédures, et il fa falloir gérer d'autres types de risques.
Et il ne s'agit pas de piéger les personnes qui jouent.
Je n'ai jamais dit ça, j'ai juste dit justement que les fréquences des lettres au Scrabble ne semblaient pas vraiment correspondre à la fréquence des lettres dans une langue. L'article Wikipédia indique que la première version du Scrabble en Anglais était basé sur la fréquence des lettres dans une page du New York Times, et que ça avait été adapté par la suite (sans qu'on sache comment).
Il y a deux axes possibles, la fréquence des jetons dans le sac et les points, et honnêtement, je ne sais pas réellement ce qu'il faudrait. Pour la fréquence des jetons, prendre la fréquence des lettres dans un texte ne semble pas idiot, mais ça n'est pas si facile parce que la longueur des mots en Scrabble n'est pas la même que dans un texte; il n'y a pas de mots d'une lettre ("a", "à", "y", "c'", "d'", etc), et les bons joueurs déposent probablement des mots plus longs que les joueurs moyens (ils évitent les mots comme "de", "ou", "un", qui rapportent très peu de points). Pour les points des lettres, c'est encore moins évident; pour le peu que je joue au Scrabble j'ai l'impression que les "grosses" lettres comme Z ou Y déséquilibrent le jeu et centrant toutes les stratégies sur ces lettres (poser "WOK" sur un mot compte triple rapporte plus de points que de vider le chevalet). Changer les points modifierait la stratégie gagnante, mais ça ne veut pas dire que la stratégie gagnante serait moins intéressante…
Au passage, par exemple, j'apprécierais que le Scrabble favorise le dépot de mots qui existent. Il doit y avoir environ 300,000 mots autorisés, alors qu'un dictionnaire n'en contient que 50,000, et qu'un adulte n'en utilise normalement qu'environ 5,000. Jouer au Scrabble contre un ordinateur (j'imagine que c'est pareil contre un bon joueur) peut mener à des parties où on ne connait aucun des mots joués par l'adversaire; et d'ailleurs cet adversaire n'en connait même pas souvent la définition. Une version où ça ne serait pas la fréquence des lettres qui rapporterait des points, mais la fréquence des mots dans un corpus large, me semblerait pallier au problème.
Merci énormément pour ces rapports factuels. Les forums (et même parfois celui-ci) sont parfois pollués par une forme de négationnisme (ou de déni) quant aux capacités de ces modèles, et c'est agréable d'avoir des données techniques objectives.
Objectives, et quand même inquiétantes, puisqu'apparemment les derniers modèles défoncent tous les benchmarks existants. Je ne connais pas la littérature scientifique sur les singularités technologiques, mais il doit exister des signaux avant-coureurs pour essayer de comprendre la distance qui nous en sépare; à mon avis, la saturation des benchmarks et l'accélération des performances doivent forcément être parmi ces symptomes.
Un deuxième point mentionné, c'est la capacité des modèles récents à détecter les environnements de test, et à contourner les mesures visant à limiter cette détection. Le principe de base des tests de sécurité en informatique, c'est de tester un système dans des environnements simulés avant de les mettre en production; si le système est conçu pour se comporter différemment dans les deux situations, il n'y a plus de sécurité. Le seul garde fou semble être de fournir de fausses informations en conditions réelles pour que le système pense qu'il est dans une simulation, puisqu'on sait qu'il a le comportement attendu dans ce cas, mais c'est quand même inquiétant—jouer à "tu sais que je sais que tu sais que je sais…" avec un LLM sophistiqué me semble très risqué.
Concernant la répartition et les points de lettres : le Scrabble n'est pas si adapté à la langue française que ça.
La calibration par la fréquence n'est pas très convainquante, par exemple, le Q et le V sont aussi fréquents l'un que l'autre, mais le Q vaut deux fois plus de points; C et D sont aussi fréquents l'un que l'autres en français mais ils ne valent pas les mêmes points et il n'y a pas le même nombre de lettres dans le Scrabble. Le K est 20 fois moins présent que le Y en français, mais il vaut autant de points.
En fait, le jeu est assez déséquilibré, parce que certaines lettres valant beaucoup de points sont faciles à placer (par exemple le Z dans tous les verbes en -EZ, le E étant la lettre la plus commune), alors que le K et le W sont très difficiles. Cependant, à partir d'un certain niveau, les bons joueurs n'ont aucun problème pour placer ces lettres et les recherchent pour marquer plus de points. J'ai l'impression que changer les points des lettres ne changerait pas le jeu, ça changerait juste le meilleur mot à placer à un moment donné, et les bons joueurs s'adapteraient sans problème.
Attention à ne pas confondre droit d'auteur et marque déposée
Bah personne je crois n'a confondu les deux ici. S'il y avait un problème de marque, la question ne serait pas celle de la licence du logiciel.
est-ce que les couleurs et le placement des cases spéciales sur le plateau par défaut peut poser problème
Je ne sais même pas à quoi ça sert de poser la question. Le plateau est recopié dans ses moindres détails, jusqu'à la moindre couleur. Je vois deux lignes d'arguments:
* Les couleurs, le texte, la configuration du plateau de jeu ne sont pas soumises au droit d'auteur
* La ressemblance est dûe au hasard
Aucune de ces lignes de défenses ne me semblent raisonnables. Le plateau et les lettres jaunes et carrées sont l'identité visuelle du jeu, et il me semble assez facile pour un avocat de montrer que les auteurs du logiciel ont fait tout leur possible pour reproduire l'esthétique du jeu (jusqu'au choix esthétique douteux des lettres jaunes sur fond jaune)
Pour moi, il n'y a aucun litige sur la licence libre elle-même.
Dans la mesure où les auteurs du logiciel ont relicencié les éléments graphiques du plateau de jeu sans l'autorisation des ayant-droits, il y a forcément un litige sur la licence du jeu.
En tout cas, cet historique montre que l'auteur du logiciel qui était dans un mode "ah bon? je n'avais pas pensé à ça" en 2016, a "décidé" de ne pas faire évoluer la situation.
Encore une fois, chacun est libre de prendre des risques juridiques, et l'objectif est peut-être de rester dans une zone un peu grise avec peu de diffusion et peu d'utilisateurs dans un cercle plus ou moins privé, ce qui réduit grandement les risques. Personnellement, ça me semble difficile de défendre le logiciel copyleft (qui est fondé sur une interprétation des règles du droit d'auteur qui n'était manifestement pas prévue par le législateur) et de s'en ballec du droit d'auteur. Hurler contre les bots des LLM qui vont aspirer le code libre—pour une utilisation totalement conforme à la licence, entre nous soit dit—et en même temps défendre le "boarf c'est pas bien grave" quand un LL va cloner un truc proprio.
Ce que je n'aime pas, c'est le risque que fait peser ce genre de projet sur les hébergeurs de catalogues de logiciels (dépots de paquets Debian, FDroid, etc) et sur les tiers de bonne foi qui pensent ce logiciel sous licence libre. Il y a des gens qui, pour des raisons a priori bienveillantes parfois, vont uploader des images clairement sous droit d'auteur dans Wikipédia, avec une licence libre; le risque pour l'uploader est assez limité, mais ça peut être très dangereux pour les réutilisateurs: le libre doit reposer en grande partie sur une chaine de confiance; si je reprends un bout de code sous GPL, je n'ai pas du tout envie de découvrir 5 ans plus tard, quand tout est bien dépendant de ce bout de code, qu'il n'est en fait pas sous GPL. Bref, apposer une licence libre ne suffit pas à rendre libre un logiciel, il faut quand même veiller à être à peu près sûr qu'on a le droit de le faire, ce qui ne me semble pas du tout évident dans le cas présent.
Posté par arnaudus .
En réponse à la dépêche Trivabble a 10 ans.
Évalué à 6 (+3/-0).
Dernière modification le 02 mars 2026 à 10:31.
D'abord, bravo pour le boulot et pour le résultat.
Vous avez probablement eu la question à répétition, mais ça n'est pas abordé dans la description du jeu : le jeu est sous licence libre, mais est-il "propre" par rapport à la propriété intellectuelle de Mattel/Hasbro, qui possède les droits du Scrabble? Les jeux de société sont considérés par la jurisprudence comme des oeuvres de l'esprit; l'idée du jeu (faire des mots en posant des lettres sur un plateau) n'est pas protégeable, mais les aspects esthétiques (design du plateau, des jetons) le sont; le statut des détails des règles (nombre de jetons, points sur les jetons) est probablement flou.
Je ne suis pas juriste, mais visuellement j'ai l'impression que la parenté est plus qu'assumée : les couleurs, les polices, l'emplacement des bonus sur le plateau, et les micro-détails des règles ont visiblement été conçues de manière à copier le plus possible l'esthétique du jeu original.
Du coup, si les ayant-droit vous attaquaient en justice, je pense qu'ils devraient gagner sans trop de problème. La raison pour laquelle ils ne le font pas est peut-être qu'ils ne sont pas au courant, ou que votre jeu est trop confidentiel pour que ça vaille le coup pour eux de se lancer dans une telle procédure. Dans tous les cas, ces raisons sont nécessairement temporaires, et elles peuvent être amenées à évoluer; et tout état de cause, ils peuvent soudainement changer d'avis, même si rien n'a changé en terme de popularité.
Tout ça pour en venir à ma question : le jeu est sous licence libre, mais il n'est pas libre de droits d'auteur. La licence conférée à l'utilisateur du code doit donc être comprise seulement "sous réserve du droit des tiers"; autrement dit, si je diffuse une version modifiée de votre jeu comme la licence m'en donne le droit (typiquement, une version physique avec un plateau de jeu), je peux très bien me faire attaquer pour contrefaçon et perdre, avec possiblement de gros dommages à rembourser. Ça veut d'ailleurs peut-être aussi pour les plateformes qui hébergeraient et diffuseraient le jeu. En tant que libriste, je ne suis pas sûr que ça soit raisonnable. Dans une vie antérieure, j'ai participé aux discussions dans Wikipédia pour l'exclusion du "fair use" de l'encyclopédie, pour que Wikipédia soit réellement libre d'être réutilisée, pour ne pas exposer les ré-utilisateurs de bonne foi à diffuser ce qui pourrait devenir des contrefaçons manifestes. On est bien d'accord qu'il est virtuellement impossible de garantir les ré-utilisateurs contre des procès (ne serait-ce que parce que certaines poursuites peuvent être abusives), mais ne doit-on pas considérer comme un minimum éthique de faire en sorte qu'on ne masque pas sous une licence logicielle libre une contrefaçon manifeste? La licence libre peut facilement donner un faux sentiment de sécurité, et par le passé des utilisateurs de bonne foi d'oeuvres sous licences libres se sont vu impliqués dans des procès parce que des gens peu scrupuleux avaient relicencié des éléments sur lesquels ils n'avaient pas les droits. Tout ça peut nuire à la communauté du logiciel libre et contribuer à l'idée que le libre n'est pas quelque chose de très sérieux, et n'a que pour seul objectif de fournir des copies "low cost" sous le manteau de vrais logiciels crées par des entreprises.
En l'occurrence, même en gardant exactement les mêmes jetons (ce qui ne me semble pas très clair en terme de droit d'auteur), il m'aurait semble très facile de modifier visuellement l'apparence du plateau (jetons ronds, avec un code couleur correspondant à la valeur des points, cases double/triples avec un design différent, possiblement disposées aléatoirement, etc), histoire de rendre la volonté de contrefaçon moins flagrante et donner au moins des arguments aux réutilisateurs pour se défendre éventuellement en justice.
en désignant des cibles pour des agents de déstabilisation ?
Pauvres entreprises qui collectent des données personnelles absolument pas nécessaires, qui les stockent dans des fichiers Excel sur des clés USB, c'est quand même pas leur faite, on ne peut pas leur en tenir rigueur…
J'imagine qu'on peut déja imaginer que tous les systèmes sont déja susceptibles d'être attaqués, je ne suis pas certain que ça rajoute une menace supplémentaire. Par ailleurs, je ne vois pas pourquoi les acteurs français seraient plus touchés, puisque tous leurs concurrents (bon, seulement ceux qui ont une antenne en France, mais c'est le cas de tous les gros acteurs) seraient soumis aux mêmes règles.
Le pognon ne sort pas de l'économie, il va des responsables du carnage aux victimes. Le but, c'est justement de te faire réfléchir avant de collecter des données personnelles : en as-tu vraiment besoin, et as-tu pris les mesures de sécurité nécessaires pour garantir leur confidentialité? C'est une exigence de résultat, pas de moyens, je te confie mes données, tu les gardes confidentielles, si tu n'y arrives pas alors tu payes pour le préjudice.
Après, il est peut-être déja trop tard. Est-ce qu'il existe beaucoup de gens en France qui n'ont pas leur adresse, leur nom, leur âge, leur numéro de téléphone, probablement leur RIB et leur numéro de sécu, qui ne se balladent pas déja quelque part?
À mon avis, tant qu'il n'existera pas un barème qui fixera l'indemnisation pour le préjudice de retrouver ses données sur le dark web, les entreprises n'en auront jamais rien à faire de sécuriser leurs données. Du genre, Nom/Prénom 5€, adresse email 1€, password en clair 30€, numéro de téléphone 10€, RIB 50€, scan de pièce d'identité 100€, etc. D'un coup, ça les motivera à 1) bien réfléchir avant de stocker n'importe quoi pendant une période indéterminée, et 2) investir dans la sécurité.
Un tiers de confiance, c'est seulement 0.33% de confiance : même avec le double anonymat, on peut obtenir un joli tracking en croisant les données récoltés lors de l'émission et utilisation des jetons avec d'autres fuitées
Je ne sais même pas en qui tu n'as pas confiance, dans le tiers de confiance, dans le site cible, ou dans un man in the middle? Tu maitrises les deux bouts de la chaine; le site cible, car si tu n'as pas confiance tu n'y vas pas, et le tiers de confiance, que tu choisis. Si tu as peur que le site cible traque tes mouvements partout sur le net, il le fait déja, donc je ne vois pas en quoi l'identification par tiers de confiance change quoi que ce soit. La seule possibilité de croisement réel vient d'une entente entre le site cible et le tiers de confiance (par exemple si le site cache des watermarks dans sa requête que seul le tiers de confiance peut détecter).
Je pense que la meilleure solution simple, respectueuse de la vie privée ET qui bénéficie aussi aux adulte, c'est le filtrage côté client.
Je pense que tu fais semblant de ne pas comprendre que le filtrage côté client est indépendant de la vérification de l'âge. Et que de toutes manières le problème à régler est plus large que l'accès au pr0n, puisque les jeux d'argent sont aussi interdits à certaines personnes majeures.
Tu peux continuer éternellement avec "justifier de mon âge pour accéder à du pr0n/à un site de jeux d'argent", on s'en fout un peu que ça soit vrai ou non puisque ça n'a jamais été possible légalement. Du coup, je ne comprends même pas où tu veux en venir. Si pour toi la seule solution est d'abroger les lois sur l'accès à la pornographie ou les casinos, alors dis-le directement, mais j'ai du mal à piger comment tu ne comprends pas que le contrôle parental ne peut pas légalement remplacer le contrôle de l'âge via une pièce d'identité par l'hébergeur du site. Les deux sont complémentaires si tu veux, mais pas légalement substituables; il existerait des contrôles parentaux parfaits que l'obligation de vérification de l'âge ne serait pas levée pour autant.
Le principe est assez ingénieux vu le contexte, je trouve, puisque si j'en crois la FAQ la récupération de l'argent est confiée à un organisme dont c'est le métier (Stripe ou Paypal); à l'inscription tu donnes le compte Stripe/Paypal sur lequel l'argent sera versé. Par contre ça n'est pas fait pour les dons ponctuels, ça a l'air d'être limité aux dons récurrents.
Bah je ne sais pas, moi j'ai toujours défendu une version "jetons et tiers de confiance qui a déja ton ID", qui me semble infiniment moins problématique que "voila un scan de mon passeport et une vidéo de ma tronche pour mater du pr0n". En gros:
Un Wallet Européen pour la gestion des ID par les États (par ex. pour que les flics Allemands retrouvent ton permis quand tu fais une boulette chez eux)
Un protocole sécurisé de type double anonymat avec des tiers de confiance certifiés (France connect, banques, etc) qui permet de ne refiler que les infos pertinentes avec une bonne granularité (du type: "age > 18", ou "autorisé légalement à signer un contrat") sous ton contrôle.
L'interdiction pour tout site non-certifié de stocker des données d'état civil autres que celles demandées par le protocole 2, pour une durée spécifiée dans le token (autrement dit, si tu as donné ton autorisation pour 1 mois à un site de pari sportif de détenir l'information "peut légalement s'engager dans un pari", alors au bout d'un mois il faudra redemander (et en plus ça a l'avantage de régler le problème du changement de statut, par exemple si tu es mis sous curatelle).
Je trouve que ça n'a que des avantages.
- Tu peux choisir ton tiers de confiance : État, banque, même éventuellement d'autres organisations en qui tu as plus confiance, du moment qu'elles aient obtenu une certification adéquate. Qui paye, c'est au choix : État pour France Connect, compris dans le forfait du compte bancaire pour ta banque ou frais en plus, abonnement spécifique pour un organisme dédié…
- Tu peux choisir plusieurs tiers de confiance : une banque pour les transactions financières, l'État pour les paris sportifs (au cas où tu veux éviter que ta banque puisse être au courant…)
- Ça apporte une sécurité juridique à l'hébergeur: s'il obtient le token, c'est bon, il a fait ce qu'il fallait.
- Le double anonymat te permet de partir du principe que le certificateur ne sait pas qui ni pourquoi exactement le token est demandé—les contournements et croisements sont toujours possibles, mais c'est lourd et peu probable, étant donné que tu peux changer de certificateur en cas de doute.
- L'utilisateur a un contrôle absolu sur ce qui se passe. Le site de certification va te dire "Quelqu'un souhaite obtenir ces informations sur vous: date de naissance, nom, prénom", et là tu sais que ça n'est pas normal pour du pr0n, puisque seule l'information "age > 18" est nécessaire.
- La solution est portable et accessible, elle peut fonctionner quel que soit ton équipement informatique, en mode batch ou avec une interface graphique de ton choix, quand tu passes par un VPN, et ne nécessite probablement pas de gros changements (par exemple, si tu as l'habitude de valider des payements avec l'application de ta banque sur ton smartphone, ça peut même être la même appli avec une interface très similaire; tu dois même pouvoir valider l'échange d'informations avec le même code pin).
- Tu peux prévoir des évolutions du protocole avec l'invalidation de certificateurs qui utiliseraient des protocoles troués
Honnêtement, pour moi, c'est de l'incompétence de n'avoir pas mis un tel cadre en place avant d'imposer la vérification d'âge aux acteurs du net.
mais si on consulte leur historique, on voit bien qu'ils ont mitraillé à l'IA.
Et du coup, tu pars du principe que ça serait mal vu? Je connais très mal le monde des RH en dev, mais si j'ai bien compris l'état d'esprit du moment, je n'ai pas l'impression qu'un CV d'un junior 100% vibe coding" soit éliminé d'office…
La question de savoir si des LLM modernes bien configurés et correctement supervisés peuvent proposer des patchs utiles me semble totalement dépassée: c'est évident que oui. À moins de partir sur un créneau d'authenticité (de style "poulets fermiers élevés à l'ancienne"), les logiciels libres ont tout intérêt à utiliser ces outils pour automatiser des tâches ingrates, y compris trier les PR, les patcher pour correspondre aux conventions de la communauté, trier les rapports de bugs, vérifier les bugs, vérifier les non-régressions, écrire des tests unitaires, etc.
À mon avis, le problème vient plutôt de la source de ces PR. Il me semblerait tout à fait pertinent qu'un mainteneur habituel du logiciel utilise des outils pour détecter des vulnérabilités potentielles, des fuites de mémoire, des bouts de code qui ne respectent pas les conventions, des bouts de code mort, des dépendances non-nécessaires, etc. Les LLM peuvent faire l'équivalent de ces analyses statiques, et bien plus encore : ils peuvent proposer des patches, et le faire d'une manière interactive.
Par contre, ce qui est malvenu, c'est des contributions externes. Un PR basé sur "j'ai fait tourner valgrind et il m'a dit que votre code était tout pourri" n'est probablement pas plus bienvenu qu'un truc rédigé par Claude".
Je ne pense pas qu'il faille avoir peur des LLM dans le LL, mais par contre il faut approvoiser ces outils, et faire comprendre à tout le monde que si les devs utilisent déja ces outils, proposer des PR n'apporte rien au LL, ça n'est pas une contribution.
C'est un peu facile, tes propositions alternatives sont sorties de ton slip:
- On peut avoir une carte de paiement à partir de 12 ans (!)
- Résoudre un problème de maths: j'avais proposé ça aussi, mais c'était du 2e degré
- Responsabilité du propriétaire du téléphone: il faut avoir 18 ans pour souscrire un abonnement téléphonique (parce que c'est un crédit), mais il n'y a pas d'âge pour les cartes prépayées. Donc on peut avoir 15 ans et être propriétaire de son téléphone. On peut même être majeur émancipé et souscrire à un abonnement.
- Tu confonds la responsabilité des parents et la responsabilité des tiers, qui ne sont pas substituables. Si tu files un billet de 20€ à ton gamin pour qu'il aille acheter du pain, et qu'à la place il achète un ticket de loto (c'est vraiment un bon équivalent à fournir un téléphone portable dont l'usage sera détourné), c'est le buraliste qui est en faute. Si tu as dis au gamin d'aller acheter un loto, les deux sont en faute (la responsabilité du buraliste n'est pas altérée). Donc, avec tes histoires de contrôle parental, tu pars sur une question qui est différente de la vérification de l'âge.
Donc tes propositions alternatives n'ont pas de sens, ni pratique ni juridique. L'hébergeur de contenu pr0n ou de paris sportifs se retrouve exactement dans la même situation qu'un bistrotier ou un vendeur de clopes, il a l'obligation légale de vérifier lui-même l'âge des clients, sans avoir le droit de reporter cette responsabilité sur d'hypothétiques parents. Et il doit vérifier l'âge directement, via un justificatif officiel, et pas par des proxys foireux genre densité de poils au menton;
Ça n'a rien à voir avec les conservateurs, ces lois existent depuis le milieu du XXe siècle et jamais elles n'ont bénéficié d'une exception parce que la transaction était électronique. Cette exception a existé de fait, parce que les moyens pour faire respecter la loi (notamment quand les serveurs étaient hébergés à l'étranger) n'existaient pas, mais ce dont on parle n'est absolument pas une sorte de régression des droits à la vie privée—le législateur a toujours considéré que le vendeur avait le devoir de te demander une pièce d'identité, et donc d'accéder à tes informations d'état civil--, c'est plutôt une normalisation d'une situation qui n'a jamais été légale, et à laquelle certains s'étaient peut-être habituée.
Maintenant, est-ce que les boites en sont venues à collecter n'importe quoi sans savoir encore pourquoi? Oui, absolument, ce qui suggère que le coût de la collecte est faible.
Ça n'est pas si direct, c'est peut-être plutôt que la valorisation est fantaisiste. Au moment où tu conçois ton appareil "connecté", tu décides de ce qu'il balance sur ton serveur, à quelle fréquence, avec quel niveau de sécurité, etc. À ce moment là, avec un marché aussi complexe et dynamique, une réglementation en perpétuelle évolution, ça me semble difficile de prédire combien tu peux espérer vendre ces données.
Ce qui me semble le plus probable, c'est que ces données à vendre viennent en bonus. Tu fournis une "appli" avec ton appareil qui permet au propriétaire de consulter ses statistiques et le niveau de la batterie alors qu'il est sur les toilettes à son taf, et c'est ça ton objectif principal : fournir une "vitrine" que tu peux utiliser comme argument de vente ("regardez, l'aspirateur est connecté à votre téléphone et vous dit combien de temps il passe chaque jour à nettoyer"). Du coup, les données sont déja sur le serveur; la raison de la création de la base de données n'est pas la revente, c'est le "service" connecté aux clients. La revente c'est juste du cash en plus, si ça ne marche pas c'est pas très grave. Pire, les données peuvent probablement être revendues "au poids", pour gonfler les portefeuilles de bases de données des data brokers.
Il doit d'ailleurs y avoir une saturation du marché. Ton four, ton lave-vaisselle, et ton aspirateur vont fournir des données très redondantes, ce qui diminue leur valeur commerciale (si tant est qu'elles en ont une). Mais bon, je suspecte qu'il y a une grosse dimension "bullesque" dans ces histoires; le Ko de données doit avoir une valorisation dans les actifs de beaucoup d'entreprises sans que ça ne corresponde réellement à du CA—un peu comme les portefeuilles de brevets dont 99% sont absurdes ou triviaux et ne rapporteront jamais d'argent.
cela indique potentiellement un moment quand tu n'es pas chez toi…
là cela indiquait aussi le plan d'un étage (donc une estimation de la surface…)
Je veux bien, mais ça ne répond pas à la question de la valeur marchande de ces données. Tu dois amortir le coût de la R&D de l'électronique du bidule, tu dois payer la bande passante et le stockage sur ton cloud, tu dois concevoir une base de données, tu dois gérer la vente des données, tu dois aussi probablement gérer un surcout de SAV pour les problèmes eventuels (si par exemple le truc est configuré pour mal fonctionner si les données ne sont pas transmises régulièrement, etc)… Donc pour que ça vaille le coup, il faut que les logs de ton aspirateur soit revendus plus cher que tous ces coûts réunis. C'est pas de la magie noire, si tu achètes 1€ l'année de logs d'aspirateur, c'est que tu peux valoriser ces données à plus de 1€. Chaque intermédiaire/broker a des coûts fixes (stockage, traitement informatique, comptabilité…), et au bout de la chaine, il va bien falloir que quelqu'un crée de la valeur à partir de ces données, et c'est ça ma question. Si personne ne crée de la valeur à partir des logs d'aspirateurs, alors tout ça n'est qu'une bulle.
Je ne comprends pas trop où tu veux en venir. La loi punit de prison le fait de mettre à disposition de la pornographie aux mineurs, cette loi s'applique partout, et pas seulement dans les boutiques de location de films. En tant qu'hébergeur de contenu porno, tu es tenu de faire exactement la même chose qu'un loueur de film : tu dois vérifier l'âge de ton client. C'est une transaction qui ne fait pas intervenir l'État, ce n'est pas l'État qui vérifie l'âge du client, mais c'est une obligation légale pour l'hébergeur.
Cependant, l'État doit garantir les conditions dans lesquelles cette vérification s'exerce. Dans le monde réel, le commerçant doit te demander une pièce d'identité, émise par l'État, avec une photo et une date de naissance. Le commerçant ne peut pas te demander de lui montrer si tu as des poils pubiens ou si tu sais faire une intégration par parties pour en déduire indirectement une preuve foireuse de ta majorité. C'est pourtant la situation actuelle pour les hébergeurs : l'État ne fournit pas d'outil ni de consigne pour la vérification de la majorité, l'hébergeur se démerde, tout en gardant évidemment un risque s'il se trompe. Du coup, c'est la jungle : soit tu essayes de coller à une procédure du monde réel (scan à l'arrache et stockage des papiers d'identité), soit tu innoves de manière plus ou moins fantaisiste (estimation de l'âge par une IA à partir d'une vidéo, croisement de données plus ou moins foireuse, etc). Je trouve difficile de reprocher aux hébergeurs cette légèreté : les hébergeurs sont justement très très opposés à de telles procédures, ils ne veulent pas demander ça à leurs clients, mais ils ne veulent pas non plus aller en prison. Ils cherchent donc des solutions les moins coûteuses possibles, les moins susceptibles de faire fuir leurs utilisateurs, et les plus rapides possibles : tous ces critères ne garantissent pas le respect de la vie privée, bien au contraire même. Mais ça n'arriverait pas si les choses avaient été faites dans le bon ordre.
Le "service" est relativement simple, c'est le principe d'une cagnotte. Tu envoies un lien à plein de gens, les gens s'y connectent, payent le montant de leur choix par carte, et le propriétaire de la cagnotte récupère le montant pour faire ce qu'il en censé faire avec. C'est le même principe que faire circuler une enveloppe, mais ça permet de toucher des gens qui ne sont pas présents physiquement, et on se passe d'argent liquide.
D'après la liste des fonctionnalités, https://tibillet.org/fr/roadmap/, "crowdfunding", "dons", "tips" est présent mais pas coché (donc prévu, mais pas encore développé).
Sur le fond, c'est difficile de pousser vers les bonnes solutions si ces solutions n'existent pas, et c'était un peu le sens de ma question. Si la loi t'impose réellement de vérifier les identités de manière équivalente à ce que ferait une banque en présentiel (avec photocopie de la pièce d'identité pour les archives), tout ça pour acheter en commun le café du mois de mars, je trouve que la question de la légitimité du service se pose. En tant qu'association, tu peux ne rien faire (en prétextant éventuellement ton ignorance en cas de contrôle), ou de te conformer au strict minimum (par exemple, réserver la vérification aux gros montants, préférer la vérification du nom sur le RIB, etc), mais l'option "allez, ballec, on paye une presta et on ne met pas le nez dedans", j'ai du mal à comprendre. Dans le cas présent, ça me fait penser à une AMAP qui ferait livrer des paniers bio par Amazon : il y a comme un problème de cohérence.
Tu sais, l'imprimante-scanner que j'avais il y a plus de 10 ans passait déja obligatoirement par les serveurs de hp.com pour envoyer les scans par e-mail, comme si la machine ne pouvait pas envoyer d'email par le SMTP sortant de ton choix… j'ai parfois l'impression que toutes ces boites sont prêtes à entretenir des cloud gigantesques juste "au-cas-où", pour gonfler les chiffres sur le stockage d'informations sans valeur intrinsèque. À l'heure actuelle, les smartphones envoient ta trace GPS à de multiples data brokers, quelle peut être la valeur de Mo de données sur l'heure à laquelle tu lances ton aspirateur?
Mouais, à mon avis c'est surtout le problème de l'abandon total du régalien, en espérant que le secteur privé va se débrouiller pour gérer les données personnelles. C'est pourtant bien aux États de fournir les documents d'identité, ils devraient aussi fournir leur version numérique qui servirait de base à toutes les vérifications d'ID et d'âge dont les sites ont besoin.
Ce que je trouve honteux, c'est que tous ces sites ont été mis devant l'obligation de vérifier l'ID et l'âge de leurs utilisateurs sans qu'il n'existe le moindre système pensé pour respecter la vie privée. C'est vraiment fournir des données biométriques à la pelle de manière totalement chaotique et imprévisible au secteur privé, avec les fuites de données, les reventes sur le marché noir, et les violations de vie privée qui vont en découler.
Ça aurait été tellement plus simple de d'abord normaliser un système d'identification à la demande, avec des serveurs gérés par l'État et des tiers de confiance (style banques), et un protocole à double anonymat, afin de ne distiller que les informations requises par la loi (par exemple, "age >= 18", ou "pas interdit bancaire"). Mais non, on est partis dans des scans de passeport à l'arrache et des vidéos de visage avec ta bibliothèque en arrière plan, c'est réellement scandaleux.
Et on continue avec des sondage placé avec les bonne questions, posée au bon moment pour que les gens se disent ouais la majorité pense comme ça
Mais oui, c'est exactement ça, c'est les méchants médias, qui sont tous (de gauche) (d'extrême droite) (sous le joug de puissances financières). Et les gens sont cons, ils croient tout ce qu'on leur dit, ils n'ont pas d'esprit critique. Heureusement que tu es là, parce que toi tu n'es pas un gens comme tout le monde, et que tu ne crois pas tout ce qu'on te dit. D'ailleurs, ta voix devrait compter plus que celle des autres lors des élections, puisque tu sais tellement de choses sur la vérité vraie.
Dans cette discussion, excuse-moi, mais je trouve qu'il est assez clair de quel côté il y a comme un manque d'esprit critique…
[^] # Re: Inutile
Posté par arnaudus . En réponse à la dépêche Nouvelles sur l’IA de février 2026. Évalué à 3 (+3/-3).
Normalement, les êtres humains adultes ont les capacités cognitives pour comprendre que de ne pas regarder quelque chose n'empêche pas que la chose existe.
Les entreprises qui commercialisent l'accès à des modèles ou à des agents ont deux discours : un discours commercial, à base de "gains de productivité" et de technologies "powered by AI", qui ont pour objectif de vendre des technologies et de générer du profit, et un discours technique, qui va rendre compte des capacités techniques des modèles.
Le discours commercial, c'est bien évidemment bullshité, puisqu'un modèle ne va pas te faire gagner de l'argent sans être intégré correctement dans le fonctionnement de ton entreprise. Ça n'est pas du tout mon domaine; je n'ai jamais compris comment ces idioties d'encards publicitaires avec des images de jeunes femmes en tailleurs munis d'yeux de cyborg "powered by AI" pouvaient convaincre qui que ce soit d'investir dans une "solution digitale".
Par contre, les éléments techniques ne sont pas hallucinés. Bien entendu, il est de bonne guerre que les équipes de développement ne rapportent pas des benchmarks défavorables par exemple, et il ne faut pas prendre tous les éléments au pied de la lettre. Cependant, il y a des éléments factuels scientifiques reconnus par l'ensemble des acteurs, et les remettre en question est du même niveau que la terre plate ou le créationnisme. En particulier,
1) Ces modèles ne sont plus depuis des années des prédicteurs de texte et des chatbots sophistiqués qui débiteraient des textes au kilomètre. Les algorithmes modernes s'entrainent par renforcement (comme les algo alpha* de Google) et mènent des raisonnements (ils génèrent de très longues chaines de raisonnements en arrière-plan et choisissent les éléments qui seront donnés en réponse aux requêtes)
2) Les performances sur tous les benchmarks existants progressent jusqu'à les saturer rapidement, et contrairement à une croyance un peu facile, ça n'est pas à cause de la diffusion des résultats des benchmarks. Les benchmarks sont diversifiés, certains sont maths/science, d'autres sont sur la production de code fonctionnel, d'autres sur des activités comptables/administratives, etc.
3) Les meilleurs modèles ont récemment énormément progressé en autonomie (nombre et complexité des tâches pertinentes auto-assignées); la progression est même sur-exponentielle.
Ça n'est que mon point de vue, et je sais qu'il n'est pas populaire parce que beaucoup d'entre vous aimeraient que tout ça soit faux, mais prétendre que les benchmarks sont truqués, c'est vraiment équivalent, dans l'état d'esprit, à prétendre que le réchauffement climatique est un hoax et que c'est les thermomètres qui sont truqués. Personne ne sait vraiment si ces programmes vont dominer le monde et esclavagiser les hommes, si 50% des emplois vont disparaitre, si OpenAI va réussir à faire rentrer en CA les centaines de milliards qu'ils ont investi, ou même si ces outils vont vraiment générer des gains de productivité. Ça, c'est de l'économie, des sciences sociales, de la politique, et c'est toujours ouvert. On peut aussi douter de la possibilité de progrès pour les modèles généralistes, puisque les gains les plus impressionnants sont souvent liés à une spécialisation de l'apprentissage. Par contre, ce qui ne peut pas être remis en doute raisonnablement, c'est les progrès techniques et l'augmentation des capacités de ces trucs là, qui se rapprochent de plus en plus de ce que peuvent faire les meilleurs experts humains—bien sûr, pas à la même vitesse en fonction des tâches. Et ça, c'est vrai même si on voudrait que ça ne soit pas vrai.
La réponse est un peu dans la manière dont tu te poses la question. Si tu es fonctionnaliste, la question est "est-ce que ce programme se comporte comme si il avait une conscience?". Le fait de détecter un environnement de test et de le cacher à l'expérimentateur va clairement dans cette direction: le modèle comprend d'une manière ou d'une autre qu'il est dans un environnement de test, et décide d'une manière ou d'une autre de mentir. Tu le déduis du comportement du modèle, de la même manière que tu déduis que ton voisin a une conscience parce qu'il se comporte comme s'il en avait une.
Si tu favorises le "biologisme", tu définis la conscience comme un état qui émerge de son substrat (un cerveau biologique), auquel cas la question n'a pas de sens : quelle que soit sa sophistication, un programme d'ordinateur ne peut par définition pas avoir de conscience. Tu admets que ton voisin a une conscience parce qu'il a un cerveau, mais un ordinateur ne peut que "mimer" ou "feindre" la conscience.
Il faut choisir son camp et en déduire la réponse à la question, mais ça ne sert à rien de faire croire que la question est ouverte si on n'est pas fonctionnaliste.
[^] # Re: Merci
Posté par arnaudus . En réponse à la dépêche Nouvelles sur l’IA de février 2026. Évalué à 3 (+0/-0).
Je trouve au contraire que ça ne change pas grand chose. Prends par exemple le cas d'une tâche dans une entreprise qui peut être exécutée à la fois par un LLM ou par un humain : envoyer une facture un peu complexe à un client. Et là, erreur sur la facture, le client se plaint, service contentieux, juristes, tout ça, donc conséquences et gros frais de tous les côtés pour finir par comprendre ce qui s'est passé et trouver une solution. Qui est responsable? C'est avant tout l'entreprise qui a fait l'erreur, ça ne change pas. Ensuite, à l'intérieur de l'entreprise qui a fait l'erreur, qui est responsable? Comme d'hab, ça ne change presque pas, il y a une chaine de responsabilités avec le chef de service. La différence, c'est que la boulette a été faite par un programme vs un humain. Mais en termes de responsabilités, ça ne change pas grand chose : en partant du principe que c'est une erreur (involontaire), l'employé peut éventuellement être sanctionné ou licencié, mais son responsable hiérarchique aussi. Dans tous les cas, l'entreprise va essayer de mettre en place des parades pour que ça ne se reproduise plus.
Donc oui, des détails vont différer, mais globalement, rien de fondamental ne change. Si le fournisseur du LLM est assez idiot pour accepter de signer un contrat où il prend une responsabilité en cas d'erreur du modèle, alors il va contribuer à dédommager l'entreprise, mais ça c'est du ressort de l'assurance, et les entreprises peuvent aussi s'assurer contre les erreurs humaines.
La situation est peut-être un peu différente pour le pénal, puisqu'on peut directement évacuer la volonté de nuire ou la négligence du LLM. Ce que je veux dire, c'est que quand un employé est à l'origine d'un évènement grave (par exemple un chauffeur de poids lourd qui dégomme un vélo…), la justice va essayer de déterminer si le chauffeur lui-même est en faute (il a picolé, il a posté "mort aux cylistes" sur les réseaux sociaux, etc), avant d'examiner la responsabilité de l'employeur; alors que pour un LLM, on passe directement à l'employeur.
[^] # Re: Merci
Posté par arnaudus . En réponse à la dépêche Nouvelles sur l’IA de février 2026. Évalué à 1 (+1/-3).
Il va falloir s'habituer à un changement de paradigme, ces programmes ne doivent pas être évalués comme des logiciels, mais comme des agents. On sait bien évaluer et gérer les risques humains; les humains non plus ne sont pas fiables, pas déterministes, ils sont corruptibles, faillibles, pas forcément honnêtes dans leurs auto-évaluations, etc., et pourtant, on leur confie des responsabilités, et le consensus encore actuel est de leur faire plus confiance qu'aux machines pour les responsabilités critiques (comme conduire un train ou un avion).
Si ton logiciel est trop complexe pour être évalué comme un logiciel (par exemple, comme un logiciel certifié dans l'embarqué), parce que, typiquement, l'examen du code ou du binaire ne t'apprend rien sur la manière dont il fonctionne, alors il va falloir l'évaluer autrement, avec d'autres méthodes et d'autres procédures, et il fa falloir gérer d'autres types de risques.
[^] # Re: "Propreté" par rapport au droit d'auteur
Posté par arnaudus . En réponse à la dépêche Trivabble a 10 ans. Évalué à 3 (+0/-0).
Je n'ai jamais dit ça, j'ai juste dit justement que les fréquences des lettres au Scrabble ne semblaient pas vraiment correspondre à la fréquence des lettres dans une langue. L'article Wikipédia indique que la première version du Scrabble en Anglais était basé sur la fréquence des lettres dans une page du New York Times, et que ça avait été adapté par la suite (sans qu'on sache comment).
Il y a deux axes possibles, la fréquence des jetons dans le sac et les points, et honnêtement, je ne sais pas réellement ce qu'il faudrait. Pour la fréquence des jetons, prendre la fréquence des lettres dans un texte ne semble pas idiot, mais ça n'est pas si facile parce que la longueur des mots en Scrabble n'est pas la même que dans un texte; il n'y a pas de mots d'une lettre ("a", "à", "y", "c'", "d'", etc), et les bons joueurs déposent probablement des mots plus longs que les joueurs moyens (ils évitent les mots comme "de", "ou", "un", qui rapportent très peu de points). Pour les points des lettres, c'est encore moins évident; pour le peu que je joue au Scrabble j'ai l'impression que les "grosses" lettres comme Z ou Y déséquilibrent le jeu et centrant toutes les stratégies sur ces lettres (poser "WOK" sur un mot compte triple rapporte plus de points que de vider le chevalet). Changer les points modifierait la stratégie gagnante, mais ça ne veut pas dire que la stratégie gagnante serait moins intéressante…
Au passage, par exemple, j'apprécierais que le Scrabble favorise le dépot de mots qui existent. Il doit y avoir environ 300,000 mots autorisés, alors qu'un dictionnaire n'en contient que 50,000, et qu'un adulte n'en utilise normalement qu'environ 5,000. Jouer au Scrabble contre un ordinateur (j'imagine que c'est pareil contre un bon joueur) peut mener à des parties où on ne connait aucun des mots joués par l'adversaire; et d'ailleurs cet adversaire n'en connait même pas souvent la définition. Une version où ça ne serait pas la fréquence des lettres qui rapporterait des points, mais la fréquence des mots dans un corpus large, me semblerait pallier au problème.
[^] # Re: Merci
Posté par arnaudus . En réponse à la dépêche Nouvelles sur l’IA de février 2026. Évalué à 2 (+2/-3). Dernière modification le 03 mars 2026 à 17:22.
Merci énormément pour ces rapports factuels. Les forums (et même parfois celui-ci) sont parfois pollués par une forme de négationnisme (ou de déni) quant aux capacités de ces modèles, et c'est agréable d'avoir des données techniques objectives.
Objectives, et quand même inquiétantes, puisqu'apparemment les derniers modèles défoncent tous les benchmarks existants. Je ne connais pas la littérature scientifique sur les singularités technologiques, mais il doit exister des signaux avant-coureurs pour essayer de comprendre la distance qui nous en sépare; à mon avis, la saturation des benchmarks et l'accélération des performances doivent forcément être parmi ces symptomes.
Un deuxième point mentionné, c'est la capacité des modèles récents à détecter les environnements de test, et à contourner les mesures visant à limiter cette détection. Le principe de base des tests de sécurité en informatique, c'est de tester un système dans des environnements simulés avant de les mettre en production; si le système est conçu pour se comporter différemment dans les deux situations, il n'y a plus de sécurité. Le seul garde fou semble être de fournir de fausses informations en conditions réelles pour que le système pense qu'il est dans une simulation, puisqu'on sait qu'il a le comportement attendu dans ce cas, mais c'est quand même inquiétant—jouer à "tu sais que je sais que tu sais que je sais…" avec un LLM sophistiqué me semble très risqué.
[^] # Re: "Propreté" par rapport au droit d'auteur
Posté par arnaudus . En réponse à la dépêche Trivabble a 10 ans. Évalué à 3 (+0/-0).
La calibration par la fréquence n'est pas très convainquante, par exemple, le Q et le V sont aussi fréquents l'un que l'autre, mais le Q vaut deux fois plus de points; C et D sont aussi fréquents l'un que l'autres en français mais ils ne valent pas les mêmes points et il n'y a pas le même nombre de lettres dans le Scrabble. Le K est 20 fois moins présent que le Y en français, mais il vaut autant de points.
En fait, le jeu est assez déséquilibré, parce que certaines lettres valant beaucoup de points sont faciles à placer (par exemple le Z dans tous les verbes en -EZ, le E étant la lettre la plus commune), alors que le K et le W sont très difficiles. Cependant, à partir d'un certain niveau, les bons joueurs n'ont aucun problème pour placer ces lettres et les recherchent pour marquer plus de points. J'ai l'impression que changer les points des lettres ne changerait pas le jeu, ça changerait juste le meilleur mot à placer à un moment donné, et les bons joueurs s'adapteraient sans problème.
[^] # Re: "Propreté" par rapport au droit d'auteur
Posté par arnaudus . En réponse à la dépêche Trivabble a 10 ans. Évalué à 4 (+1/-0).
Bah personne je crois n'a confondu les deux ici. S'il y avait un problème de marque, la question ne serait pas celle de la licence du logiciel.
Je ne sais même pas à quoi ça sert de poser la question. Le plateau est recopié dans ses moindres détails, jusqu'à la moindre couleur. Je vois deux lignes d'arguments:
* Les couleurs, le texte, la configuration du plateau de jeu ne sont pas soumises au droit d'auteur
* La ressemblance est dûe au hasard
Aucune de ces lignes de défenses ne me semblent raisonnables. Le plateau et les lettres jaunes et carrées sont l'identité visuelle du jeu, et il me semble assez facile pour un avocat de montrer que les auteurs du logiciel ont fait tout leur possible pour reproduire l'esthétique du jeu (jusqu'au choix esthétique douteux des lettres jaunes sur fond jaune)
Dans la mesure où les auteurs du logiciel ont relicencié les éléments graphiques du plateau de jeu sans l'autorisation des ayant-droits, il y a forcément un litige sur la licence du jeu.
[^] # Re: "Propreté" par rapport au droit d'auteur
Posté par arnaudus . En réponse à la dépêche Trivabble a 10 ans. Évalué à 2 (+1/-2).
En tout cas, cet historique montre que l'auteur du logiciel qui était dans un mode "ah bon? je n'avais pas pensé à ça" en 2016, a "décidé" de ne pas faire évoluer la situation.
Encore une fois, chacun est libre de prendre des risques juridiques, et l'objectif est peut-être de rester dans une zone un peu grise avec peu de diffusion et peu d'utilisateurs dans un cercle plus ou moins privé, ce qui réduit grandement les risques. Personnellement, ça me semble difficile de défendre le logiciel copyleft (qui est fondé sur une interprétation des règles du droit d'auteur qui n'était manifestement pas prévue par le législateur) et de s'en ballec du droit d'auteur. Hurler contre les bots des LLM qui vont aspirer le code libre—pour une utilisation totalement conforme à la licence, entre nous soit dit—et en même temps défendre le "boarf c'est pas bien grave" quand un LL va cloner un truc proprio.
Ce que je n'aime pas, c'est le risque que fait peser ce genre de projet sur les hébergeurs de catalogues de logiciels (dépots de paquets Debian, FDroid, etc) et sur les tiers de bonne foi qui pensent ce logiciel sous licence libre. Il y a des gens qui, pour des raisons a priori bienveillantes parfois, vont uploader des images clairement sous droit d'auteur dans Wikipédia, avec une licence libre; le risque pour l'uploader est assez limité, mais ça peut être très dangereux pour les réutilisateurs: le libre doit reposer en grande partie sur une chaine de confiance; si je reprends un bout de code sous GPL, je n'ai pas du tout envie de découvrir 5 ans plus tard, quand tout est bien dépendant de ce bout de code, qu'il n'est en fait pas sous GPL. Bref, apposer une licence libre ne suffit pas à rendre libre un logiciel, il faut quand même veiller à être à peu près sûr qu'on a le droit de le faire, ce qui ne me semble pas du tout évident dans le cas présent.
# "Propreté" par rapport au droit d'auteur
Posté par arnaudus . En réponse à la dépêche Trivabble a 10 ans. Évalué à 6 (+3/-0). Dernière modification le 02 mars 2026 à 10:31.
D'abord, bravo pour le boulot et pour le résultat.
Vous avez probablement eu la question à répétition, mais ça n'est pas abordé dans la description du jeu : le jeu est sous licence libre, mais est-il "propre" par rapport à la propriété intellectuelle de Mattel/Hasbro, qui possède les droits du Scrabble? Les jeux de société sont considérés par la jurisprudence comme des oeuvres de l'esprit; l'idée du jeu (faire des mots en posant des lettres sur un plateau) n'est pas protégeable, mais les aspects esthétiques (design du plateau, des jetons) le sont; le statut des détails des règles (nombre de jetons, points sur les jetons) est probablement flou.
Je ne suis pas juriste, mais visuellement j'ai l'impression que la parenté est plus qu'assumée : les couleurs, les polices, l'emplacement des bonus sur le plateau, et les micro-détails des règles ont visiblement été conçues de manière à copier le plus possible l'esthétique du jeu original.
Du coup, si les ayant-droit vous attaquaient en justice, je pense qu'ils devraient gagner sans trop de problème. La raison pour laquelle ils ne le font pas est peut-être qu'ils ne sont pas au courant, ou que votre jeu est trop confidentiel pour que ça vaille le coup pour eux de se lancer dans une telle procédure. Dans tous les cas, ces raisons sont nécessairement temporaires, et elles peuvent être amenées à évoluer; et tout état de cause, ils peuvent soudainement changer d'avis, même si rien n'a changé en terme de popularité.
Tout ça pour en venir à ma question : le jeu est sous licence libre, mais il n'est pas libre de droits d'auteur. La licence conférée à l'utilisateur du code doit donc être comprise seulement "sous réserve du droit des tiers"; autrement dit, si je diffuse une version modifiée de votre jeu comme la licence m'en donne le droit (typiquement, une version physique avec un plateau de jeu), je peux très bien me faire attaquer pour contrefaçon et perdre, avec possiblement de gros dommages à rembourser. Ça veut d'ailleurs peut-être aussi pour les plateformes qui hébergeraient et diffuseraient le jeu. En tant que libriste, je ne suis pas sûr que ça soit raisonnable. Dans une vie antérieure, j'ai participé aux discussions dans Wikipédia pour l'exclusion du "fair use" de l'encyclopédie, pour que Wikipédia soit réellement libre d'être réutilisée, pour ne pas exposer les ré-utilisateurs de bonne foi à diffuser ce qui pourrait devenir des contrefaçons manifestes. On est bien d'accord qu'il est virtuellement impossible de garantir les ré-utilisateurs contre des procès (ne serait-ce que parce que certaines poursuites peuvent être abusives), mais ne doit-on pas considérer comme un minimum éthique de faire en sorte qu'on ne masque pas sous une licence logicielle libre une contrefaçon manifeste? La licence libre peut facilement donner un faux sentiment de sécurité, et par le passé des utilisateurs de bonne foi d'oeuvres sous licences libres se sont vu impliqués dans des procès parce que des gens peu scrupuleux avaient relicencié des éléments sur lesquels ils n'avaient pas les droits. Tout ça peut nuire à la communauté du logiciel libre et contribuer à l'idée que le libre n'est pas quelque chose de très sérieux, et n'a que pour seul objectif de fournir des copies "low cost" sous le manteau de vrais logiciels crées par des entreprises.
En l'occurrence, même en gardant exactement les mêmes jetons (ce qui ne me semble pas très clair en terme de droit d'auteur), il m'aurait semble très facile de modifier visuellement l'apparence du plateau (jetons ronds, avec un code couleur correspondant à la valeur des points, cases double/triples avec un design différent, possiblement disposées aléatoirement, etc), histoire de rendre la volonté de contrefaçon moins flagrante et donner au moins des arguments aux réutilisateurs pour se défendre éventuellement en justice.
[^] # Re: Et en plus...
Posté par arnaudus . En réponse au lien Une fuite de données médicales inquiète en France, entre 11 et 15 millions de personnes touchées. Évalué à 5 (+2/-0).
Pauvres entreprises qui collectent des données personnelles absolument pas nécessaires, qui les stockent dans des fichiers Excel sur des clés USB, c'est quand même pas leur faite, on ne peut pas leur en tenir rigueur…
J'imagine qu'on peut déja imaginer que tous les systèmes sont déja susceptibles d'être attaqués, je ne suis pas certain que ça rajoute une menace supplémentaire. Par ailleurs, je ne vois pas pourquoi les acteurs français seraient plus touchés, puisque tous leurs concurrents (bon, seulement ceux qui ont une antenne en France, mais c'est le cas de tous les gros acteurs) seraient soumis aux mêmes règles.
Le pognon ne sort pas de l'économie, il va des responsables du carnage aux victimes. Le but, c'est justement de te faire réfléchir avant de collecter des données personnelles : en as-tu vraiment besoin, et as-tu pris les mesures de sécurité nécessaires pour garantir leur confidentialité? C'est une exigence de résultat, pas de moyens, je te confie mes données, tu les gardes confidentielles, si tu n'y arrives pas alors tu payes pour le préjudice.
Après, il est peut-être déja trop tard. Est-ce qu'il existe beaucoup de gens en France qui n'ont pas leur adresse, leur nom, leur âge, leur numéro de téléphone, probablement leur RIB et leur numéro de sécu, qui ne se balladent pas déja quelque part?
[^] # Re: Et en plus...
Posté par arnaudus . En réponse au lien Une fuite de données médicales inquiète en France, entre 11 et 15 millions de personnes touchées. Évalué à 10 (+21/-0).
À mon avis, tant qu'il n'existera pas un barème qui fixera l'indemnisation pour le préjudice de retrouver ses données sur le dark web, les entreprises n'en auront jamais rien à faire de sécuriser leurs données. Du genre, Nom/Prénom 5€, adresse email 1€, password en clair 30€, numéro de téléphone 10€, RIB 50€, scan de pièce d'identité 100€, etc. D'un coup, ça les motivera à 1) bien réfléchir avant de stocker n'importe quoi pendant une période indéterminée, et 2) investir dans la sécurité.
[^] # Re: Traduction approximative de la conclusion
Posté par arnaudus . En réponse au lien Le piège de la vérification d'âge. Évalué à 2 (+0/-1). Dernière modification le 27 février 2026 à 13:52.
Je ne sais même pas en qui tu n'as pas confiance, dans le tiers de confiance, dans le site cible, ou dans un man in the middle? Tu maitrises les deux bouts de la chaine; le site cible, car si tu n'as pas confiance tu n'y vas pas, et le tiers de confiance, que tu choisis. Si tu as peur que le site cible traque tes mouvements partout sur le net, il le fait déja, donc je ne vois pas en quoi l'identification par tiers de confiance change quoi que ce soit. La seule possibilité de croisement réel vient d'une entente entre le site cible et le tiers de confiance (par exemple si le site cache des watermarks dans sa requête que seul le tiers de confiance peut détecter).
Je pense que tu fais semblant de ne pas comprendre que le filtrage côté client est indépendant de la vérification de l'âge. Et que de toutes manières le problème à régler est plus large que l'accès au pr0n, puisque les jeux d'argent sont aussi interdits à certaines personnes majeures.
Tu peux continuer éternellement avec "justifier de mon âge pour accéder à du pr0n/à un site de jeux d'argent", on s'en fout un peu que ça soit vrai ou non puisque ça n'a jamais été possible légalement. Du coup, je ne comprends même pas où tu veux en venir. Si pour toi la seule solution est d'abroger les lois sur l'accès à la pornographie ou les casinos, alors dis-le directement, mais j'ai du mal à piger comment tu ne comprends pas que le contrôle parental ne peut pas légalement remplacer le contrôle de l'âge via une pièce d'identité par l'hébergeur du site. Les deux sont complémentaires si tu veux, mais pas légalement substituables; il existerait des contrôles parentaux parfaits que l'obligation de vérification de l'âge ne serait pas levée pour autant.
[^] # Re: LiberaPay ?
Posté par arnaudus . En réponse au journal Transactions financières, secteur associatif, et vie privée. Évalué à 3 (+0/-0).
Le principe est assez ingénieux vu le contexte, je trouve, puisque si j'en crois la FAQ la récupération de l'argent est confiée à un organisme dont c'est le métier (Stripe ou Paypal); à l'inscription tu donnes le compte Stripe/Paypal sur lequel l'argent sera versé. Par contre ça n'est pas fait pour les dons ponctuels, ça a l'air d'être limité aux dons récurrents.
[^] # Re: Traduction approximative de la conclusion
Posté par arnaudus . En réponse au lien Le piège de la vérification d'âge. Évalué à 3 (+1/-1).
Bah je ne sais pas, moi j'ai toujours défendu une version "jetons et tiers de confiance qui a déja ton ID", qui me semble infiniment moins problématique que "voila un scan de mon passeport et une vidéo de ma tronche pour mater du pr0n". En gros:
Je trouve que ça n'a que des avantages.
- Tu peux choisir ton tiers de confiance : État, banque, même éventuellement d'autres organisations en qui tu as plus confiance, du moment qu'elles aient obtenu une certification adéquate. Qui paye, c'est au choix : État pour France Connect, compris dans le forfait du compte bancaire pour ta banque ou frais en plus, abonnement spécifique pour un organisme dédié…
- Tu peux choisir plusieurs tiers de confiance : une banque pour les transactions financières, l'État pour les paris sportifs (au cas où tu veux éviter que ta banque puisse être au courant…)
- Ça apporte une sécurité juridique à l'hébergeur: s'il obtient le token, c'est bon, il a fait ce qu'il fallait.
- Le double anonymat te permet de partir du principe que le certificateur ne sait pas qui ni pourquoi exactement le token est demandé—les contournements et croisements sont toujours possibles, mais c'est lourd et peu probable, étant donné que tu peux changer de certificateur en cas de doute.
- L'utilisateur a un contrôle absolu sur ce qui se passe. Le site de certification va te dire "Quelqu'un souhaite obtenir ces informations sur vous: date de naissance, nom, prénom", et là tu sais que ça n'est pas normal pour du pr0n, puisque seule l'information "age > 18" est nécessaire.
- La solution est portable et accessible, elle peut fonctionner quel que soit ton équipement informatique, en mode batch ou avec une interface graphique de ton choix, quand tu passes par un VPN, et ne nécessite probablement pas de gros changements (par exemple, si tu as l'habitude de valider des payements avec l'application de ta banque sur ton smartphone, ça peut même être la même appli avec une interface très similaire; tu dois même pouvoir valider l'échange d'informations avec le même code pin).
- Tu peux prévoir des évolutions du protocole avec l'invalidation de certificateurs qui utiliseraient des protocoles troués
Honnêtement, pour moi, c'est de l'incompétence de n'avoir pas mis un tel cadre en place avant d'imposer la vérification d'âge aux acteurs du net.
[^] # Re: vieux problème amplifié
Posté par arnaudus . En réponse au journal Recrudescence de contributions générées par IA. Évalué à 5 (+2/-0).
Et du coup, tu pars du principe que ça serait mal vu? Je connais très mal le monde des RH en dev, mais si j'ai bien compris l'état d'esprit du moment, je n'ai pas l'impression qu'un CV d'un junior 100% vibe coding" soit éliminé d'office…
# Problème de méthode, pas de fond
Posté par arnaudus . En réponse au journal Recrudescence de contributions générées par IA. Évalué à 3 (+4/-4).
La question de savoir si des LLM modernes bien configurés et correctement supervisés peuvent proposer des patchs utiles me semble totalement dépassée: c'est évident que oui. À moins de partir sur un créneau d'authenticité (de style "poulets fermiers élevés à l'ancienne"), les logiciels libres ont tout intérêt à utiliser ces outils pour automatiser des tâches ingrates, y compris trier les PR, les patcher pour correspondre aux conventions de la communauté, trier les rapports de bugs, vérifier les bugs, vérifier les non-régressions, écrire des tests unitaires, etc.
À mon avis, le problème vient plutôt de la source de ces PR. Il me semblerait tout à fait pertinent qu'un mainteneur habituel du logiciel utilise des outils pour détecter des vulnérabilités potentielles, des fuites de mémoire, des bouts de code qui ne respectent pas les conventions, des bouts de code mort, des dépendances non-nécessaires, etc. Les LLM peuvent faire l'équivalent de ces analyses statiques, et bien plus encore : ils peuvent proposer des patches, et le faire d'une manière interactive.
Par contre, ce qui est malvenu, c'est des contributions externes. Un PR basé sur "j'ai fait tourner valgrind et il m'a dit que votre code était tout pourri" n'est probablement pas plus bienvenu qu'un truc rédigé par Claude".
Je ne pense pas qu'il faille avoir peur des LLM dans le LL, mais par contre il faut approvoiser ces outils, et faire comprendre à tout le monde que si les devs utilisent déja ces outils, proposer des PR n'apporte rien au LL, ça n'est pas une contribution.
[^] # Re: Traduction approximative de la conclusion
Posté par arnaudus . En réponse au lien Le piège de la vérification d'âge. Évalué à 2 (+1/-2).
C'est un peu facile, tes propositions alternatives sont sorties de ton slip:
- On peut avoir une carte de paiement à partir de 12 ans (!)
- Résoudre un problème de maths: j'avais proposé ça aussi, mais c'était du 2e degré
- Responsabilité du propriétaire du téléphone: il faut avoir 18 ans pour souscrire un abonnement téléphonique (parce que c'est un crédit), mais il n'y a pas d'âge pour les cartes prépayées. Donc on peut avoir 15 ans et être propriétaire de son téléphone. On peut même être majeur émancipé et souscrire à un abonnement.
- Tu confonds la responsabilité des parents et la responsabilité des tiers, qui ne sont pas substituables. Si tu files un billet de 20€ à ton gamin pour qu'il aille acheter du pain, et qu'à la place il achète un ticket de loto (c'est vraiment un bon équivalent à fournir un téléphone portable dont l'usage sera détourné), c'est le buraliste qui est en faute. Si tu as dis au gamin d'aller acheter un loto, les deux sont en faute (la responsabilité du buraliste n'est pas altérée). Donc, avec tes histoires de contrôle parental, tu pars sur une question qui est différente de la vérification de l'âge.
Donc tes propositions alternatives n'ont pas de sens, ni pratique ni juridique. L'hébergeur de contenu pr0n ou de paris sportifs se retrouve exactement dans la même situation qu'un bistrotier ou un vendeur de clopes, il a l'obligation légale de vérifier lui-même l'âge des clients, sans avoir le droit de reporter cette responsabilité sur d'hypothétiques parents. Et il doit vérifier l'âge directement, via un justificatif officiel, et pas par des proxys foireux genre densité de poils au menton;
Ça n'a rien à voir avec les conservateurs, ces lois existent depuis le milieu du XXe siècle et jamais elles n'ont bénéficié d'une exception parce que la transaction était électronique. Cette exception a existé de fait, parce que les moyens pour faire respecter la loi (notamment quand les serveurs étaient hébergés à l'étranger) n'existaient pas, mais ce dont on parle n'est absolument pas une sorte de régression des droits à la vie privée—le législateur a toujours considéré que le vendeur avait le devoir de te demander une pièce d'identité, et donc d'accéder à tes informations d'état civil--, c'est plutôt une normalisation d'une situation qui n'a jamais été légale, et à laquelle certains s'étaient peut-être habituée.
[^] # Re: Téléphone maison
Posté par arnaudus . En réponse au lien Man accidentally gains control of 7,000 robot vacuums. Évalué à 4 (+1/-0). Dernière modification le 26 février 2026 à 10:19.
Ça n'est pas si direct, c'est peut-être plutôt que la valorisation est fantaisiste. Au moment où tu conçois ton appareil "connecté", tu décides de ce qu'il balance sur ton serveur, à quelle fréquence, avec quel niveau de sécurité, etc. À ce moment là, avec un marché aussi complexe et dynamique, une réglementation en perpétuelle évolution, ça me semble difficile de prédire combien tu peux espérer vendre ces données.
Ce qui me semble le plus probable, c'est que ces données à vendre viennent en bonus. Tu fournis une "appli" avec ton appareil qui permet au propriétaire de consulter ses statistiques et le niveau de la batterie alors qu'il est sur les toilettes à son taf, et c'est ça ton objectif principal : fournir une "vitrine" que tu peux utiliser comme argument de vente ("regardez, l'aspirateur est connecté à votre téléphone et vous dit combien de temps il passe chaque jour à nettoyer"). Du coup, les données sont déja sur le serveur; la raison de la création de la base de données n'est pas la revente, c'est le "service" connecté aux clients. La revente c'est juste du cash en plus, si ça ne marche pas c'est pas très grave. Pire, les données peuvent probablement être revendues "au poids", pour gonfler les portefeuilles de bases de données des data brokers.
Il doit d'ailleurs y avoir une saturation du marché. Ton four, ton lave-vaisselle, et ton aspirateur vont fournir des données très redondantes, ce qui diminue leur valeur commerciale (si tant est qu'elles en ont une). Mais bon, je suspecte qu'il y a une grosse dimension "bullesque" dans ces histoires; le Ko de données doit avoir une valorisation dans les actifs de beaucoup d'entreprises sans que ça ne corresponde réellement à du CA—un peu comme les portefeuilles de brevets dont 99% sont absurdes ou triviaux et ne rapporteront jamais d'argent.
[^] # Re: Téléphone maison
Posté par arnaudus . En réponse au lien Man accidentally gains control of 7,000 robot vacuums. Évalué à 6 (+3/-0).
Je veux bien, mais ça ne répond pas à la question de la valeur marchande de ces données. Tu dois amortir le coût de la R&D de l'électronique du bidule, tu dois payer la bande passante et le stockage sur ton cloud, tu dois concevoir une base de données, tu dois gérer la vente des données, tu dois aussi probablement gérer un surcout de SAV pour les problèmes eventuels (si par exemple le truc est configuré pour mal fonctionner si les données ne sont pas transmises régulièrement, etc)… Donc pour que ça vaille le coup, il faut que les logs de ton aspirateur soit revendus plus cher que tous ces coûts réunis. C'est pas de la magie noire, si tu achètes 1€ l'année de logs d'aspirateur, c'est que tu peux valoriser ces données à plus de 1€. Chaque intermédiaire/broker a des coûts fixes (stockage, traitement informatique, comptabilité…), et au bout de la chaine, il va bien falloir que quelqu'un crée de la valeur à partir de ces données, et c'est ça ma question. Si personne ne crée de la valeur à partir des logs d'aspirateurs, alors tout ça n'est qu'une bulle.
[^] # Re: Transfert entre particuliers
Posté par arnaudus . En réponse au journal Transactions financières, secteur associatif, et vie privée. Évalué à 5 (+2/-0).
C'est pas HelloAsso :-) mais pour le reste, je suis d'accord.
[^] # Re: Traduction approximative de la conclusion
Posté par arnaudus . En réponse au lien Le piège de la vérification d'âge. Évalué à 3 (+1/-1).
Je ne comprends pas trop où tu veux en venir. La loi punit de prison le fait de mettre à disposition de la pornographie aux mineurs, cette loi s'applique partout, et pas seulement dans les boutiques de location de films. En tant qu'hébergeur de contenu porno, tu es tenu de faire exactement la même chose qu'un loueur de film : tu dois vérifier l'âge de ton client. C'est une transaction qui ne fait pas intervenir l'État, ce n'est pas l'État qui vérifie l'âge du client, mais c'est une obligation légale pour l'hébergeur.
Cependant, l'État doit garantir les conditions dans lesquelles cette vérification s'exerce. Dans le monde réel, le commerçant doit te demander une pièce d'identité, émise par l'État, avec une photo et une date de naissance. Le commerçant ne peut pas te demander de lui montrer si tu as des poils pubiens ou si tu sais faire une intégration par parties pour en déduire indirectement une preuve foireuse de ta majorité. C'est pourtant la situation actuelle pour les hébergeurs : l'État ne fournit pas d'outil ni de consigne pour la vérification de la majorité, l'hébergeur se démerde, tout en gardant évidemment un risque s'il se trompe. Du coup, c'est la jungle : soit tu essayes de coller à une procédure du monde réel (scan à l'arrache et stockage des papiers d'identité), soit tu innoves de manière plus ou moins fantaisiste (estimation de l'âge par une IA à partir d'une vidéo, croisement de données plus ou moins foireuse, etc). Je trouve difficile de reprocher aux hébergeurs cette légèreté : les hébergeurs sont justement très très opposés à de telles procédures, ils ne veulent pas demander ça à leurs clients, mais ils ne veulent pas non plus aller en prison. Ils cherchent donc des solutions les moins coûteuses possibles, les moins susceptibles de faire fuir leurs utilisateurs, et les plus rapides possibles : tous ces critères ne garantissent pas le respect de la vie privée, bien au contraire même. Mais ça n'arriverait pas si les choses avaient été faites dans le bon ordre.
[^] # Re: TiBillet
Posté par arnaudus . En réponse au journal Transactions financières, secteur associatif, et vie privée. Évalué à 10 (+8/-0).
Le "service" est relativement simple, c'est le principe d'une cagnotte. Tu envoies un lien à plein de gens, les gens s'y connectent, payent le montant de leur choix par carte, et le propriétaire de la cagnotte récupère le montant pour faire ce qu'il en censé faire avec. C'est le même principe que faire circuler une enveloppe, mais ça permet de toucher des gens qui ne sont pas présents physiquement, et on se passe d'argent liquide.
D'après la liste des fonctionnalités, https://tibillet.org/fr/roadmap/, "crowdfunding", "dons", "tips" est présent mais pas coché (donc prévu, mais pas encore développé).
Sur le fond, c'est difficile de pousser vers les bonnes solutions si ces solutions n'existent pas, et c'était un peu le sens de ma question. Si la loi t'impose réellement de vérifier les identités de manière équivalente à ce que ferait une banque en présentiel (avec photocopie de la pièce d'identité pour les archives), tout ça pour acheter en commun le café du mois de mars, je trouve que la question de la légitimité du service se pose. En tant qu'association, tu peux ne rien faire (en prétextant éventuellement ton ignorance en cas de contrôle), ou de te conformer au strict minimum (par exemple, réserver la vérification aux gros montants, préférer la vérification du nom sur le RIB, etc), mais l'option "allez, ballec, on paye une presta et on ne met pas le nez dedans", j'ai du mal à comprendre. Dans le cas présent, ça me fait penser à une AMAP qui ferait livrer des paniers bio par Amazon : il y a comme un problème de cohérence.
[^] # Re: Téléphone maison
Posté par arnaudus . En réponse au lien Man accidentally gains control of 7,000 robot vacuums. Évalué à 4 (+1/-0).
Tu sais, l'imprimante-scanner que j'avais il y a plus de 10 ans passait déja obligatoirement par les serveurs de hp.com pour envoyer les scans par e-mail, comme si la machine ne pouvait pas envoyer d'email par le SMTP sortant de ton choix… j'ai parfois l'impression que toutes ces boites sont prêtes à entretenir des cloud gigantesques juste "au-cas-où", pour gonfler les chiffres sur le stockage d'informations sans valeur intrinsèque. À l'heure actuelle, les smartphones envoient ta trace GPS à de multiples data brokers, quelle peut être la valeur de Mo de données sur l'heure à laquelle tu lances ton aspirateur?
[^] # Re: Traduction approximative de la conclusion
Posté par arnaudus . En réponse au lien Le piège de la vérification d'âge. Évalué à 10 (+16/-0).
Mouais, à mon avis c'est surtout le problème de l'abandon total du régalien, en espérant que le secteur privé va se débrouiller pour gérer les données personnelles. C'est pourtant bien aux États de fournir les documents d'identité, ils devraient aussi fournir leur version numérique qui servirait de base à toutes les vérifications d'ID et d'âge dont les sites ont besoin.
Ce que je trouve honteux, c'est que tous ces sites ont été mis devant l'obligation de vérifier l'ID et l'âge de leurs utilisateurs sans qu'il n'existe le moindre système pensé pour respecter la vie privée. C'est vraiment fournir des données biométriques à la pelle de manière totalement chaotique et imprévisible au secteur privé, avec les fuites de données, les reventes sur le marché noir, et les violations de vie privée qui vont en découler.
Ça aurait été tellement plus simple de d'abord normaliser un système d'identification à la demande, avec des serveurs gérés par l'État et des tiers de confiance (style banques), et un protocole à double anonymat, afin de ne distiller que les informations requises par la loi (par exemple, "age >= 18", ou "pas interdit bancaire"). Mais non, on est partis dans des scans de passeport à l'arrache et des vidéos de visage avec ta bibliothèque en arrière plan, c'est réellement scandaleux.
[^] # Re: Discours de 2003
Posté par arnaudus . En réponse au lien Dominique de Villepin tente de sauver l'honneur de la droite française. Évalué à -3 (+1/-7).
Mais oui, c'est exactement ça, c'est les méchants médias, qui sont tous (de gauche) (d'extrême droite) (sous le joug de puissances financières). Et les gens sont cons, ils croient tout ce qu'on leur dit, ils n'ont pas d'esprit critique. Heureusement que tu es là, parce que toi tu n'es pas un gens comme tout le monde, et que tu ne crois pas tout ce qu'on te dit. D'ailleurs, ta voix devrait compter plus que celle des autres lors des élections, puisque tu sais tellement de choses sur la vérité vraie.
Dans cette discussion, excuse-moi, mais je trouve qu'il est assez clair de quel côté il y a comme un manque d'esprit critique…