Le sondage proposé sur LinuxFr.org concernant l'acceptation des contenus générés par IA reflète des enjeux importants pour une communauté axée sur l'open source et les logiciels libres. Voici une analyse structurée des options et des implications :
1. Enjeux principaux :
Éthique open source : La communauté privilégie les outils et données libres. L’option 2 (moteurs/libres) s’aligne sur ces valeurs, mais soulève des questions techniques (existe-t-il des IA "libres" performantes ?).
Qualité et authenticité : Les craintes de contenus superficiels, erronés ou déshumanisés justifient l’option 5 (« Non »). Les IA génératives peuvent amplifier la désinformation ou le plagiat.
Transparence : Même si un contenu est généré par IA, son origine doit être clairement indiquée (non évoqué dans le sondage, mais crucial pour la confiance).
Modération : Un afflux de contenus automatisés pourrait saturer les modérateurs, surtout sans cadre strict.
2. Analyse des options :
« Oui » : Risque de dilution de la valeur humaine et communautaire, mais pourrait enrichir le site (ex. traduction automatique, génération de résumés).
« Oui, mais avec des outils/libres » : Cohérent avec l’éthique du libre, mais restrictif (les modèles libres comme Llama ou Mistral sont moins accessibles que ChatGPT).
« Oui, avec résumé par IA » : Paradoxal (résumer un texte IA par une IA ?) et peu pertinent sans contrôle humain.
« Oui, sur certains contenus » : Pragmatique, mais nécessite un consensus sur les catégories acceptables (ex. dépêches techniques vs débats).
« Non » : Protège l’authenticité, mais prive le site d’outils potentiellement utiles.
3. Recommandations :
Transparence obligatoire : Exiger une mention explicite de l’usage d’IA, quel que soit le choix final.
Encadrement strict : Limiter l’IA à des cas d’usage précis (ex. corrections grammaticales, synthèses de documentation) avec outils vérifiables.
Débat sur le "libre" : Définir collectivement ce qu’est une IA « libre » (modèle, données, infrastructure) avant de l’autoriser.
Expérimentation temporaire : Tester l’impact sur la qualité des contenus avant une décision permanente.
4. Conclusion :
La réponse idéale dépend de l’équilibre entre innovation et préservation de l’esprit communautaire. Une approche modérée (options 2 ou 4) avec des garde-fous (transparence, modération) semble plus viable qu’un rejet ou une acceptation totale. Le débat doit aussi intégrer des exemples concrets : comment d’autres plateformes (comme Wikipédia ou Mastodon) gèrent-elles ces défis ?
Mon avis :
Il est bien plus gentil et constructif que ce que j'ai à en dire ; il n'a pas dû saisir l'aspect éminemment trollesque (IMHO) de ce sondage. J'aime comme il souligne l'aspect "Paradoxal" de la 3ème option.
faut-il accepter des contenus générés par une Intelligence Artificielle Générative (aka GenAI) ?
J'ai pas compris la question.
C'est quoi un contenu généré par IA ?
On parle des liens, journaux, dépêches ?
C'est un contenu entièrement généra par IA puis copier-coller ?
Et si on précise le prompt et le modèle utilisés, ça va ?
C'est mieux ou moins bien qu'un contenu rédigé avec le pied et sans sources ?
Comment on sait que c'est généré par IA ?
On a une blacklist ? un outil de détection ? quels taux de faux positifs ? On vote ?
Le sujet commence à générer des débats au sein de LinuxFr.org
ah bon ! où ça ? ici ? prophétie autoréalisatrice ? Est-ce que ce sondage est le résultat de l'hallucination d'un LLM ?
Le ménage de printemps attendra. J'ai dégoté un pc avec deux emplacements M2. Boot depuis une clé, dd bs=32M if=/dev/sda of=/dev/nvme0n1 conv=fdatasync,notrunc iflag=direct oflag=direct, étendre la partition puis reboot puis dire au FS de prendre tout. 313MBps ~= 2.4Gbps, 25min pour la copie, c'est correct.
Après avoir fermé les 15 popups de medium, j'ai lu l'article.
Si je comprends bien, MAIF ouvre les sources d'un client python pour l'API de MeteoFrance.
Sympa mais ça ne règle pas le problème de l'accès à la données, toujours propriétaire de MF et protégée par Token - qu'il faut obtenir moyennant une souscription, j'imagine.
Ce commentaire ne sera pas sur LO en tant que tel, que j'utilise depuis tout temps, y compris sur les PC dont je ne peux pas changer l'OS et qui viennent avec toutes les cochonneries MS (LO + FF, pour rester saint d'esprit).
Un peu comme les étoiles de GH, je me demande ce que vaut cet indicateur. Est-ce que ça comprend les DL pour mise à jour, auquel cas le nombre d'utilisateur réel doit tourner autour de 30M. Est-ce que ça comprend les installations venant avec les installations de distro ? Est-ce que cela comprend les installations par le package manager d'une distro ?
Si l'indicateur est flou, on peut au moins regarder la tendance : c'est stable. Et ça affiche des millions, on peut donc dire que l'adoption semble non négligeable.
EDIT : ils expliquent :
no data is collected other than the click on the DOWNLOAD button
Ce qui ne permet pas vraiment de conclure sur la base installée. À priori, cela ne compte pas les màj, mais ça compte si je change de PC, mais pas si LO c'est installé avec la distrib.
Je ne porte pas le Musk dans mon cœur, loin de là, mais, La Pologne, c'est pas le pays qui a voté récemment des lois contre l'homosexualité et contre l'avortement ?
Pour ma part, c'est principalement pour de la réparation.
J'ai des enfants. Ils ont des jouets en plastique. Ils cassent. Je répare.
La plupart du temps, je modélise avec OpenSCAD ou alors je cherche des modèles sur les plateformes spécialisées.
Seul ton opérateur a cette information.
Ton opérateur connaît ton IMEI - il est sur la carte SIM et sert à authentifier l'abonné auprès du réseau - et à tout instant ton IP, la cellule (~=antenne) dans laquelle tu es.
Si il veut te géo-localiser, il doit lancer une action de triangulation à partir d'autres antennes dans les parages. Cela correspond à la localisation approximative de ton téléphone.
Ces informations (IMEI, IP, cellule) peuvent être récupérées par voie de justice ; le fameux "son téléphone a borné ici à telle heure" dans les films de police. L'information de géolocalisation n'est pas collectée et stockée de manière systématique mais doit probablement pouvoir s'obtenir par réquisition judiciaire.
A ma connaissance, les opérateurs ne revendent pas ces informations. Je ne sais pas si c'est par éthique (lol) par application de la loi ou plus simplement parce que ce ne serait pas vraiment économiquement intéressant. En effet les clients que ça intéresserait obtiennent l'information, souvent plus précise, gratuitement depuis le téléphone de l'utilisateur qui installe n'importe quelle applis et lui donne toutes les permissions :(
Je n'ai pas de compte nextimpact alors je pose ça ici:
Martin Clavey
Équipe
Aujourd'hui à 17h53
Je m'autocite mais " Si l'accès à celles-ci [les données de géoloc du GPS] peut être refusé, l’adresse IP de l’appareil est toujours disponible pour enregistrer des données de localisation approximative."
Non, un mobile ne peut pas être localisé à partir de son IP. Un mobile bouge, change d'antenne, mais son IP ne change pas en permanence.
Les IP sont prises dans le pool de l'opérateur. Elle change de temps en temps, disons chaque jour. Le plus souvent, elles sont localisé au siège de l'opérateur. Quelques fois dans une région quand les pools sont régionaux.
La localisation approximative est obtenue à partir de l'environnement radio : antennes GSM et Wifi. La localisation précise et approximative sont deux permissions différent et la seconde est souvent activée par défaut alors que la première demande la permission de l'utilisateur.
# Ce qu'en pense deepseek R1
Posté par steph1978 . En réponse au sondage Faut-il accepter les contenus générés par IA sur LinuxFr.org ?. Évalué à 0 (+10/-12).
prompt
texte
que penser de ce texte :
"""
[le texte du sondage]
"""
options
chain of thought et search online
réponse du LLM (non modifiée)
Le sondage proposé sur LinuxFr.org concernant l'acceptation des contenus générés par IA reflète des enjeux importants pour une communauté axée sur l'open source et les logiciels libres. Voici une analyse structurée des options et des implications :
1. Enjeux principaux :
2. Analyse des options :
3. Recommandations :
4. Conclusion :
La réponse idéale dépend de l’équilibre entre innovation et préservation de l’esprit communautaire. Une approche modérée (options 2 ou 4) avec des garde-fous (transparence, modération) semble plus viable qu’un rejet ou une acceptation totale. Le débat doit aussi intégrer des exemples concrets : comment d’autres plateformes (comme Wikipédia ou Mastodon) gèrent-elles ces défis ?
Mon avis :
Il est bien plus gentil et constructif que ce que j'ai à en dire ; il n'a pas dû saisir l'aspect éminemment trollesque (IMHO) de ce sondage. J'aime comme il souligne l'aspect "Paradoxal" de la 3ème option.
# gné
Posté par steph1978 . En réponse au sondage Faut-il accepter les contenus générés par IA sur LinuxFr.org ?. Évalué à 9 (+7/-0). Dernière modification le 05 février 2025 à 11:51.
J'ai pas compris la question.
C'est quoi un contenu généré par IA ?
On parle des liens, journaux, dépêches ?
C'est un contenu entièrement généra par IA puis copier-coller ?
Et si on précise le prompt et le modèle utilisés, ça va ?
C'est mieux ou moins bien qu'un contenu rédigé avec le pied et sans sources ?
Comment on sait que c'est généré par IA ?
On a une blacklist ? un outil de détection ? quels taux de faux positifs ? On vote ?
ah bon ! où ça ? ici ? prophétie autoréalisatrice ? Est-ce que ce sondage est le résultat de l'hallucination d'un LLM ?
# dédé ?
Posté par steph1978 . En réponse au message migration vers un nouveau disque interne. Évalué à 3 (+1/-0). Dernière modification le 04 février 2025 à 23:08.
Le ménage de printemps attendra. J'ai dégoté un pc avec deux emplacements M2. Boot depuis une clé,
dd bs=32M if=/dev/sda of=/dev/nvme0n1 conv=fdatasync,notrunc iflag=direct oflag=direct
, étendre la partition puis reboot puis dire au FS de prendre tout. 313MBps ~= 2.4Gbps, 25min pour la copie, c'est correct.# moui
Posté par steph1978 . En réponse au lien Simplifier l’accès aux données météo. Évalué à 5 (+3/-0).
Après avoir fermé les 15 popups de medium, j'ai lu l'article.
Si je comprends bien, MAIF ouvre les sources d'un client python pour l'API de MeteoFrance.
Sympa mais ça ne règle pas le problème de l'accès à la données, toujours propriétaire de MF et protégée par Token - qu'il faut obtenir moyennant une souscription, j'imagine.
# kpi
Posté par steph1978 . En réponse au lien LibreOffice : 400 millions de téléchargements depuis 2011. Évalué à 2 (+0/-0).
Ce commentaire ne sera pas sur LO en tant que tel, que j'utilise depuis tout temps, y compris sur les PC dont je ne peux pas changer l'OS et qui viennent avec toutes les cochonneries MS (LO + FF, pour rester saint d'esprit).
Un peu comme les étoiles de GH, je me demande ce que vaut cet indicateur. Est-ce que ça comprend les DL pour mise à jour, auquel cas le nombre d'utilisateur réel doit tourner autour de 30M. Est-ce que ça comprend les installations venant avec les installations de distro ? Est-ce que cela comprend les installations par le package manager d'une distro ?
Si l'indicateur est flou, on peut au moins regarder la tendance : c'est stable. Et ça affiche des millions, on peut donc dire que l'adoption semble non négligeable.
EDIT : ils expliquent :
Ce qui ne permet pas vraiment de conclure sur la base installée. À priori, cela ne compte pas les màj, mais ça compte si je change de PC, mais pas si LO c'est installé avec la distrib.
[^] # Re: Tant qu'il n'y aura pas la validation du n° c'est voué l'échec
Posté par steph1978 . En réponse au journal Vers l'interdiction du démarchage téléphonique en France !. Évalué à 2 (+0/-0).
Ok
Mais qui serait contrôlée par le client, pas par l'opérateur ?
[^] # Re: Tant qu'il n'y aura pas la validation du n° c'est voué l'échec
Posté par steph1978 . En réponse au journal Vers l'interdiction du démarchage téléphonique en France !. Évalué à 2 (+0/-0).
Comment on usurpe un numéro ?
# balayer devant sa porte
Posté par steph1978 . En réponse au lien Poland urges Tesla boycott after Musk’s call to ‘move past’ Nazi guilt . Évalué à 1 (+0/-1).
Je ne porte pas le Musk dans mon cœur, loin de là, mais, La Pologne, c'est pas le pays qui a voté récemment des lois contre l'homosexualité et contre l'avortement ?
[^] # Re: Contribution ?
Posté par steph1978 . En réponse au lien Meta va payer 25 millions de dollars à Trump après sa plainte sur la suspension de ses comptes. Évalué à 2 (+0/-0). Dernière modification le 30 janvier 2025 à 21:25.
Net d'impôts, le contributeur l'a dans l'os. si en plus il a un compte fb, c'est le pompon.
# les deux
Posté par steph1978 . En réponse au journal Let's Encrypt arrête l'envoi des mails prévenant de l'expiration des certificats. Évalué à 5 (+3/-0).
J'aurai dit le dernier. Au début, je le faisais mais maintenant c'est surtout du spam.
Clairement, tout l'intérêt de ACME, c'est d'automatiser ; d'ailleurs c'est dans le nom.
Et tout comme d'autres commentateurs, j'ai des jobs qui surveillent mes services et m'alertent si qqch ne va pas.
[^] # Re: L'heure des comptes
Posté par steph1978 . En réponse au lien Le modèle d'IA de la startup chinoise DeepSeek reconfigure le modèle économique du secteur. Évalué à 4 (+2/-0).
Au delà de la réponse très pertinente de @antistress
Si tu as testé les produits, tu comprends qu'ils puissent flipper.
Je n'ai pas eu accès à OpenAI/O1 parce que je n'ai pas 200e/mois à y mettre mais j'utilise GPT4 (20e/mois quand même).
J'utilise aussi DSR1 qui est opensource et gratuit en ligne.
Selon certains benchmark (non financés par OpenAI), DS-R1 est meilleurs que O1.
Ce qui est sûr c'est que les résultats que j'obtiens de R1 sont largement meilleurs que ceux obtenus avec GPT4.
[^] # Re: L'heure des comptes
Posté par steph1978 . En réponse au lien Le modèle d'IA de la startup chinoise DeepSeek reconfigure le modèle économique du secteur. Évalué à 2 (+1/-1).
C'est quoi les allégations de DeepSeek ?
[^] # Re: Sudo ?
Posté par steph1978 . En réponse au journal Ma configuration Debian Trixie. Évalué à 2 (+0/-0).
Gné ?
Si tu peux faire un
su
sans sudo/doas, ça veut dire que ton compte root a un mot de passe ?! je vois pas en quoi c'est recommandable.[^] # Re: La même année
Posté par steph1978 . En réponse au lien 24 janvier 1984, Steve Jobs lançait le Macintosh. Évalué à 3 (+1/-0).
ROFL
[^] # Re: Je dois passer a cote de quelque chose...
Posté par steph1978 . En réponse au journal Alors ? Vous êtes content de votre imprimante Bambu Lab ?!. Évalué à 4 (+2/-0).
Pour ma part, c'est principalement pour de la réparation.
J'ai des enfants. Ils ont des jouets en plastique. Ils cassent. Je répare.
La plupart du temps, je modélise avec OpenSCAD ou alors je cherche des modèles sur les plateformes spécialisées.
[^] # Re: Je trouve ce message problématique pour plusieurs raisons ...
Posté par steph1978 . En réponse au journal Pas de milliardaires au FOSDEM. Évalué à 2 (+1/-1).
[^] # Re: mais bien sûr ....
Posté par steph1978 . En réponse au lien Datastream, l’autre courtier qui possède des données de géolocalisation très invasives. Évalué à 2 (+0/-0).
Correction : IMEI est le numéro d'identification du mobile (de l'appareil). Sur la carde SIM, le numéro d'abonné, c'est IMSI.
[^] # Re: mais bien sûr ....
Posté par steph1978 . En réponse au lien Datastream, l’autre courtier qui possède des données de géolocalisation très invasives. Évalué à 2 (+0/-0).
Seul ton opérateur a cette information.
Ton opérateur connaît ton IMEI - il est sur la carte SIM et sert à authentifier l'abonné auprès du réseau - et à tout instant ton IP, la cellule (~=antenne) dans laquelle tu es.
Si il veut te géo-localiser, il doit lancer une action de triangulation à partir d'autres antennes dans les parages. Cela correspond à la localisation approximative de ton téléphone.
Ces informations (IMEI, IP, cellule) peuvent être récupérées par voie de justice ; le fameux "son téléphone a borné ici à telle heure" dans les films de police. L'information de géolocalisation n'est pas collectée et stockée de manière systématique mais doit probablement pouvoir s'obtenir par réquisition judiciaire.
A ma connaissance, les opérateurs ne revendent pas ces informations. Je ne sais pas si c'est par éthique (lol) par application de la loi ou plus simplement parce que ce ne serait pas vraiment économiquement intéressant. En effet les clients que ça intéresserait obtiennent l'information, souvent plus précise, gratuitement depuis le téléphone de l'utilisateur qui installe n'importe quelle applis et lui donne toutes les permissions :(
# interessant
Posté par steph1978 . En réponse au lien Proposition pour réduire la gestion des erreurs en Go par Ian Lance Taylor (un des mainteneurs). Évalué à 2 (+0/-0). Dernière modification le 16 janvier 2025 à 21:24.
ce commentaire
# le démon ?
Posté par steph1978 . En réponse au lien Attention, vulnérabilités critiques détectées pour rsync. Évalué à 3 (+1/-0).
j'ai lu des commentaires comme quoi cela n'impacterai que le démon rsyncd
donc plutôt des sites de miroir mais pas forcément l'utilisateur lambda qui va utiliser rsyn sur un tunnel SSH.
# mais bien sûr ....
Posté par steph1978 . En réponse au lien Datastream, l’autre courtier qui possède des données de géolocalisation très invasives. Évalué à 6 (+4/-0).
Je n'ai pas de compte nextimpact alors je pose ça ici:
Non, un mobile ne peut pas être localisé à partir de son IP. Un mobile bouge, change d'antenne, mais son IP ne change pas en permanence.
Les IP sont prises dans le pool de l'opérateur. Elle change de temps en temps, disons chaque jour. Le plus souvent, elles sont localisé au siège de l'opérateur. Quelques fois dans une région quand les pools sont régionaux.
La localisation approximative est obtenue à partir de l'environnement radio : antennes GSM et Wifi. La localisation précise et approximative sont deux permissions différent et la seconde est souvent activée par défaut alors que la première demande la permission de l'utilisateur.
[^] # Re: La description du passé est contestable
Posté par steph1978 . En réponse à la dépêche La virtualisation pour les nuls et autres enjeux autour des datacenters. Évalué à 3 (+1/-0).
Et on fait toujours comme ça. Avec systemd ou Docker ou tout autre gestionnaire de services.
# pinaillage proxmox
Posté par steph1978 . En réponse à la dépêche La virtualisation pour les nuls et autres enjeux autour des datacenters. Évalué à 2 (+0/-0). Dernière modification le 15 janvier 2025 à 09:52.
Proxmox est un outil de gestion de virtualisation mais pas un hyperviseur.
L'hyperviseur c'est celui du noyeau Linux : KVM. Mais il en gère d'autre.
[^] # Re: oui, mais
Posté par steph1978 . En réponse au lien Créer un système d'exploitation en un millier de lignes de code. Évalué à 3 (+1/-0). Dernière modification le 12 janvier 2025 à 11:55.
J'imagine que ça a un intérêt didactique ; ça démystifie la chose.
# oui, mais
Posté par steph1978 . En réponse au lien Créer un système d'exploitation en un millier de lignes de code. Évalué à 4 (+2/-0).
uniquement avec QEMU/KVM si j'ai bien compris.
ça relativise le nombre de ligne puisque cela ne support qu'un seul "matériel".