Il y a plein de sites Web / télés qui limitent selon le pays supposé de l'adresse IP. Ce qui est relativement rare ici (mais logique, vu le but de limiter les attaques par déni de service) est que c'est fait dans la couche 3, pas dans la 7.
Ce n'est pas la bonne description. HTTP/3 utilise QUIC et non pas UDP comme protocole de transport. QUIC ne peut pas tourner directement sur IP en raison de toutes les boxes àlakon qui bloquent les protocoles de transport inconnus, donc il utilise UDP mais ce n'est qu'un hack, fondamentalement, le protocole de transport de HTTP/3 est QUIC, pas UDP.
Il y a toujours du nouveau. Désormais, l'ISO a sorti une norme sur l'étiquetage des dialectes (ou variantes si on trouve le terme dialectes pas assez politiquement correct), ISO 21636. https://www.iso.org/standard/84965.html
Je ne l'ai pas lue (comme toutes les normes ISO, elle est payante et pas redistribuable) mais si quelqu'un de courageux l'a fait et peut résumer…
Les étiquettes de langue IETF permettaient déjà d'étiqueter les dialectes et plusieurs avaient été enregistrés.
Il est clair que différents groupes n'ont pas le même cahier des charges. Les linguistes peuvent apprécier la rapidité d'enregistrement d'une langue, dès que l'article est publié, mais les bibliothécaires et documentalistes préfèrent davantage de conservatisme car une fois enregistrée, une langue ne pourra plus être supprimée, même si la science montre qu'en fait c'était une erreur.
Sans compter le débat entre fusionnistes (ISO 639-2) et séparatistes (ISO 639-3), qui regroupe en partie (mais en partie seulement) la distinction documentalistes / linguistes.
La gestion de la norme est faite par l'IETF. En pratique, la liste de diffusion ietf-languages. Les subtags de langue collent à ceux d'ISO 639 donc suivent son rythme. Les subtags de variantes sont gérés localement et suscitent parfois des discussions animées, comme on les aime à l'IETF (récemment, les variantes du Ladin).
Il est curieux de ne pas avoir cité les étiquettes de langue IETF. Ce sont la forme normalisée à utiliser dans toutes les normes Internet (HTTP - Accept-Language et analogues - et HTML - lang=, par exemple).
Elles visent justement à résoudre deux des problèmes cités (granularité insuffisante et non-disponibilité de la norme). Le registre est à l'IANA.
Pas le seul, non. En environnement professionnel, c'est le grand gloubi-boulga dans la tête de beaucoup de gens, qui collent de l"aupène source" partout.
Ouh là, ça fait beaucoup, pour quelqu'un qui n'a pas eu le temps de tout regarder (c'est une conférence riche où la question « le libre, c'est politique » est effectivement importante mais pas unique).
Donc, deux choses : d'abord, bien sûr que le choix du logiciel libre est politique. Si je ne m'intéressais pas aux aspects politiques, j'utiliserai Chrome et Gmail (mais pas Windows, il ne faut quand même pas déconner). Pas au sens de la politique politicienne (je me fous de savoir qui va être premier ministre et si tel député de LR va être remplacé par tel député de Renaissance ou le contraire). Mais au sens de la vie dans un espace commun (les logiciels forment justement un commun), où il faut organiser et prendre des décisions.
Deuxième chose : tous les médias sont engagés, il y a ceux qui le disent, comme Arrêt sur Images et ceux qui le nient.
Tout est bien sûr délirant dans ce journal mais le plus beau est l'étude « validée par huissier ». Moi qui croyais que la science était validée par des scientifiques ! Prochaine release de mes logiciels, je mettrais que le code a été validé par huissier.
Le terme d'« open source » est déjà utilisé pour désigner tout et n'importe quoi par des journalistes ou marketeux paresseux. Mais, dans le monde des LLM, c'est bien pire. Si les auteurs de Meditron font manifestement un effort d'ouverture, leur modèle n'est pas parti de zéro, c'est un raffinage de Llama qui n'est absolument pas libre (par exemple, la licence interdit de l'utiliser pour développer un autre modèle, c'est comme si la licence de gcc interdisait de l'utiliser pour développer clang/LLVM). Il est donc probable que Meditron hérite de la licence (pas du tout « open source ») de Llama.
Petit ajout : il existe une norme ISO des écritures, qui liste toutes les écritures documentées, et leur attribue une code de quatre lettres (Latn = latin, Arab = arabe, Deva = devanagari, Vaii = vaï, etc).
À son tour, cette norme est utilisée dans les étiquettes de langue (language tags) que des normes comme HTTP utilisent ensuite. Ainsi, fa-Latn serait le persan en alphabet latin.
[^] # Re: Une belle dépêche :)
Posté par Stéphane Bortzmeyer (site web personnel, Mastodon) . En réponse à la dépêche Haiku a 23 ans - Haiku R1 bêta 5 (partie 1 : applications). Évalué à 5.
Je suis surtout heureux qu'on puisse enfin compiler du Fortran sur Haiku !
Blague à part, je plussoie aussi, bravo pour le travail et pour la dépêche détaillée.
# Réparé
Posté par Stéphane Bortzmeyer (site web personnel, Mastodon) . En réponse au lien Pour se protéger de l'étranger, bloquons les accès de l'extérieur. Évalué à 3.
Le blocage a pris fin le 31 août.
[^] # Re: Juste pour info
Posté par Stéphane Bortzmeyer (site web personnel, Mastodon) . En réponse au lien Pour se protéger de l'étranger, bloquons les accès de l'extérieur. Évalué à 2.
Il est probable que la décision avait été prise par l'hébergeur et/ou le transitaire et que la Cour n'était même pas au courant.
[^] # Re: Juste pour info
Posté par Stéphane Bortzmeyer (site web personnel, Mastodon) . En réponse au lien Pour se protéger de l'étranger, bloquons les accès de l'extérieur. Évalué à 2.
C'était pareil depuis la Guadeloupe ou la Nouvelle-Calédonie.
[^] # Re: Ce qui est intéressant...
Posté par Stéphane Bortzmeyer (site web personnel, Mastodon) . En réponse au lien Pour se protéger de l'étranger, bloquons les accès de l'extérieur. Évalué à 5.
Il y a plein de sites Web / télés qui limitent selon le pays supposé de l'adresse IP. Ce qui est relativement rare ici (mais logique, vu le but de limiter les attaques par déni de service) est que c'est fait dans la couche 3, pas dans la 7.
# Non, HTTP/3 n'est pas vraiment sur UDP
Posté par Stéphane Bortzmeyer (site web personnel, Mastodon) . En réponse à la dépêche 24 ans de libcurl. Évalué à 8.
Ce n'est pas la bonne description. HTTP/3 utilise QUIC et non pas UDP comme protocole de transport. QUIC ne peut pas tourner directement sur IP en raison de toutes les boxes àlakon qui bloquent les protocoles de transport inconnus, donc il utilise UDP mais ce n'est qu'un hack, fondamentalement, le protocole de transport de HTTP/3 est QUIC, pas UDP.
# Gee
Posté par Stéphane Bortzmeyer (site web personnel, Mastodon) . En réponse au journal L'Identité Numérique de la Poste, mal sécurisée mais au moins elle ne marche pas. Évalué à 10.
Sur ce service, rappelons aussi cette excellente BD.
# ISO 21636
Posté par Stéphane Bortzmeyer (site web personnel, Mastodon) . En réponse à la dépêche Les langues peu documentées et le libre : quelques enjeux scientifiques. Évalué à 3.
Il y a toujours du nouveau. Désormais, l'ISO a sorti une norme sur l'étiquetage des dialectes (ou variantes si on trouve le terme dialectes pas assez politiquement correct), ISO 21636. https://www.iso.org/standard/84965.html
Je ne l'ai pas lue (comme toutes les normes ISO, elle est payante et pas redistribuable) mais si quelqu'un de courageux l'a fait et peut résumer…
Les étiquettes de langue IETF permettaient déjà d'étiqueter les dialectes et plusieurs avaient été enregistrés.
[^] # Re: Et les étiquettes de langue de l'IETF, alors ?
Posté par Stéphane Bortzmeyer (site web personnel, Mastodon) . En réponse à la dépêche Les langues peu documentées et le libre : quelques enjeux scientifiques. Évalué à 4. Dernière modification le 06 mai 2024 à 16:53.
Il est clair que différents groupes n'ont pas le même cahier des charges. Les linguistes peuvent apprécier la rapidité d'enregistrement d'une langue, dès que l'article est publié, mais les bibliothécaires et documentalistes préfèrent davantage de conservatisme car une fois enregistrée, une langue ne pourra plus être supprimée, même si la science montre qu'en fait c'était une erreur.
Sans compter le débat entre fusionnistes (ISO 639-2) et séparatistes (ISO 639-3), qui regroupe en partie (mais en partie seulement) la distinction documentalistes / linguistes.
[^] # Re: Et les étiquettes de langue de l'IETF, alors ?
Posté par Stéphane Bortzmeyer (site web personnel, Mastodon) . En réponse à la dépêche Les langues peu documentées et le libre : quelques enjeux scientifiques. Évalué à 4.
La gestion de la norme est faite par l'IETF. En pratique, la liste de diffusion ietf-languages. Les subtags de langue collent à ceux d'ISO 639 donc suivent son rythme. Les subtags de variantes sont gérés localement et suscitent parfois des discussions animées, comme on les aime à l'IETF (récemment, les variantes du Ladin).
# Et les étiquettes de langue de l'IETF, alors ?
Posté par Stéphane Bortzmeyer (site web personnel, Mastodon) . En réponse à la dépêche Les langues peu documentées et le libre : quelques enjeux scientifiques. Évalué à 8.
Il est curieux de ne pas avoir cité les étiquettes de langue IETF. Ce sont la forme normalisée à utiliser dans toutes les normes Internet (HTTP - Accept-Language et analogues - et HTML - lang=, par exemple).
Elles visent justement à résoudre deux des problèmes cités (granularité insuffisante et non-disponibilité de la norme). Le registre est à l'IANA.
Elles sont normalisées dans le BCP 47 (actuellement composé des RFC 5646 et 4647). J'ai fait un résumé en français du RFC 5646.
On peut aussi utiliser pour chercher le non-officiel langtag.net.
[^] # Re: Meuh si c'est librement téléchargeable
Posté par Stéphane Bortzmeyer (site web personnel, Mastodon) . En réponse au journal Douze ans après. Évalué à 2.
Ah merci, ça marche (bon, il faut apparemment télécharger les fichiers un par un mais ça ira).
[^] # Re: Album disponible chez Bandcamp
Posté par Stéphane Bortzmeyer (site web personnel, Mastodon) . En réponse au journal Douze ans après. Évalué à 4.
Je sais qu'il est disponible depuis le site du projet, c'est ce que je disais. Mais avec une procédure pénible pour décourager les téléchargements.
# Et une FAQ sur le problème
Posté par Stéphane Bortzmeyer (site web personnel, Mastodon) . En réponse au lien Backdoor in upstream xz/liblzma leading to ssh server compromise. Évalué à 6.
https://gist.github.com/thesamesam/223949d5a074ebc3dce9ee78baad9e27
[^] # Re: Punycode
Posté par Stéphane Bortzmeyer (site web personnel, Mastodon) . En réponse au journal En passant par le FOSDEM, avec mes sabots 🎵. Évalué à 3.
Non, ce n'est pas recommandé et c'est même une très mauvaise idée, car cela fait des écritures non-latines des citoyennes de seconde classe.
[^] # Re: le titre m'a trompé !
Posté par Stéphane Bortzmeyer (site web personnel, Mastodon) . En réponse à la dépêche L’auteur de Nginx enfourche le proprio. Évalué à 9.
Non, trop religieux. Scission est plus politique.
[^] # Re: Le libre c'est pu c'que c'était
Posté par Stéphane Bortzmeyer (site web personnel, Mastodon) . En réponse à la dépêche Cybersécurité - le texte du CRA a été finalisé. Évalué à 8. Dernière modification le 10 janvier 2024 à 14:00.
Pas le seul, non. En environnement professionnel, c'est le grand gloubi-boulga dans la tête de beaucoup de gens, qui collent de l"aupène source" partout.
# Transcription disponible
Posté par Stéphane Bortzmeyer (site web personnel, Mastodon) . En réponse au lien Un journaliste (Loris Guémart) explique pourquoi les journalistes ne parlent pas du logiciel libre. Évalué à 3.
Une transcription de la conférence est disponible : https://www.librealire.org/les-journalistes-se-moquent-des-logiciels-libres-je-vous-explique-pourquoi
[^] # Re: Résumé subjectif
Posté par Stéphane Bortzmeyer (site web personnel, Mastodon) . En réponse au lien Un journaliste (Loris Guémart) explique pourquoi les journalistes ne parlent pas du logiciel libre. Évalué à 10.
Ouh là, ça fait beaucoup, pour quelqu'un qui n'a pas eu le temps de tout regarder (c'est une conférence riche où la question « le libre, c'est politique » est effectivement importante mais pas unique).
Donc, deux choses : d'abord, bien sûr que le choix du logiciel libre est politique. Si je ne m'intéressais pas aux aspects politiques, j'utiliserai Chrome et Gmail (mais pas Windows, il ne faut quand même pas déconner). Pas au sens de la politique politicienne (je me fous de savoir qui va être premier ministre et si tel député de LR va être remplacé par tel député de Renaissance ou le contraire). Mais au sens de la vie dans un espace commun (les logiciels forment justement un commun), où il faut organiser et prendre des décisions.
Deuxième chose : tous les médias sont engagés, il y a ceux qui le disent, comme Arrêt sur Images et ceux qui le nient.
# Huissier
Posté par Stéphane Bortzmeyer (site web personnel, Mastodon) . En réponse au journal le plus grand scandale sanitaire de tous les temps, c'est maintenant !. Évalué à 10.
Tout est bien sûr délirant dans ce journal mais le plus beau est l'étude « validée par huissier ». Moi qui croyais que la science était validée par des scientifiques ! Prochaine release de mes logiciels, je mettrais que le code a été validé par huissier.
# Open source, mouais...
Posté par Stéphane Bortzmeyer (site web personnel, Mastodon) . En réponse à la dépêche Le meilleur modèle de langage pour le savoir médical est libre. Évalué à 10.
Le terme d'« open source » est déjà utilisé pour désigner tout et n'importe quoi par des journalistes ou marketeux paresseux. Mais, dans le monde des LLM, c'est bien pire. Si les auteurs de Meditron font manifestement un effort d'ouverture, leur modèle n'est pas parti de zéro, c'est un raffinage de Llama qui n'est absolument pas libre (par exemple, la licence interdit de l'utiliser pour développer un autre modèle, c'est comme si la licence de gcc interdisait de l'utiliser pour développer clang/LLVM). Il est donc probable que Meditron hérite de la licence (pas du tout « open source ») de Llama.
# ISO 15924
Posté par Stéphane Bortzmeyer (site web personnel, Mastodon) . En réponse à la dépêche Comment écrit-on les systèmes d’écriture aujourd’hui ?. Évalué à 10. Dernière modification le 15 novembre 2023 à 16:05.
Petit ajout : il existe une norme ISO des écritures, qui liste toutes les écritures documentées, et leur attribue une code de quatre lettres (Latn = latin, Arab = arabe, Deva = devanagari, Vaii = vaï, etc).
À son tour, cette norme est utilisée dans les étiquettes de langue (language tags) que des normes comme HTTP utilisent ensuite. Ainsi, fa-Latn serait le persan en alphabet latin.
# Mon expérience de débutant Zig
Posté par Stéphane Bortzmeyer (site web personnel, Mastodon) . En réponse à la dépêche De Zig et des zags. Évalué à 5.
Cet excellent résumé m'a motivé pour essayer Zig, j'en rends compte dans cet article : https://www.bortzmeyer.org/mes-debuts-en-zig.html
# 404
Posté par Stéphane Bortzmeyer (site web personnel, Mastodon) . En réponse à la dépêche Revue de presse de l’April pour la semaine 43 de l’année 2023. Évalué à 4.
Le lien "Contrepoints" fait un 404. Ça devrait être https://www.contrepoints.org/2023/10/25/465587-iii-iv-lia-sera-t-elle-monopolisee-par-google-et-openai
# Le programme est disponible
Posté par Stéphane Bortzmeyer (site web personnel, Mastodon) . En réponse à la dépêche Capitole du Libre 2023. Évalué à 2.
https://capitoledulibre.org/programme/