Le document sélectionné est un brouillon préliminaire pour la version 17.0.0 de la norme Unicode, dont la publication est prévue pour le 9 septembre 2025. Cette version intègre plusieurs mises à jour importantes :
Ajouts de caractères : 4 803 nouveaux caractères, pour un total de 159 801. Cela inclut 4 nouveaux scripts : Sidetic, Tolong Siki, Beria Erfe et Tai Yo.
Données : Aucun nouveau fichier de données n'a été ajouté à la base de données de caractères Unicode (UCD) pour cette version.
Mises à jour des spécifications techniques : Plusieurs normes techniques Unicode (UTS) ont été mises à jour de manière synchrone, comme UTS #10 (Unicode Collation Algorithm), UTS #39 (Unicode Security Mechanisms), UTS #46 (Unicode IDNA Compatibility Processing) et UTS #51 (Unicode Emoji).
Changements spécifiques et implications pour la migration
Les développeurs et les implémenteurs doivent prendre en compte plusieurs changements qui pourraient impacter leurs applications :
Sécurité et identifiants (selon UAX #31 et UTS #39) :
Le statut de nombreux caractères a été revu pour des raisons de sécurité, notamment la propriété Identifier_Type.
Les idéogrammes Han (Chinois, Japonais, Coréen) sont désormais considérés comme Uncommon_Use par défaut, sauf pour un ensemble de 19 842 caractères d'usage courant. Cela a pour effet de restreindre l'utilisation de 77 838 caractères Han dans les identifiants.
Le script Bopomofo a été reclassé en Limited_Use, rendant 74 caractères restreints pour une utilisation dans des identifiants.
Segmentation (selon UAX #14) :
Une nouvelle propriété de saut de ligne, Unambiguous_Hyphen, a été ajoutée pour résoudre des problèmes de césure, notamment en hébreu.
La gestion de U+034F COMBINING GRAPHEME JOINER a été précisée, avec une section dédiée à son historique et à ses règles de segmentation.
Idéogrammes CJK/Unihan (selon UAX #38) :
Un nouveau bloc, CJK Unified Ideographs Extension J, ajoute 4 298 idéogrammes, ce qui porte le total à plus de 100 000.
Des changements importants ont été apportés aux propriétés et aux glyphes de nombreux idéogrammes existants.
Propriétés numériques :
Un nouvel ensemble de chiffres décimaux a été ajouté pour le script Tolong Siki.
Variations standardisées :
De nombreuses nouvelles séquences de variation ont été ajoutées, notamment pour les hiéroglyphes égyptiens et les signes de ponctuation Sibe.
# Résumé de Gemini
Posté par woffer 🐧 (site web personnel) . Évalué à 1 (+1/-2).
Aperçu général d'Unicode 17.0
Le document sélectionné est un brouillon préliminaire pour la version 17.0.0 de la norme Unicode, dont la publication est prévue pour le 9 septembre 2025. Cette version intègre plusieurs mises à jour importantes :
Ajouts de caractères : 4 803 nouveaux caractères, pour un total de 159 801. Cela inclut 4 nouveaux scripts : Sidetic, Tolong Siki, Beria Erfe et Tai Yo.
Données : Aucun nouveau fichier de données n'a été ajouté à la base de données de caractères Unicode (UCD) pour cette version.
Mises à jour des spécifications techniques : Plusieurs normes techniques Unicode (UTS) ont été mises à jour de manière synchrone, comme UTS #10 (Unicode Collation Algorithm), UTS #39 (Unicode Security Mechanisms), UTS #46 (Unicode IDNA Compatibility Processing) et UTS #51 (Unicode Emoji).
Changements spécifiques et implications pour la migration
Les développeurs et les implémenteurs doivent prendre en compte plusieurs changements qui pourraient impacter leurs applications :
Sécurité et identifiants (selon UAX #31 et UTS #39) :
Segmentation (selon UAX #14) :
Idéogrammes CJK/Unihan (selon UAX #38) :
Propriétés numériques :
Variations standardisées :
Envoyer un commentaire
Suivre le flux des commentaires
Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.