• # Résumé

    Posté par  . Évalué à 6 (+5/-0).

    J'ai fait cette page pour résumer un certain nombre d'idées reçues sur Unicode (par exemple : on peut comparer des chaînes de caractères de manière insensible à la casse avec string1.lowercase() == string2.lowercase()).

    Si vous trouvez une erreur, n'hésitez pas à me la signaler.

    • [^] # Re: Résumé

      Posté par  (site web personnel) . Évalué à 2 (+2/-3).

      J'ai trouvé l'erreur : c'est Unicode !

      ASCII vaincra !

      Le post ci-dessus est une grosse connerie, ne le lisez pas sérieusement.

      • [^] # Re: Résumé

        Posté par  . Évalué à 9 (+8/-0).

        Signé : David Newton, développeur :)

      • [^] # Re: Résumé

        Posté par  . Évalué à 2 (+0/-0).

        ASCII vaincra !

        Oui, il vaut mieux être à ski qu'une icône.

      • [^] # Re: Résumé

        Posté par  (site web personnel, Mastodon) . Évalué à 3 (+0/-0).

        Boomer !

        « Tak ne veut pas quʼon pense à lui, il veut quʼon pense », Terry Pratchett, Déraillé.

        • [^] # Re: Résumé

          Posté par  (site web personnel) . Évalué à 1 (+2/-4).

          Non un boomer roule en SUV et donc sera pour les solutions polluantes comme Unicode.

          ASCII c'est du low tech écoresponsable !

          Le post ci-dessus est une grosse connerie, ne le lisez pas sérieusement.

          • [^] # Re: Résumé

            Posté par  (site web personnel, Mastodon) . Évalué à 8 (+5/-0).

            ASCII c'est de l'ethnocentré au ras des pâquerettes, voire, du validisme.

            « Tak ne veut pas quʼon pense à lui, il veut quʼon pense », Terry Pratchett, Déraillé.

            • [^] # Re: Résumé

              Posté par  (site web personnel) . Évalué à -4 (+0/-7).

              C'est facile à résoudre: quasiment tous les langages peuvent s'écrire en ASCII. Ce qui ne le peuvent pas aujourd'hui devraient inventer une transcription.

              Le post ci-dessus est une grosse connerie, ne le lisez pas sérieusement.

              • [^] # Re: Résumé

                Posté par  . Évalué à 8 (+7/-0).

                Puisqu'on va demander aux 1,4 milliards de Chinois, aux 1,3 milliards d'Indiens, aux 120 millions de Japonais, au 75 millions de Coréens et aux 150 millions de Russes de changer leur alphabet, je propose qu'au passage on change l'anglais et le français pour ne plus utiliser que les 32 premiers caractères de l'ASCII. Cela permettrait de n'utiliser que 5 bits par caractère, ce qui aiderait rudement la transition écologique. Accessoirement, ces caractères étant invisibles, on épargnerait aux générations suivantes le grand déplaisir de découvrir par la recherche historique notre usage irresponsable des ressources naturelles.

                • [^] # Re: Résumé

                  Posté par  (site web personnel) . Évalué à 1 (+2/-4).

                  Je comprends l'argument mais quel est l'alternative ? Continuer avec un unicode toujours plus bloated? Ne jamais rien simplifier ?

                  Le post ci-dessus est une grosse connerie, ne le lisez pas sérieusement.

                  • [^] # Re: Résumé

                    Posté par  (site web personnel, Mastodon) . Évalué à 5 (+2/-0).

                    Tu veux simplifier quoi et comment ? Il y énormément de sytèmes d'écriture, Unicode reste encore ce qu'il y a de plus simple.

                    « Tak ne veut pas quʼon pense à lui, il veut quʼon pense », Terry Pratchett, Déraillé.

                    • [^] # Re: Résumé

                      Posté par  (site web personnel) . Évalué à 4 (+3/-1).

                      Ne pas avoir de solution ne devrait pas rendre tabou l’évocation des problèmes. Si ? Ne peut-on pas apprécier l’unicode et particulièrement UTF8, ne pas connaître d’alternative, sans pour autant les considérer comme une panacée ?

                      NB : il me semble que les problématiques écologiques soulevées par devnewton le soient à titre humoristique. En ce qui me concerne, je songe surtout aux problèmes d’attaques informatiques permises par la versatilité (bien au sens Français ici) de cette convention.

                      « IRAFURORBREVISESTANIMUMREGEQUINISIPARETIMPERAT » — Odes — Horace

                      • [^] # Re: Résumé

                        Posté par  . Évalué à 5 (+4/-1).

                        Ne pas avoir de solution ne devrait pas rendre tabou l’évocation des problèmes.

                        Ça dépend de ce qui est considéré comme problème. Si c'est le design d'UTF8, il faut commencer par aller voir les autres unicodes par exemple. Si c'est la diversité de la culture dans le monde (ce qui a l'air d'être le cas quand la solution imaginée consiste à éradiquer tout système d'écriture autre que le sien), alors on est pas d'accord sur la définition du problème.

                        il me semble que les problématiques écologiques soulevées par devnewton le soient à titre humoristique.

                        Humour ne veut pas dire qu'il n'y a pas de propos.

                        En ce qui me concerne, je songe surtout aux problèmes d’attaques informatiques permises par la versatilité (bien au sens Français ici) de cette convention.

                        Et des contre-mesures sont construites en ce sens.

                        https://linuxfr.org/users/barmic/journaux/y-en-a-marre-de-ce-gros-troll

                      • [^] # Re: Résumé

                        Posté par  . Évalué à 3 (+0/-0).

                        Si l'UTF8 est le problème, ça se résout facilement.

                        On n'a qu'à passer à l'UTF-32 et supposer que tous les caractères rencontrés dans la vie de l'application ne seront jamais codés que sur un seul mot de 32 bits. Comme ça c'est 'achement plus simple à gérer!

                        (Ne me cherchez pas, c'est 'dredi et je suis déjà dehors!)

                        ----------> [ ]

                  • [^] # Re: Résumé

                    Posté par  . Évalué à 6 (+6/-1). Dernière modification le 27 février 2024 à 20:02.

                    Où est le « bloat » qui augmenterait ? On parle d'un jeu de caractères, de trois encodages et de quelques algorithmes plutôt simples, pas d'un logiciel qui grossirait en nombre de lignes de code. Ce n'est pas rajouter des caractères qui va augmenter la complexité de quoi que ce soit, tout au plus cela grossira un peu les tables (remarque : le rythme des ajouts s'est considérablement ralenti ces dernières années, cf. https://www.unicode.org/versions/stats/chart_charbyyear.html, et puis franchement, la taille des tables n'est généralement pas un facteur critique, sauf sans doute dans l'embarqué où chaque Ko compte). Quant aux catégories de caractères et aux algorithmes, ils sont essentiellement stables à ma connaissance.

                    Unicode est ce qui permet au monde d'avoir essentiellement un unique jeu de caractères, et, avec certes des poches de résistance de latin1 et UTF-16, un unique encodage, UTF-8, ce qui est incontestablement mille fois plus simple que la prolifération d'encodages qui avait cours avant, parce que non, on ne peut pas se contenter de l'ASCII quant il y a 65 millions de Français, 1,4 milliards de Chinois, etc. Donc l'argument de simplification joue fortement en faveur d'Unicode, à mon sens.

                    Quand à la complexité des algorithmes comme la normalisation etc. (qui du reste est toute relative, les algorithmes sont assez simples, le problème est plutôt que les programmeurs ne savent pas s'en servir) : comme Einstein ne l'a probablement pas dit, « Everything should be made as simple as possible — but no simpler ».

                  • [^] # Re: Résumé

                    Posté par  . Évalué à 5 (+3/-0).

                    Simplifier c'est prendre un alphabet qui va handicaper la moitié de la planète ? Ou alors c'est mettre l'informatique au service des utilisateurs (plutôt que le contraire) ?

                    • [^] # Re: Résumé

                      Posté par  (site web personnel) . Évalué à 0 (+2/-5).

                      Les peuples qui ont adopté un alphabet simple ne le regrettent pas !

                      Le post ci-dessus est une grosse connerie, ne le lisez pas sérieusement.

                      • [^] # Re: Résumé

                        Posté par  . Évalué à 4 (+3/-1).

                        {{référence nécessaire}}

                        (Et cette remarque pue le colonialisme et les Pères Blancs)

                        • [^] # Re: Résumé

                          Posté par  (site web personnel) . Évalué à 4 (+1/-0).

                          Le cas le plus célèbre doit être l'hangeul, car vraiment décidé d'en haut.

                          Le post ci-dessus est une grosse connerie, ne le lisez pas sérieusement.

                          • [^] # Re: Résumé

                            Posté par  (site web personnel, Mastodon) . Évalué à 4 (+1/-0).

                            Qui n'est pas un système d'écriture alphabétique !

                            « Tak ne veut pas quʼon pense à lui, il veut quʼon pense », Terry Pratchett, Déraillé.

                            • [^] # Re: Résumé

                              Posté par  (site web personnel) . Évalué à 3 (+1/-1).

                              🚎

                              Le post ci-dessus est une grosse connerie, ne le lisez pas sérieusement.

                            • [^] # Re: Résumé

                              Posté par  (site web personnel, Mastodon) . Évalué à 3 (+1/-0).

                              Sisi, le hangeul est bien un alphabet, sauf que les « lettres » ne sont pas disposées linéairement mais dans des carrés, à raison d’un carré par syllabe.

                              Avec une subtilité supplémentaire : si la série de lettres crée une syllabe qui n’existe pas en coréen, le résultat est considéré comme invalide (et il n’y a pas les codes informatiques pour les coder), ce qui rapproche le résultat d’un syllabaire. Mais le fonctionnement interne et l’apprentissage sont bien ceux d’un alphabet.

                              La connaissance libre : https://zestedesavoir.com

                            • [^] # Re: Résumé

                              Posté par  (site web personnel, Mastodon) . Évalué à 3 (+1/-0).

                              Si si, un alphabet (au même terme que les systèmes d’écritures latin ou cyrillique) …qui a la particularité de ressembler à un alphasyllabaire comme le sont l’amharique (plus précisément le système d’écriture guèze ou ge'ez) et le devanagari par exemple.

                              “It is seldom that liberty of any kind is lost all at once.” ― David Hume

                              • [^] # Re: Résumé

                                Posté par  (site web personnel) . Évalué à 3 (+1/-0).

                                SpaceFox< et Gil Cot<
                                vous êtes des grands malades des lettres (ou des Lettres ?) /o\

                                déjà que je ne lis qu'à peine le grec et le cyrillique :/

                                • [^] # Re: Résumé

                                  Posté par  (site web personnel, Mastodon) . Évalué à 4 (+2/-0).

                                  J'ai vécu en Corée, ça aide !

                                  La connaissance libre : https://zestedesavoir.com

                                  • [^] # Re: Résumé

                                    Posté par  (site web personnel) . Évalué à 3 (+1/-0). Dernière modification le 28 février 2024 à 18:53.

                                    spa bon comme ersatz de café, la chicorée :/

                                    rien ne vaut le café en grains ! moulu par tes propres soins :p
                                    Félicitations pour avoir su t'adapter à une telle culture aux antipodes (peu de monde va à l'est de l'Est…) puisque le Japon peut être considéré à l'Ouest, vu que la Terre est ronde :D

                                    Tu es parti avant que les Khmers débarquent de part et d'autre ?

                      • [^] # Re: Résumé

                        Posté par  (site web personnel, Mastodon) . Évalué à 3 (+1/-1).

                        1/ Définis alphabet simple
                        2/ Pourquoi l'alphabet latin forcément

                        Pourquoi ce refus des autres systèmes d'écriture  ? Les aveugles qui lisent et écrivent le Braille ne le regrettent pas, pas plus que les personnes sourdes qui lisent et écrivent la langue de signes. Dans les deux cas, ce sont des systèmes très adaptés.

                        Si tu vois l'histoire de l'humanité, tu vois bien notamment que la Chine et son système particulier d'écriture a été à la source de pas mal d'inventions (imprimerie à caractères mobiles notamment) bien avant l'Occident et son alphabet latin. Il en va de même avec les Arabes et leur alphabet complexe.

                        « Tak ne veut pas quʼon pense à lui, il veut quʼon pense », Terry Pratchett, Déraillé.

                        • [^] # Re: Résumé

                          Posté par  (site web personnel) . Évalué à 2 (+1/-2).

                          Tu as vraiment besoin d'une définition de simple?

                          Et pourquoi l'alphabet latin? Je n'y tiens pas particulièrement, mais il a l'avantage d'être déjà largement utilisé pour autre chose (programmation, fichiers de conf, documents…).

                          Le post ci-dessus est une grosse connerie, ne le lisez pas sérieusement.

                          • [^] # Re: Résumé

                            Posté par  . Évalué à 1 (+1/-2).

                            Tu as vraiment besoin d'une définition de simple?

                            Tu entends par simple le faible nombre de caractères différents ? Parce que la manière de l'utiliser où chacun ajoute ses diacritiques, où on multiplie les façons d'écrire le même phonèmes, où chaque langue choisi sa manière de prononcer la même écriture, où l'on se sent obligé de faire des ligatures pour améliorer la lecture ainsi qu'une demi douzaine d'espace différentes,… Je pense qu'on est plus dans le simpliste.

                            https://linuxfr.org/users/barmic/journaux/y-en-a-marre-de-ce-gros-troll

                      • [^] # Re: Résumé

                        Posté par  . Évalué à 2 (+1/-1).

                        Que je sache il y a le hangul qui fait l'unanimité :

                        • les peuples qui l'ont adopté ne le regrettent pas
                        • les scientifiques qui étudient les systèmes d'écriture lui trouvent beaucoup de qualités (en particulier il n'y a pas d'écart entre ce qui est écrit et prononcé)
                        • il n'est pas particulièrement relié à une langue et est en mesure de représenter de manière exacte bien plus de langues1. Tout le monde l'utilise de la même façon
                        • il s'adapte très bien par exemple aux usages numériques : la plupart des claviers virtuels n'ont besoin que de quelques touches, l'absence d’ambiguïté simplifie le text2speech et le speech2text,…

                        Mais oui ce n'est pas ton système d'écriture donc il doit être moins bien, c'est ça ?


                        1. je doute par contre qu'il puisse être utilisé sans adaptation pour les langues tonales 

                        https://linuxfr.org/users/barmic/journaux/y-en-a-marre-de-ce-gros-troll

                        • [^] # Re: Résumé

                          Posté par  (site web personnel, Mastodon) . Évalué à 3 (+0/-0).

                          Même pas. Il n'est pas adapté pour les personnes aveugles ou sourdes.

                          « Tak ne veut pas quʼon pense à lui, il veut quʼon pense », Terry Pratchett, Déraillé.

                          • [^] # Re: Résumé

                            Posté par  . Évalué à 3 (+0/-0).

                            Si le text2speech et le speech2text sont si bons que ça, il devrait être adapté aux aveugles entendants et aux sourds voyants.

                            Il ne reste que les gens aveugles ET sourds. Il suffit de passer un décret affirmant qu'ils n'ont pas besoin d'un ordinateur et le tour est joué!

                            (oui, je sais, j'aurais dû rester dehors…)

                            --------> [ ]

                • [^] # Re: Résumé

                  Posté par  (site web personnel, Mastodon) . Évalué à 3 (+0/-0).

                  Tiens tu oublies l'arabe, et pourtant c'est très écrit !

                  « Tak ne veut pas quʼon pense à lui, il veut quʼon pense », Terry Pratchett, Déraillé.

                  • [^] # Re: Résumé

                    Posté par  . Évalué à 2 (+1/-0).

                    J'avais juste la flemme de chercher quels pays arabophones avaient la plus grande population 🙂 (Apparemment, c'est l'Égypte avec 110 millions d'habitants, suivie de l'Algérie, le Soudan, l'Irak, le Maroc et l'Arabie Saoudite, qui sont tous entre 30 millions et 40 millions d'habitants.)

                    • [^] # Re: Résumé

                      Posté par  (site web personnel, Mastodon) . Évalué à 2 (+0/-1).

                      Plus nombre de pays d'Afrique sub-saharienne, et, évidemment le Pakistan et partout où il y a des musulmans. Savoir lire l'arabe est une condition requise pour être musulman.

                      « Tak ne veut pas quʼon pense à lui, il veut quʼon pense », Terry Pratchett, Déraillé.

                      • [^] # Re: Résumé

                        Posté par  (site web personnel) . Évalué à 2 (+1/-1).

                        Être né d’un parent musulman suffit en général à être musulman, sans que cet état ne puisse être changé, sous peine de mort (au moins sociale) dans nombre de pays. Me tromperais-je ? Par ailleurs très peu de musulmans de ma connaissance ont lu le Coran[*] et parmi ceux-là les arabophones de langue maternelle expliquent que le dialecte du Coran leur est souvent hermétique.

                        [*] Selon moi, cela n’a rien de spécifique à l’Islam et au Coran : les religions ont une très forte dimension d’hypocrisie sociale qui, au moins par paresse, domine aisément sur l’étude. Chose qui s’observe facilement dans bien d’autres domaines que la religion d’ailleurs.

                        « IRAFURORBREVISESTANIMUMREGEQUINISIPARETIMPERAT » — Odes — Horace

                      • [^] # Re: Résumé

                        Posté par  . Évalué à 4 (+2/-0).

                        Je pense pas que beaucoup de nos aïeux d'avant Vatican II parlaient couramment le latin.

                        • [^] # Re: Résumé

                          Posté par  (site web personnel, Mastodon) . Évalué à 3 (+0/-0).

                          Le rapport avec la civilisation arabe et l'Islam ?

                          « Tak ne veut pas quʼon pense à lui, il veut quʼon pense », Terry Pratchett, Déraillé.

                          • [^] # Re: Résumé

                            Posté par  . Évalué à 4 (+2/-0).

                          • [^] # Re: Résumé

                            Posté par  (site web personnel) . Évalué à 0 (+0/-2).

                            nous avons en commun la bible :-)

                            moui le second testament est un ajout lié à Jésus
                            la lecture littérale ou interprétée est facteur de différenciation aussi ('fin bon l'araméen spa pour tout le monde faut croire o_O)

                            • [^] # Re: Résumé

                              Posté par  (site web personnel) . Évalué à 7 (+4/-0).

                              nous avons en commun la bible

                              Comment ça "nous"? Moi j'en veux pas !

                              Le post ci-dessus est une grosse connerie, ne le lisez pas sérieusement.

                            • [^] # Re: Résumé

                              Posté par  . Évalué à 4 (+2/-1).

                              la lecture littérale ou interprétée est facteur de différenciation aussi

                              Quelle que soit la religion, il y a toujours des courants qui professent une lecture très stricte. Et il y a plusieurs courants dans les religions un peu conséquentes, preuve que quoi que tu fasses il émerge des lectures différentes. La lecture littérale, ça n’existe généralement pas, en fait.

                      • [^] # Re: Résumé

                        Posté par  . Évalué à 4 (+2/-0). Dernière modification le 28 février 2024 à 14:18.

                        Savoir lire l'arabe est une condition requise pour être musulman.

                        Pourquoi ? Je connais nombre de musulmans (sénégalais notamment) incapables de lire l'arabe.

                        • [^] # Re: Résumé

                          Posté par  (site web personnel, Mastodon) . Évalué à 3 (+0/-0). Dernière modification le 28 février 2024 à 14:29.

                          En théorie, pour pouvoir lire le Coran et cela fait partie de certaines prescriptions de la religion. Que ça ne soit plus le cas, c'est plutôt dommage d'ailleurs.

                          « Tak ne veut pas quʼon pense à lui, il veut quʼon pense », Terry Pratchett, Déraillé.

                          • [^] # Re: Résumé

                            Posté par  . Évalué à 3 (+1/-0).

                            Moui. Dans l'Islam comme dans toute religion il y a plusieurs écoles. Certains encouragent les convertis à utiliser des traductions pour commencer. Pour d'autres ça sera Ḥarām.

                            Que ça ne soit plus le cas, c'est plutôt dommage d'ailleurs.

                            Qu'une religion cesse d'imposer des trucs, je ne trouverai jamais ça "dommage". Ceux qui voudront coller au plus près à la parole divine apprendront. L'arabe (et sa littérature religieuse) ne sont pas en danger.

                            • [^] # Re: Résumé

                              Posté par  (site web personnel, Mastodon) . Évalué à 4 (+2/-0).

                              C’est dommage dans le sens où la religion est contre la traduction par peur des contre-sens si j’ai bien compris. Du coup il faut aller à la source (donc lire et comprendre l’arabe de l’époque et de la région…) sinon c’est une blague (comme de bêtement réciter du bruit…)

                              “It is seldom that liberty of any kind is lost all at once.” ― David Hume

                          • [^] # Re: Résumé

                            Posté par  (site web personnel, Mastodon) . Évalué à 2 (+0/-0).

                            Il y a 20 ans côté Sénégal et Mauritanie (j’ai pas d’informations plus récentes), ce qui était demandé, c’était pas de savoir lire le Coran mais de pouvoir le réciter. À des populations dont les langues sont très éloignées de l’arabe. Conséquence : on a des peuples entiers qui sont capable de réciter le Coran sans en comprendre un traitre mot. Oui, ça implique d’apprendre le bouquin entier en phonétique.

                            C’est le même genre de phénomène qui a poussé l’Église catholique à utiliser les langues locales au lieu du latin lors du concile de Vatican II.

                            La connaissance libre : https://zestedesavoir.com

                • [^] # Re: Résumé

                  Posté par  (site web personnel, Mastodon) . Évalué à 4 (+2/-0).

                  je propose qu'au passage on change l'anglais et le français pour ne plus utiliser que les 32 premiers caractères de l'ASCII. Cela permettrait de n'utiliser que 5 bits par caractère, ce qui aiderait rudement la transition écologique.

                  Tu viens de gagner un point [:VIEUX] pour avoir presque réinventé le Baudot à cinq moments !

              • [^] # Re: Résumé

                Posté par  (site web personnel, Mastodon) . Évalué à 4 (+1/-0).

                Tu mélanges tout : langue et système d'écriture.

                « Tak ne veut pas quʼon pense à lui, il veut quʼon pense », Terry Pratchett, Déraillé.

          • [^] # Re: Résumé

            Posté par  . Évalué à 7 (+4/-0).

            Ah, le bon vieux temps des dizaines de codages embarqués dans chaque appli pour préserver la planète, tout ça pour finalement embarquer un truc aussi gros presque aussi gros que Unicode quand on arrive à la traduction chinoise (GB-2312), en plus du reste, évidemment…

          • [^] # Re: Résumé

            Posté par  . Évalué à 2 (+0/-0).

            team "utf-8 классный" represents

  • # une liste de croyances erronées

    Posté par  (site web personnel) . Évalué à 6 (+3/-0).

Envoyer un commentaire

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.