Nouvelle version d'Unicode : la 6.1.0

Posté par tuiu pol le 07 février 2012 à 10:27. Édité par Benoît Sibaud, Lucas Bonnet et baud123. Modéré par Benoît Sibaud. Licence CC By‑SA.

Étiquettes :

fév.

2012

La dernière version d'Unicode a été publiée ce 31 janvier. C'est une version mineure ajoutant 732 nouveaux caractères et portant leur nombre à 110 116. La dernière version majeure, la 6.0, date de février 2011.

Les nouveaux blocs sont :

08A0..08FF Arabic Extended-A
1CC0..1CCF Sundanese Supplement
AAE0..AAFF Meetei Mayek Extensions
10980..1099F Meroitic Hieroglyphs
109A0..109FF Meroitic Cursive
110D0..110FF Sora Sompeng
11100..1114F Chakma
11180..111DF Sharada
11680..116CF Takri
16F00..16F9F Miao
1EE00..1EEFF Arabic Mathematical Alphabetic Symbols

Unicode est développé dans le but de remplacer les pages de codes nationales afin de faciliter les échanges mondiaux par le bais de l'outil informatique. Il s'agit de donner à chaque caractère de n'importe quel système d’écriture un nom et un identifiant unique, quelle que soit la plate-forme informatique.

Ce travail est coordonné par le Consortium Unicode (association privée à but non lucratif).

Aller plus loin

Les détails de la nouvelle version (201 clics)
Les nouveaux caractères (405 clics)
Le consortium Unicode (39 clics)
BoingBoing : Unicode's "Pile of Poo" character (599 clics)
Google : Unicode over 60 percent of the web (120 clics)

# Copyleft

Posté par Goffi (site web personnel, Mastodon) le 07 février 2012 à 10:35. Évalué à 8.

Et toujours pas de symbole copyleft :(
- [^] # Re: Copyleft
  
  Posté par Francois Revol (site web personnel) le 07 février 2012 à 11:02. Évalué à 2.
  
  C'est pas faute de l'avoir proposé à RMS, mais il s'en fout un peu, donc faudra faire ça sans lui. En tout cas essayer de faire passer ça différemment par la FSF[E].
# Caractères absurdes

Posté par 🚲 Tanguy Ortolo (site web personnel) le 07 février 2012 à 11:01. Évalué à 2.

Ce derniers temps, ils y ont aussi ajouté de vraies conneries, des dessins qui n'ont absolument rien à faire dans un jeu de caractères à moins que celui-ci ne soit vraiment destiné à des clowns. Par exemples, le tas de merde. Si si, il y a un caractère tas de merde.
- [^] # Re: Caractères absurdes
  
  Posté par Francois Revol (site web personnel) le 07 février 2012 à 11:03. Évalué à 4.
  
  Alors qu'ils ont refusé d'ajouter un plan Klingon au prétexte que c'est un script :-(((((((
- [^] # Re: Caractères absurdes
  
  Posté par Marotte ⛧ le 07 février 2012 à 11:11. Évalué à 4. Dernière modification le 07 février 2012 à 11:11.
  
  Le tas de merde, ou ne serait-ce pas simplement une merde ou une bouse, ça peut servir à signifier qu'il y a eu un problème quelque part. Un peu comme on utilise la bombe pour signifier un bug ou un crash dans un programme.
  - [^] # Re: Caractères absurdes
    
    Posté par Efemero (site web personnel) le 07 février 2012 à 11:24. Évalué à -10.
    - [^] # Re: Caractères absurdes
      
      Posté par Anonyme le 08 février 2012 à 13:25. Évalué à 3.
      
      Signalons aussi le caractère vide, qui...
      - [^] # Re: Caractères absurdes
        
        Posté par Marotte ⛧ le 08 février 2012 à 16:27. Évalué à 2.
        
        Je me doutais d'un truc comme ça pour le message d'Efemero. J'ai néanmoins moinssé son commentaire car sans explication c'était inutil (selon moi). Merci pour la précision.
- [^] # Re: Caractères absurdes
  
  Posté par cjlano le 07 février 2012 à 11:17. Évalué à 10. Dernière modification le 07 février 2012 à 11:19.
  
  Dans ce cas là, où doit-on s'arrêter?
  
  Pourquoi y a-t-il des smileys dans Unicode?
  ☹ ☺ ☻
  Pourquoi y a-t-il des flèches dans Unicode?
  ←↑↓→
  Pourquoi y a-t-il des caractères "météo" dans Unicode?
  ☀ ☁ ☂ ☃
  Des notes de musique?
  ♩ ♪ ♫ ♬ ♭ ♮ ♯
  Les symboles des échecs?
  ♔♕♖♗♘♙
  
  Et pas de "caca"?
  
  Si ces symboles sont présents, c'est qu'ils sont utiles à certains. J'ai vu ici même des pseudos "note de musique". A quand la signature "caca"?
  
  sources:
  http://www.haypocalc.com/wiki/Caract%C3%A8res_Unicode
  https://en.wikipedia.org/wiki/Miscellaneous_Symbols
  
  A+
  - [^] # Re: Caractères absurdes
    
    Posté par 🚲 Tanguy Ortolo (site web personnel) le 07 février 2012 à 11:57. Évalué à 2.
    
    Bon, mauvais exemple, le tas de merde. Il me semblait avoir vu passer un caractère du genre « ours en train de manger du miel », ce qui était déjà plus inquiétant…
    - [^] # Re: Caractères absurdes
      
      Posté par CrEv (site web personnel) le 07 février 2012 à 12:02. Évalué à 6.
      
      mouai
      Je doute tout de même que les caractères apparaissent par magie dans unicode, non ?
      Dans ce cas c'est sûrement que quelqu'un a trouvé une utilité, tu ne crois pas ?
      
      Moi je trouve plutôt bien qu'il y ait plein de caractères du genre (dans unicode, on pourrait aussi avoir une police spécifique, comme webdings & co) ça permet d'avoir des interfaces (même textes) plus graphiques, plus représentatives, sans charger d'images (ce qui permet par exemple d'avoir des pages web plus sympa tout en étant légères. Et ça c'est un bon point.
      - [^] # Re: Caractères absurdes
        
        Posté par oinkoink_daotter le 07 février 2012 à 12:56. Évalué à 5.
        
        Mhhhh, je dirais que c'est directement tiré des emoji japonais qui à vue de nez doivent être antérieurs à unicode (ou à sa démocratisation).
      - [^] # Re: Caractères absurdes
        
        Posté par Troy McClure (site web personnel) le 08 février 2012 à 10:09. Évalué à 1.
        
        sans charger d'images (ce qui permet par exemple d'avoir des pages web plus sympa tout en étant légères
        
        Oui, on remplace des ptits gifs de 0.2ko par une bonne grosse fonte 100% unicode avec etrons et bonhomme de neige qui pese seulement 80Mo c'est bon pour la legereté
        
        [^] # Re: Caractères absurdes
        
        Posté par CrEv (site web personnel) le 08 février 2012 à 12:38. Évalué à 2.
        
        oui et non, car le but serait d'avoir ta police sur le terminal de lecture, non ?
  - [^] # Re: Caractères absurdes
    
    Posté par NeoX le 07 février 2012 à 14:14. Évalué à 3.
    
    Si ces symboles sont présents, c'est qu'ils sont utiles à certains.
    
    ou simplement qu'ils ont été importé tel quel des tables existantes, non ?
  - [^] # Re: Caractères absurdes
    
    Posté par Laurent Pointecouteau (site web personnel, Mastodon) le 07 février 2012 à 14:52. Évalué à 4. Dernière modification le 07 février 2012 à 14:57.
    
    Tu oublies le petit cœur (♥♥♥), très populaire parmi les jeunes filles en fleur sur Facebook.
    
    Et puis bon, c'est rigolo tout ça, ça me rappelle quand je laissais des conneries en Wingdings dans mes .doc pour faire enrager la prof de techno au collège (le labo avait Windows 3.11 et un mystérieux OS WindowMaker, mais pour une raison inconnue il était défendu de booter dessus).
  - [^] # Re: Caractères absurdes
    
    Posté par NanoTech le 07 février 2012 à 15:00. Évalué à 10.
    
    Unicode n'a pas seulement pour objectif de contenir tous les scripts des langues vivantes et mortes, mais aussi de contenir tous les caractères de tous les encodages qui ont été utilisés, ce qui permet de convertir d'un encodage X vers Unicode, puis à nouveau vers X, sans perte.
    
    Par exemple, les notes de musique, les smileys et les flèches se trouvaient dans le jeu de caractères CP-437 utilisé dans le tampon de mémoire de l'écran des cartes VGA en mode texte, pour les caractères numérotés de 0 à 31.
    
    Ainsi, un émulateur de terminal DOS peut vouloir supporter ces symboles, tout en utilisant de l'Unicode en interne.
    
    Par contre, je ne sais pas d'où vient le "caca".
    - [^] # Re: Caractères absurdes
      
      Posté par Jeanuel (site web personnel) le 07 février 2012 à 22:15. Évalué à 7.
      
      Par contre, je ne sais pas d'où vient le "caca".
      
      Tu as vraiment besoin qu'on te fasse un dessin ?
      - [^] # Re: Caractères absurdes
        
        Posté par Benoît Sibaud (site web personnel) le 07 février 2012 à 23:08. Évalué à 1.
        
        Je dirais bien de chez Sam, mais je me demande d'où ? Cf http://caca.zoy.org/wiki/libcaca
        
        [^] # Re: Caractères absurdes
        
        Posté par nud le 09 février 2012 à 10:00. Évalué à 1.
        
        Au moins maintenant il pourra afficher son logo dans le terminal \o/
- [^] # Re: Caractères absurdes
  
  Posté par Zenitram (site web personnel) le 07 février 2012 à 11:22. Évalué à 5. Dernière modification le 07 février 2012 à 11:23.
  
  Si si, il y a un caractère tas de merde.
  
  Bravo, tu as cliqué sur le 4ème lien de la dépêche.
  
  Ce derniers temps, ils y ont aussi ajouté de vraies conneries, des dessins qui n'ont absolument rien à faire dans un jeu de caractères
  
  Les smileys sont du même acabit, faudrait les virer aussi. On s'en fou si des gens les utilisent et font des suites de caractères bizarres (et difficile à traiter, parfois la suite de caractère est voulue) à la place si on ne met pas le code Unicode idoine.
  
  Faudrait aussi supprimer les icônes de météo, de musique... Qui ne sont pas des caractère valide façon Tanguy.
  
  Ou on peut aussi comprendre l'usage... Oui, un "tas de merde" est utilisé comme pour les dessins de météo.
- [^] # Re: Caractères absurdes
  
  Posté par Xavier Teyssier (site web personnel) le 07 février 2012 à 11:22. Évalué à 5.
  
  Et en plus d'un avis particulièrement tranché, te serait-il possible de nous faire part d'une information pertinente, au hasard, le numéro dudit caractère ?
  - [^] # Re: Caractères absurdes
    
    Posté par Zenitram (site web personnel) le 07 février 2012 à 11:25. Évalué à 5.
    
    Pas du numéro dudit caractère, mais le numéro dans la liste des liens de la dépêche : 4 (3 pour les informaticiens qui commencent à compter à partir de 0)
    
    Tu auras tout!
    - [^] # Re: Caractères absurdes
      
      Posté par ǝpɐןƃu∀ nǝıɥʇʇɐW-ǝɹɹǝıԀ (site web personnel) le 07 février 2012 à 12:56. Évalué à 3.
      
      s/"commencent à compter à partir de 0"/"déréférencent les adresses en commençant sans décalage"/g
      
      Me gourerai-je ? Ou alors, s'agit-il de désigner des gens qui maîtrisent mal le C et les langages similaires ?
      
      « IRAFURORBREVISESTANIMUMREGEQUINISIPARETIMPERAT » — Odes — Horace
- [^] # Re: Caractères absurdes
  
  Posté par monde_de_merde le 07 février 2012 à 11:27. Évalué à 9.
  
  Je suis totalement d'accord.
  
  Sérieusement des caractères accentués, non mais on va où ? Pourquoi pas des kanjis ou même des hiéroglyphes.
  
  Comment ça pas vendredi ?
  - [^] # Re: Caractères absurdes
    
    Posté par Grunt le 07 février 2012 à 11:50. Évalué à 7.
    
    La vie etait quand meme plus simple en 7 bits.
    
    THIS IS JUST A PLACEHOLDER. YOU SHOULD NEVER SEE THIS STRING.
    - [^] # Re: Caractères absurdes
      
      Posté par Kerro le 07 février 2012 à 13:16. Évalué à 3.
      
      VOIR MEME EN 6 BITS
      
      /me ne pige toujours pas pourquoi une part importante des utilisateurs en entreprise sont en permanence en majuscules
      - [^] # Re: Caractères absurdes
        
        Posté par Grunt le 07 février 2012 à 13:26. Évalué à 10.
        
        SALUT CA VA ???
        
        Bon, déjà appuie sur Caps Lock.
        
        MERCI C'EST BEAUCOUP PLUS FACILE COMME ÇA ! :)))
        
        THIS IS JUST A PLACEHOLDER. YOU SHOULD NEVER SEE THIS STRING.
        
        [^] # Re: Caractères absurdes
        
        Posté par nud le 09 février 2012 à 10:03. Évalué à -1. Dernière modification le 09 février 2012 à 10:03.
        
        [citation needed]
      - [^] # Re: Caractères absurdes
        
        Posté par floriang le 07 février 2012 à 17:10. Évalué à -1.
        
        Parce qu’ils n’ont pas de pavé numérique pour accéder plus facilement aux chiffres ou qu’ils trouvent les capitales plus lisibles… :-/
        
        [^] # Re: Caractères absurdes
        
        Posté par Marotte ⛧ le 08 février 2012 à 02:53. Évalué à 0.
        
        C'EST TOUT SAUF LISIBLE ! Si Gutenberg et ses confrères n'avaient pas voulu se faire chier et que ça n'avait gêné personne ils auraient dropé les minuscules (ou les majuscules), bizarrement il ne l'ont pas fait... Après on pourrait aussi dire que l'écriture cunéiforme ne fait pas cette distinction, mais bon, elle est même pas dans Unicode ! Si ? (flemme de chercher moi-même toussa).
        
        [^] # Re: Caractères absurdes
        
        Posté par monde_de_merde le 08 février 2012 à 09:23. Évalué à 4.
        
        Hé si : http://www.unicode.org/charts/PDF/U12000.pdf et http://www.unicode.org/charts/PDF/U12400.pdf
        Youhouuu ! L'Unicode c'est trop bien !
        
        [^] # Re: Caractères absurdes
        
        Posté par Antoine le 08 février 2012 à 13:41. Évalué à 3.
        
        LES ROMAINS NE CONNAISSAIENT PAS LES MINUSCULES, TOUT ÉTAIT ÉCRIT EN MAJUSCULES.
        
        (cf. http://fr.wikipedia.org/wiki/Alphabet_latin)
        
        [^] # Re: Caractères absurdes
        
        Posté par monde_de_merde le 08 février 2012 à 14:15. Évalué à 7.
        
        Et leur empire s'est cassé la gueule.
        
        Enfin bon, j'attendrai un vendredi pour franchir le pas suivant.
        
        [^] # Re: Caractères absurdes
        
        Posté par Marotte ⛧ le 09 février 2012 à 00:11. Évalué à 3. Dernière modification le 09 février 2012 à 00:12.
        
        Et leur empire s'est cassé la gueule.
        
        C'est un peu le destin de tout empire...
        
        M'est d'avis que c'est surtout leur notation à la con des nombres qui est la cause de leur déclin :)
        
        [^] # Re: Caractères absurdes
        
        Posté par windu.2b le 09 février 2012 à 18:08. Évalué à 1.
        
        Enfin bon, j'attendrai un vendredi pour franchir ~~le pas suivant~~le Rubicon.
        
        [^] # Re: Caractères absurdes
        
        Posté par Benoît Sibaud (site web personnel) le 08 février 2012 à 14:29. Évalué à 7.
        
        Cela donnerait plutôt en latin archaïque (pas de G, J, U, W, Y, Z) ou en graphie classique (pas de J, U, W) :
        
        LES ROMAINS NE CONNAISSAIENT PAS LES MINVSCVLES, TOVT ETAIT ECRIT EN MAIVSCVLES.
        
        Dans les autres infos inutiles : les Romains devaient éviter les mots subjugueriez et
        zigzagueriez qui sont ceux contenant le plus de GJUWYZ dans /usr/share/dict/french, et
        jusqu'au-boutisme pour JUW. Oui, ça n'a pas grand intérêt de le savoir, je vous l'accorde. Pas plus que arrière-grand-{père,mère,parent}s? comme mots contenant le plus de 'r' dans ce dico. ->[]
      - [^] # Re: Caractères absurdes
        
        Posté par Tonton Th (Mastodon) le 08 février 2012 à 15:43. Évalué à 3.
        
        POURQUOI SE LIMITER A 6 ALORS QUE 5 C,A MARCHE TRES BIEN ?
        
        [^] # Re: Caractères absurdes
        
        Posté par Kerro le 08 février 2012 à 21:38. Évalué à 2.
        
        Avec 5 bits (32 combinaisons) tu n'aurais pas même pu écrire ton message qui contient des lettres (26 caractères), des chiffres (10 caractères), de la ponctuation (quelques caractères en plus).
        Ou alors il faut utiliser des caractères d'échappement... et on n'est plus en 5 bits mais en 5 virgule quelque chose.
        
        [^] # Re: Caractères absurdes
        
        Posté par Marotte ⛧ le 09 février 2012 à 00:07. Évalué à 6. Dernière modification le 09 février 2012 à 00:09.
        
        On peut s'en sortir avec 5 bits : 26 lettres plus deux signes "(" et ")" :
        
        POURQUOI SE LIMITER A SIX ALORS QUE CINQ CA MARCHE TRES BIEN (INTERROGATION)
        
        Ça suffit pour écrire en LISP :)
        
        [^] # Re: Caractères absurdes
        
        Posté par Tonton Th (Mastodon) le 09 février 2012 à 00:11. Évalué à 3.
        
        Ou alors il faut utiliser des caractères d'échappement...
        
        C'est exactement ce que fait le Baudot, il y a deux caractères de bascule : vers les lettres ou vers les chiffres/ponctuations. Hint : il y a un lien dans mon post :)
        
        [^] # Re: Caractères absurdes
        
        Posté par Krunch (site web personnel) le 09 février 2012 à 00:17. Évalué à 2.
        
        Avec 5 bits il y a tout a fait moyen d'exprimer chacun des 22 symboles que comporte son message. Il y a sans doute moyen d'utiliser moins de bits pour la plupart de ces symboles en faisant appel à Huffman mais je suis un peu rouillé.
        
        pertinent adj. Approprié : qui se rapporte exactement à ce dont il est question.
        
        [^] # Re: Caractères absurdes
        
        Posté par Marotte ⛧ le 09 février 2012 à 00:23. Évalué à 2.
        
        Après le problème c'est que se restreindre à 5 bits c'est pas très utile. Soit on se restreint à 4 bits, soit on passe au "cran" au dessus et on a de suite 8 bits...
        
        [^] # Re: Caractères absurdes
        
        Posté par Krunch (site web personnel) le 09 février 2012 à 08:04. Évalué à 3.
        
        Je ne vois pas en quoi un système qui aurait des bytes de 5 bits serait plus absurde qu'un système à 4 bits par byte.
        
        pertinent adj. Approprié : qui se rapporte exactement à ce dont il est question.
        
        [^] # Re: Caractères absurdes
        
        Posté par CHP le 09 février 2012 à 16:14. Évalué à 2.
        
        Parce que 5 n'est pas une puissance de 2 ?
        
        [^] # Re: Caractères absurdes
        
        Posté par Krunch (site web personnel) le 10 février 2012 à 22:33. Évalué à 4.
        
        Et ? Depuis quand 6, 7, 9, 12, 18, 36, 39, 40, 48 ou 60 sont des puissances de 2 ?
        
        pertinent adj. Approprié : qui se rapporte exactement à ce dont il est question.
        
        [^] # Re: Caractères absurdes
        
        Posté par Marotte ⛧ le 09 février 2012 à 16:18. Évalué à 1.
        
        Avant qu'on sache mettre en œuvre des technologies comme les Qbit, on aura qu'une logique électronique à 2 états.
        
        Après je suis d'accord, ce n'est pas absurde dans l'absolu.
        
        [^] # Re: Caractères absurdes
        
        Posté par Tonton Th (Mastodon) le 10 février 2012 à 12:58. Évalué à 3.
        
        on aura qu'une logique électronique à 2 états.
        
        Faux. Dans les années 50/60, les russes ont construit des ordinateurs ternaires. Je pense même qu'en fouillant un peu, on doit pouvoir trouver des émulateurs/simulateurs pour essayer : ça doit être un poil déroutant au niveau de l'assembleur.
        
        [^] # Re: Caractères absurdes
        
        Posté par Marotte ⛧ le 10 février 2012 à 16:11. Évalué à 2.
        
        Merci c'est très instructif. Ça m'apprendra à parler trop vite et ~~passer pour un con~~ laisser aucun doute à ce sujet...
        
        [^] # Re: Caractères absurdes
        
        Posté par Michaël (site web personnel) le 09 février 2012 à 16:53. Évalué à 3.
        
        Après le problème c'est que se restreindre à 5 bits c'est pas très utile. Soit on se restreint à 4 bits, soit on passe au "cran" au dessus et on a de suite 8 bits...
        
        Si tu as 40 bits de mémoire, c'est plus utile de pouvoir y stocker 8 caractères que 5, non? Rien ne dit que toutes les tailles d'unités d'information doivent être des puissances de 2, d'ailleurs ASCII était initialement un codage 7bits.
        
        [^] # Re: Caractères absurdes
        
        Posté par Marotte ⛧ le 09 février 2012 à 17:19. Évalué à 2.
        
        Oui pas faux. Mais il me semble quand même que le mot ASCII s'étalait sur 8 bits, en utilisant le 8ème pour la détection d'erreur.
        
        Et puis pour le coup des 8 caractères de 5 bits ou 5 caractère de 8 bits, avec ta mémoire de 40 bits, d'un coté tu peux stocker 8 caractère mais tu auras moins de caractères différents, de l'autre coté tu n'en stockera que 5 mais plus de caractères différents. Donc autant d'information, c'est effectivement la nature de cette information qui déterminera s'il est mieux d'avoir 8 mots de 5 bit ou 5 mots de 8 bits à disposition, mais elle sera toujours représentable (cette information) par l'un ou l'autre, plus ou moins naturellement.
        
        Marotte, Dr ès logique.
        
        [^] # Re: Caractères absurdes
        
        Posté par Michaël (site web personnel) le 09 février 2012 à 21:12. Évalué à 3. Dernière modification le 09 février 2012 à 21:14.
        
        Oui pas faux.
        
        Qu'est-ce que tu n'as pas compris? :)
        
        c'est effectivement la nature de cette information qui déterminera s'il est mieux d'avoir 8 mots de 5 bit
        
        Si on parle d'encodage à largeur fixée, c'est effectivement pas idiot de prendre un nombre de bits suffisant à coder toutes les lettres du message.
        
        Il y a des ensembles de données qui sont tellement gros que pour les transférer d'un géographique site à l'autre on utilise… des camions! Ben oui. Dans ce genre de contexte, je suppose qu'un bit est un bit!
        
        [^] # Re: Caractères absurdes
        
        Posté par Marotte ⛧ le 09 février 2012 à 17:25. Évalué à 2. Dernière modification le 09 février 2012 à 17:25.
        
        Il y a aussi le problème de l'adressage de ces unités d'information, 5 mots de ta mémoire, tu les adresses sur combien de bits ? 2 bits ça suffit pas, mais 3 te permettent d'adresser 8 bits...
        
        [^] # Re: Caractères absurdes
        
        Posté par Marotte ⛧ le 09 février 2012 à 17:32. Évalué à 3.
        
        Donc effectivement si tu as 40 bits de mémoires, vaut mieux n'avoir qu'à adresser 8 mots des 5 bits. Tu as gagné :)
- [^] # Re: Caractères absurdes
  
  Posté par lendemain le 07 février 2012 à 12:11. Évalué à 5.
  
  C'est pour faire des rébus.
- [^] # Re: Caractères absurdes
  
  Posté par Professeur Méphisto le 07 février 2012 à 15:27. Évalué à 6.
  
  Si si, il y a un caractère tas de merde.
  
  si Windows©® supporte l'unicode, c'est justifié.
  
  ok, je sors.
- [^] # Re: Caractères absurdes
  
  Posté par FantastIX le 07 février 2012 à 18:53. Évalué à 1.
  
  Si si, il y a un caractère tas de merde.
  
  Et le sac? y en a un? Nan, je demande parce qu'on pourrait peut-être les combiner et ça ferait l'injure parfaite. Enfin, bon, moi je dis ça et je dis rien.
  
  --> []
- [^] # Re: Caractères absurdes
  
  Posté par psychoslave__ (site web personnel) le 07 février 2012 à 23:11. Évalué à 3.
  
  Il paraît que c'est à cause d'opérateurs télécoms japonais, qui ont intégré ce genre de caractère sur les mobiles de leur client et les ont imposé ensuite au consortium.
  
  Et non, toujours pas de copyleft, de symboles pour écrire des machines de turing ou des circuits électroniques.
  
  Cela dit, un pan d'unicode est réservé aux symboles « personnalisé » (et poukoi kils ne lont pas utilisé les télécoms japonais, hum ?), donc faudrait surtout que quelqu'un se colle à la conception des fontes idoines pour commencer.
  - [^] # Re: Caractères absurdes
    
    Posté par weonbin le 08 février 2012 à 08:37. Évalué à 1.
    
    Cela dit, un pan d'unicode est réservé aux symboles « personnalisé » (et poukoi kils ne lont pas utilisé les télécoms japonais, hum ?)
    
    Parce que comme ça quand quelqu'un t'enverra un smiley à partir de son téléphone japonais, tu pourras le voir sur ton client mail standard ?
    - [^] # Re: Caractères absurdes
      
      Posté par Axioplase ıɥs∀ (site web personnel) le 09 février 2012 à 10:44. Évalué à 3.
      
      Ben, en fait, quand j'envoie des smileys à partir de mon téléphone japonais, il semblerait justement que gmail (client standard ?) les lise correctement !
      - [^] # Re: Caractères absurdes
        
        Posté par weonbin le 09 février 2012 à 11:00. Évalué à 1.
        
        Gmail interprete les extensions non standard qu'ont fait les operateurs a SJIS et les transcrit, mais si tu lis les mails sur un client en dur, ca fait du mojibake, meme probleme si tu les envoie a quelqu'un qui utilise un autre service de mail.
- [^] # Re: Caractères absurdes
  
  Posté par Space_e_man (site web personnel) le 08 février 2012 à 11:26. Évalué à 1. Dernière modification le 08 février 2012 à 11:28.
  
  http://boingboing.net/2012/02/03/unicodes-pile-of-poo-cha.html
  
  Ce que je trouve dommage, c'est qu'il ne s'agit pas d'une composition avec accent. J'aurais pu le mettre sur un certain W...
  PS: Le caractère en question ne passe pas ici... J'ai du modifier mon commentaire...
  - [^] # Re: Caractères absurdes
    
    Posté par Grunt le 09 février 2012 à 11:28. Évalué à 2.
    
    PS: Le caractère en question ne passe pas ici... J'ai du modifier mon commentaire...
    
    C'est surtout qu'il n'est pas pris en charge par ton navigateur et par la plupart des autres. Mais tu aurais très bien pu poster le caractère unicode (qui serait apparu sous la forme d'un carré avec sa valeur hexa dedans) et, avec le temps, les gens mettant à jour leur navigateur et recevant les nouveaux caractères auraient fini par le voir.
    
    THIS IS JUST A PLACEHOLDER. YOU SHOULD NEVER SEE THIS STRING.
    - [^] # Re: Caractères absurdes
      
      Posté par Space_e_man (site web personnel) le 22 février 2012 à 00:28. Évalué à 1. Dernière modification le 22 février 2012 à 00:30.
      
      poster le caractère unicode (qui serait apparu sous la forme d'un carré avec sa valeur hexa dedans)
      
      C'est ce que j'ai fais ! ... et à partir de là, la suite de mon texte avait totalement disparu. J'essaye encore : 💩
      ok, ça marche... Par contre, en voulant modifier mon commentaire, le texte disparait à partir de ce caractère.
- [^] # Re: Caractères absurdes
  
  Posté par Anonyme le 08 février 2012 à 13:24. Évalué à 3. Dernière modification le 08 février 2012 à 13:24.
  
  Les clowns ont le droit de ne pas être oublié par les décideurs d'Unicode, c'est compris ?
# Unicode art

Posté par Marotte ⛧ le 07 février 2012 à 15:22. Évalué à 3.

Unicode art

La galerie n'est pas très remplie ! Allez on se lance :)
# ch c'h

Posté par ɹǝıʌıʃO le 07 février 2012 à 17:01. Évalué à 2.

En attendant, ch et c'h s'écrivent toujours sous forme de deux et trois caractères, respectivement, ce qui complique le traitement des langues qui les considèrent comme un seul caractère. C'est le cas au moins du breton pour les deux, du tchèque pour ch. Et ce, alors même qu'il existe des caractères pour certaines ligatures, comme ﬀ (ff). Mais voyons le bon côté des choses : avec un peu de chance, à force d'ajouter des hiéroglyphes et des kikoolols, on finira par en trouver des ressemblants.
- [^] # Re: ch c'h
  
  Posté par CrEv (site web personnel) le 07 février 2012 à 17:19. Évalué à 4.
  
  certaines ligatures, comme ﬀ (ff)
  
  Si je ne me trompe, là il s'agit bien d'un problème de ligature, donc de typographie. En aucun cas ce n'est vu comme un seul caractère (en tout cas pas par une langue). Il ne s'agit au final que d'un problème "visuel", non ?
  Ce que je veux dire par là c'est que j'ai l'impression qu'on peut difficilement faire un parallèle entre les deux.
  
  Maintenant, ça reste une bonne question, et d'ailleurs comment ça se passe pour le tchèque ? (oui, le tchèque est plus loin de moi, mais n'est-il pas, un poil, plus utilisé que le breton ? ;-) )
  - [^] # Re: ch c'h
    
    Posté par Marotte ⛧ le 07 février 2012 à 19:26. Évalué à 2.
    
    C'est pareil en polonais il me semble : sz et cz (au moins) sont considérés comme une seule lettre (consonne).
  - [^] # Re: ch c'h
    
    Posté par neil le 07 février 2012 à 20:02. Évalué à 3. Dernière modification le 07 février 2012 à 20:06.
    
    Les ligatures c'est bien un aspect visuel, mais ch est utilisé comme lettre à part dans certaines langues. Il y a eu un problème semblable avec l'inclusion du œ dans le 8859-1, les représentants francophones pensaient que c'était une ligature !
    
    Dans mes dictionnaires espagnols il y a une entrée pour ch, et 29 lettres sont spécifiées (avec ll, ñ). Dans les nouveaux dictionnaires l'ordre change, mais l'académie espagnole les a considéré comme des lettres à part. Ça a changé en 2010 je pense. Peut-être à cause des problèmes informatiques, comme pour les ortographes avec œ en France.
    
    (s/espagnol/castillan/ pour les ibériques)
  - [^] # Re: ch c'h
    
    Posté par barmic le 07 février 2012 à 20:02. Évalué à 2.
    
    Justement regarde bien « ﬀ » est un unique caractère unicode.
    
    Tous les contenus que j'écris ici sont sous licence CC0 (j'abandonne autant que possible mes droits d'auteur sur mes écrits)
    - [^] # Re: ch c'h
      
      Posté par Antoine le 07 février 2012 à 20:13. Évalué à 2.
      
      Ce qui est parfaitement idiot puisqu'une ligature n'est pas une lettre, juste un enjolivement graphique.
    - [^] # Re: ch c'h
      
      Posté par CrEv (site web personnel) le 07 février 2012 à 20:45. Évalué à 3.
      
      Oui, un caractère unicode.
      Mais ça n'a rien à voir (justement) avec un caractère du point de vue de langues et c'est l'objet de la question.
      En gros, des caractères inexistant d'un point de vue de langue sont présents en unicode pour des questions de ligature (et donc uniquement de style graphique, de typo).
      Mais par contre, d'autres, existant d'un point de vue langue, ne sont pas présent en unicode.
      D'ailleurs, une question "bête" : ces caractères (comme ch) s'écrivent comment à la main ? Comme l'association de deux caractères avec une vrai ligature ce qui fait qu'ils n'en font qu'un ou est la juxtaposition de deux caractères ? Dans le premier je trouverais normal que ce soit présent (ce serait une bonne chose logique) dans le deuxième c'est différent car c'est juste un sens spécial donné à deux caractères lorsqu'ils sont l'un à côté de l'autre.
    - [^] # Re: ch c'h
      
      Posté par rewind (Mastodon) le 07 février 2012 à 21:16. Évalué à 4.
      
      C'est un caractère unicode. Mais les caractères unicode ne se confondent pas avec les "lettres". 'a' et 'A' sont bien la même lettre mais deux caractères unicode différents.
      - [^] # Re: ch c'h
        
        Posté par Antoine le 08 février 2012 à 01:23. Évalué à 2.
        
        Je ne sais pas ce que tu appelles une "lettre" exactement, mais majuscules et minuscules sont bien des symboles distincts sur le plan de la langue : il y a des règles orthographiques qui gouvernent leur usage (si j'avais commencé cette phrase par "je" au lieu de "Je", ç'aurait été une faute).
        
        [^] # Re: ch c'h
        
        Posté par claudex le 09 février 2012 à 15:43. Évalué à 2.
        
        Si tu avais commencé la phrase par une virgule, ça aurait aussi été une faute, les règles orthographiques ne sont pas uniquement liées aux lettres.
        
        « Rappelez-vous toujours que si la Gestapo avait les moyens de vous faire parler, les politiciens ont, eux, les moyens de vous faire taire. » Coluche
        
        [^] # Re: ch c'h
        
        Posté par Antoine le 09 février 2012 à 16:20. Évalué à 2.
        
        D'accord, mais utiliser une ligature ou pas ("ff") n'a pas d'incidence sur l'orthographe.
        
        [^] # Re: ch c'h
        
        Posté par Michaël (site web personnel) le 09 février 2012 à 16:39. Évalué à 4.
        
        D'accord, mais utiliser une ligature ou pas ("ff") n'a pas d'incidence sur l'orthographe.
        
        En fait la différence entre orthotypographie et orthographe n'est pas toujours tout à fait claire.
        
        Dans certains mots, l'écriture avec ligature est une faute, c'est le cas de shelfful en anglais (l'utilisation d'une ligature ff est incorrecte) et je ne connais pas d'exemple en français.
        
        Dans certains mots, la césure modifie l'orthographe! C'est le cas en allemand, où backen devient bak-ken et Bettuch (ancienne orthographe) devient Bett-tuch.
# CCC

Posté par Sylvain Sauvage le 10 février 2012 à 08:27. Évalué à 3. Dernière modification le 10 février 2012 à 08:27.

Pour info, « Miao » fait référence à une langue asiatique (celle des Hmong), pas à ces branleurs qui font rien que jouer au babyfoot en fumant des pétards…

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.