La dernière version d'Unicode a été publiée ce 31 janvier. C'est une version mineure ajoutant 732 nouveaux caractères et portant leur nombre à 110 116. La dernière version majeure, la 6.0, date de février 2011.
Les nouveaux blocs sont :
- 08A0..08FF Arabic Extended-A
- 1CC0..1CCF Sundanese Supplement
- AAE0..AAFF Meetei Mayek Extensions
- 10980..1099F Meroitic Hieroglyphs
- 109A0..109FF Meroitic Cursive
- 110D0..110FF Sora Sompeng
- 11100..1114F Chakma
- 11180..111DF Sharada
- 11680..116CF Takri
- 16F00..16F9F Miao
- 1EE00..1EEFF Arabic Mathematical Alphabetic Symbols
Unicode est développé dans le but de remplacer les pages de codes nationales afin de faciliter les échanges mondiaux par le bais de l'outil informatique. Il s'agit de donner à chaque caractère de n'importe quel système d’écriture un nom et un identifiant unique, quelle que soit la plate-forme informatique.
Ce travail est coordonné par le Consortium Unicode (association privée à but non lucratif).
Aller plus loin
- Les détails de la nouvelle version (201 clics)
- Les nouveaux caractères (405 clics)
- Le consortium Unicode (39 clics)
- BoingBoing : Unicode's "Pile of Poo" character (599 clics)
- Google : Unicode over 60 percent of the web (120 clics)
# Copyleft
Posté par Goffi (site web personnel, Mastodon) . Évalué à 8.
Et toujours pas de symbole copyleft :(
[^] # Re: Copyleft
Posté par Francois Revol (site web personnel) . Évalué à 2.
C'est pas faute de l'avoir proposé à RMS, mais il s'en fout un peu, donc faudra faire ça sans lui. En tout cas essayer de faire passer ça différemment par la FSF[E].
# Caractères absurdes
Posté par 🚲 Tanguy Ortolo (site web personnel) . Évalué à 2.
Ce derniers temps, ils y ont aussi ajouté de vraies conneries, des dessins qui n'ont absolument rien à faire dans un jeu de caractères à moins que celui-ci ne soit vraiment destiné à des clowns. Par exemples, le tas de merde. Si si, il y a un caractère tas de merde.
[^] # Re: Caractères absurdes
Posté par Francois Revol (site web personnel) . Évalué à 4.
Alors qu'ils ont refusé d'ajouter un plan Klingon au prétexte que c'est un script :-(((((((
[^] # Re: Caractères absurdes
Posté par Marotte ⛧ . Évalué à 4. Dernière modification le 07 février 2012 à 11:11.
Le tas de merde, ou ne serait-ce pas simplement une merde ou une bouse, ça peut servir à signifier qu'il y a eu un problème quelque part. Un peu comme on utilise la bombe pour signifier un bug ou un crash dans un programme.
[^] # Re: Caractères absurdes
Posté par Efemero (site web personnel) . Évalué à -10.
[^] # Re: Caractères absurdes
Posté par Anonyme . Évalué à 3.
Signalons aussi le caractère vide, qui...
[^] # Re: Caractères absurdes
Posté par Marotte ⛧ . Évalué à 2.
Je me doutais d'un truc comme ça pour le message d'Efemero. J'ai néanmoins moinssé son commentaire car sans explication c'était inutil (selon moi). Merci pour la précision.
[^] # Re: Caractères absurdes
Posté par cjlano . Évalué à 10. Dernière modification le 07 février 2012 à 11:19.
Dans ce cas là, où doit-on s'arrêter?
Pourquoi y a-t-il des smileys dans Unicode?
☹ ☺ ☻
Pourquoi y a-t-il des flèches dans Unicode?
←↑↓→
Pourquoi y a-t-il des caractères "météo" dans Unicode?
☀ ☁ ☂ ☃
Des notes de musique?
♩ ♪ ♫ ♬ ♭ ♮ ♯
Les symboles des échecs?
♔♕♖♗♘♙
Et pas de "caca"?
Si ces symboles sont présents, c'est qu'ils sont utiles à certains. J'ai vu ici même des pseudos "note de musique". A quand la signature "caca"?
sources:
http://www.haypocalc.com/wiki/Caract%C3%A8res_Unicode
https://en.wikipedia.org/wiki/Miscellaneous_Symbols
A+
[^] # Re: Caractères absurdes
Posté par 🚲 Tanguy Ortolo (site web personnel) . Évalué à 2.
Bon, mauvais exemple, le tas de merde. Il me semblait avoir vu passer un caractère du genre « ours en train de manger du miel », ce qui était déjà plus inquiétant…
[^] # Re: Caractères absurdes
Posté par CrEv (site web personnel) . Évalué à 6.
mouai
Je doute tout de même que les caractères apparaissent par magie dans unicode, non ?
Dans ce cas c'est sûrement que quelqu'un a trouvé une utilité, tu ne crois pas ?
Moi je trouve plutôt bien qu'il y ait plein de caractères du genre (dans unicode, on pourrait aussi avoir une police spécifique, comme webdings & co) ça permet d'avoir des interfaces (même textes) plus graphiques, plus représentatives, sans charger d'images (ce qui permet par exemple d'avoir des pages web plus sympa tout en étant légères. Et ça c'est un bon point.
[^] # Re: Caractères absurdes
Posté par oinkoink_daotter . Évalué à 5.
Mhhhh, je dirais que c'est directement tiré des emoji japonais qui à vue de nez doivent être antérieurs à unicode (ou à sa démocratisation).
[^] # Re: Caractères absurdes
Posté par Troy McClure (site web personnel) . Évalué à 1.
sans charger d'images (ce qui permet par exemple d'avoir des pages web plus sympa tout en étant légères
Oui, on remplace des ptits gifs de 0.2ko par une bonne grosse fonte 100% unicode avec etrons et bonhomme de neige qui pese seulement 80Mo c'est bon pour la legereté
[^] # Re: Caractères absurdes
Posté par CrEv (site web personnel) . Évalué à 2.
oui et non, car le but serait d'avoir ta police sur le terminal de lecture, non ?
[^] # Re: Caractères absurdes
Posté par NeoX . Évalué à 3.
ou simplement qu'ils ont été importé tel quel des tables existantes, non ?
[^] # Re: Caractères absurdes
Posté par Laurent Pointecouteau (site web personnel, Mastodon) . Évalué à 4. Dernière modification le 07 février 2012 à 14:57.
Tu oublies le petit cœur (♥♥♥), très populaire parmi les jeunes filles en fleur sur Facebook.
Et puis bon, c'est rigolo tout ça, ça me rappelle quand je laissais des conneries en Wingdings dans mes .doc pour faire enrager la prof de techno au collège (le labo avait Windows 3.11 et un mystérieux OS WindowMaker, mais pour une raison inconnue il était défendu de booter dessus).
[^] # Re: Caractères absurdes
Posté par NanoTech . Évalué à 10.
Unicode n'a pas seulement pour objectif de contenir tous les scripts des langues vivantes et mortes, mais aussi de contenir tous les caractères de tous les encodages qui ont été utilisés, ce qui permet de convertir d'un encodage X vers Unicode, puis à nouveau vers X, sans perte.
Par exemple, les notes de musique, les smileys et les flèches se trouvaient dans le jeu de caractères CP-437 utilisé dans le tampon de mémoire de l'écran des cartes VGA en mode texte, pour les caractères numérotés de 0 à 31.
Ainsi, un émulateur de terminal DOS peut vouloir supporter ces symboles, tout en utilisant de l'Unicode en interne.
Par contre, je ne sais pas d'où vient le "caca".
[^] # Re: Caractères absurdes
Posté par Jeanuel (site web personnel) . Évalué à 7.
Tu as vraiment besoin qu'on te fasse un dessin ?
[^] # Re: Caractères absurdes
Posté par Benoît Sibaud (site web personnel) . Évalué à 1.
Je dirais bien de chez Sam, mais je me demande d'où ? Cf http://caca.zoy.org/wiki/libcaca
[^] # Re: Caractères absurdes
Posté par nud . Évalué à 1.
Au moins maintenant il pourra afficher son logo dans le terminal \o/
[^] # Re: Caractères absurdes
Posté par Zenitram (site web personnel) . Évalué à 5. Dernière modification le 07 février 2012 à 11:23.
Bravo, tu as cliqué sur le 4ème lien de la dépêche.
Les smileys sont du même acabit, faudrait les virer aussi. On s'en fou si des gens les utilisent et font des suites de caractères bizarres (et difficile à traiter, parfois la suite de caractère est voulue) à la place si on ne met pas le code Unicode idoine.
Faudrait aussi supprimer les icônes de météo, de musique... Qui ne sont pas des caractère valide façon Tanguy.
Ou on peut aussi comprendre l'usage... Oui, un "tas de merde" est utilisé comme pour les dessins de météo.
[^] # Re: Caractères absurdes
Posté par Xavier Teyssier (site web personnel) . Évalué à 5.
Et en plus d'un avis particulièrement tranché, te serait-il possible de nous faire part d'une information pertinente, au hasard, le numéro dudit caractère ?
[^] # Re: Caractères absurdes
Posté par Zenitram (site web personnel) . Évalué à 5.
Pas du numéro dudit caractère, mais le numéro dans la liste des liens de la dépêche : 4 (3 pour les informaticiens qui commencent à compter à partir de 0)
Tu auras tout!
[^] # Re: Caractères absurdes
Posté par ǝpɐןƃu∀ nǝıɥʇʇɐW-ǝɹɹǝıԀ (site web personnel) . Évalué à 3.
s/"commencent à compter à partir de 0"/"déréférencent les adresses en commençant sans décalage"/g
Me gourerai-je ? Ou alors, s'agit-il de désigner des gens qui maîtrisent mal le C et les langages similaires ?
« IRAFURORBREVISESTANIMUMREGEQUINISIPARETIMPERAT » — Odes — Horace
[^] # Re: Caractères absurdes
Posté par monde_de_merde . Évalué à 9.
Je suis totalement d'accord.
Sérieusement des caractères accentués, non mais on va où ? Pourquoi pas des kanjis ou même des hiéroglyphes.
Comment ça pas vendredi ?
[^] # Re: Caractères absurdes
Posté par Grunt . Évalué à 7.
La vie etait quand meme plus simple en 7 bits.
THIS IS JUST A PLACEHOLDER. YOU SHOULD NEVER SEE THIS STRING.
[^] # Re: Caractères absurdes
Posté par Kerro . Évalué à 3.
VOIR MEME EN 6 BITS
/me ne pige toujours pas pourquoi une part importante des utilisateurs en entreprise sont en permanence en majuscules
[^] # Re: Caractères absurdes
Posté par Grunt . Évalué à 10.
THIS IS JUST A PLACEHOLDER. YOU SHOULD NEVER SEE THIS STRING.
[^] # Re: Caractères absurdes
Posté par nud . Évalué à -1. Dernière modification le 09 février 2012 à 10:03.
[citation needed]
[^] # Re: Caractères absurdes
Posté par floriang . Évalué à -1.
Parce qu’ils n’ont pas de pavé numérique pour accéder plus facilement aux chiffres ou qu’ils trouvent les capitales plus lisibles… :-/
[^] # Re: Caractères absurdes
Posté par Marotte ⛧ . Évalué à 0.
C'EST TOUT SAUF LISIBLE ! Si Gutenberg et ses confrères n'avaient pas voulu se faire chier et que ça n'avait gêné personne ils auraient dropé les minuscules (ou les majuscules), bizarrement il ne l'ont pas fait... Après on pourrait aussi dire que l'écriture cunéiforme ne fait pas cette distinction, mais bon, elle est même pas dans Unicode ! Si ? (flemme de chercher moi-même toussa).
[^] # Re: Caractères absurdes
Posté par monde_de_merde . Évalué à 4.
Hé si : http://www.unicode.org/charts/PDF/U12000.pdf et http://www.unicode.org/charts/PDF/U12400.pdf
Youhouuu ! L'Unicode c'est trop bien !
[^] # Re: Caractères absurdes
Posté par Antoine . Évalué à 3.
LES ROMAINS NE CONNAISSAIENT PAS LES MINUSCULES, TOUT ÉTAIT ÉCRIT EN MAJUSCULES.
(cf. http://fr.wikipedia.org/wiki/Alphabet_latin)
[^] # Re: Caractères absurdes
Posté par monde_de_merde . Évalué à 7.
Et leur empire s'est cassé la gueule.
Enfin bon, j'attendrai un vendredi pour franchir le pas suivant.
[^] # Re: Caractères absurdes
Posté par Marotte ⛧ . Évalué à 3. Dernière modification le 09 février 2012 à 00:12.
C'est un peu le destin de tout empire...
M'est d'avis que c'est surtout leur notation à la con des nombres qui est la cause de leur déclin :)
[^] # Re: Caractères absurdes
Posté par windu.2b . Évalué à 1.
[^] # Re: Caractères absurdes
Posté par Benoît Sibaud (site web personnel) . Évalué à 7.
Cela donnerait plutôt en latin archaïque (pas de G, J, U, W, Y, Z) ou en graphie classique (pas de J, U, W) :
LES ROMAINS NE CONNAISSAIENT PAS LES MINVSCVLES, TOVT ETAIT ECRIT EN MAIVSCVLES.
Dans les autres infos inutiles : les Romains devaient éviter les mots subjugueriez et
zigzagueriez qui sont ceux contenant le plus de GJUWYZ dans /usr/share/dict/french, et
jusqu'au-boutisme pour JUW. Oui, ça n'a pas grand intérêt de le savoir, je vous l'accorde. Pas plus que arrière-grand-{père,mère,parent}s? comme mots contenant le plus de 'r' dans ce dico. ->[]
[^] # Re: Caractères absurdes
Posté par Tonton Th (Mastodon) . Évalué à 3.
POURQUOI SE LIMITER A 6 ALORS QUE 5 C,A MARCHE TRES BIEN ?
[^] # Re: Caractères absurdes
Posté par Kerro . Évalué à 2.
Avec 5 bits (32 combinaisons) tu n'aurais pas même pu écrire ton message qui contient des lettres (26 caractères), des chiffres (10 caractères), de la ponctuation (quelques caractères en plus).
Ou alors il faut utiliser des caractères d'échappement... et on n'est plus en 5 bits mais en 5 virgule quelque chose.
[^] # Re: Caractères absurdes
Posté par Marotte ⛧ . Évalué à 6. Dernière modification le 09 février 2012 à 00:09.
On peut s'en sortir avec 5 bits : 26 lettres plus deux signes "(" et ")" :
POURQUOI SE LIMITER A SIX ALORS QUE CINQ CA MARCHE TRES BIEN (INTERROGATION)
Ça suffit pour écrire en LISP :)
[^] # Re: Caractères absurdes
Posté par Tonton Th (Mastodon) . Évalué à 3.
C'est exactement ce que fait le Baudot, il y a deux caractères de bascule : vers les lettres ou vers les chiffres/ponctuations. Hint : il y a un lien dans mon post :)
[^] # Re: Caractères absurdes
Posté par Krunch (site web personnel) . Évalué à 2.
Avec 5 bits il y a tout a fait moyen d'exprimer chacun des 22 symboles que comporte son message. Il y a sans doute moyen d'utiliser moins de bits pour la plupart de ces symboles en faisant appel à Huffman mais je suis un peu rouillé.
pertinent adj. Approprié : qui se rapporte exactement à ce dont il est question.
[^] # Re: Caractères absurdes
Posté par Marotte ⛧ . Évalué à 2.
Après le problème c'est que se restreindre à 5 bits c'est pas très utile. Soit on se restreint à 4 bits, soit on passe au "cran" au dessus et on a de suite 8 bits...
[^] # Re: Caractères absurdes
Posté par Krunch (site web personnel) . Évalué à 3.
Je ne vois pas en quoi un système qui aurait des bytes de 5 bits serait plus absurde qu'un système à 4 bits par byte.
pertinent adj. Approprié : qui se rapporte exactement à ce dont il est question.
[^] # Re: Caractères absurdes
Posté par CHP . Évalué à 2.
Parce que 5 n'est pas une puissance de 2 ?
[^] # Re: Caractères absurdes
Posté par Krunch (site web personnel) . Évalué à 4.
Et ? Depuis quand 6, 7, 9, 12, 18, 36, 39, 40, 48 ou 60 sont des puissances de 2 ?
pertinent adj. Approprié : qui se rapporte exactement à ce dont il est question.
[^] # Re: Caractères absurdes
Posté par Marotte ⛧ . Évalué à 1.
Avant qu'on sache mettre en œuvre des technologies comme les Qbit, on aura qu'une logique électronique à 2 états.
Après je suis d'accord, ce n'est pas absurde dans l'absolu.
[^] # Re: Caractères absurdes
Posté par Tonton Th (Mastodon) . Évalué à 3.
Faux. Dans les années 50/60, les russes ont construit des ordinateurs ternaires. Je pense même qu'en fouillant un peu, on doit pouvoir trouver des émulateurs/simulateurs pour essayer : ça doit être un poil déroutant au niveau de l'assembleur.
[^] # Re: Caractères absurdes
Posté par Marotte ⛧ . Évalué à 2.
Merci c'est très instructif. Ça m'apprendra à parler trop vite et
passer pour un conlaisser aucun doute à ce sujet...[^] # Re: Caractères absurdes
Posté par Michaël (site web personnel) . Évalué à 3.
Si tu as 40 bits de mémoire, c'est plus utile de pouvoir y stocker 8 caractères que 5, non? Rien ne dit que toutes les tailles d'unités d'information doivent être des puissances de 2, d'ailleurs ASCII était initialement un codage 7bits.
[^] # Re: Caractères absurdes
Posté par Marotte ⛧ . Évalué à 2.
Oui pas faux. Mais il me semble quand même que le mot ASCII s'étalait sur 8 bits, en utilisant le 8ème pour la détection d'erreur.
Et puis pour le coup des 8 caractères de 5 bits ou 5 caractère de 8 bits, avec ta mémoire de 40 bits, d'un coté tu peux stocker 8 caractère mais tu auras moins de caractères différents, de l'autre coté tu n'en stockera que 5 mais plus de caractères différents. Donc autant d'information, c'est effectivement la nature de cette information qui déterminera s'il est mieux d'avoir 8 mots de 5 bit ou 5 mots de 8 bits à disposition, mais elle sera toujours représentable (cette information) par l'un ou l'autre, plus ou moins naturellement.
Marotte, Dr ès logique.
[^] # Re: Caractères absurdes
Posté par Michaël (site web personnel) . Évalué à 3. Dernière modification le 09 février 2012 à 21:14.
Qu'est-ce que tu n'as pas compris? :)
Si on parle d'encodage à largeur fixée, c'est effectivement pas idiot de prendre un nombre de bits suffisant à coder toutes les lettres du message.
Il y a des ensembles de données qui sont tellement gros que pour les transférer d'un géographique site à l'autre on utilise… des camions! Ben oui. Dans ce genre de contexte, je suppose qu'un bit est un bit!
[^] # Re: Caractères absurdes
Posté par Marotte ⛧ . Évalué à 2. Dernière modification le 09 février 2012 à 17:25.
Il y a aussi le problème de l'adressage de ces unités d'information, 5 mots de ta mémoire, tu les adresses sur combien de bits ? 2 bits ça suffit pas, mais 3 te permettent d'adresser 8 bits...
[^] # Re: Caractères absurdes
Posté par Marotte ⛧ . Évalué à 3.
Donc effectivement si tu as 40 bits de mémoires, vaut mieux n'avoir qu'à adresser 8 mots des 5 bits. Tu as gagné :)
[^] # Re: Caractères absurdes
Posté par lendemain . Évalué à 5.
C'est pour faire des rébus.
[^] # Re: Caractères absurdes
Posté par Professeur Méphisto . Évalué à 6.
si Windows©® supporte l'unicode, c'est justifié.
ok, je sors.
[^] # Re: Caractères absurdes
Posté par FantastIX . Évalué à 1.
Et le sac? y en a un? Nan, je demande parce qu'on pourrait peut-être les combiner et ça ferait l'injure parfaite. Enfin, bon, moi je dis ça et je dis rien.
--> []
[^] # Re: Caractères absurdes
Posté par psychoslave__ (site web personnel) . Évalué à 3.
Il paraît que c'est à cause d'opérateurs télécoms japonais, qui ont intégré ce genre de caractère sur les mobiles de leur client et les ont imposé ensuite au consortium.
Et non, toujours pas de copyleft, de symboles pour écrire des machines de turing ou des circuits électroniques.
Cela dit, un pan d'unicode est réservé aux symboles « personnalisé » (et poukoi kils ne lont pas utilisé les télécoms japonais, hum ?), donc faudrait surtout que quelqu'un se colle à la conception des fontes idoines pour commencer.
[^] # Re: Caractères absurdes
Posté par weonbin . Évalué à 1.
Parce que comme ça quand quelqu'un t'enverra un smiley à partir de son téléphone japonais, tu pourras le voir sur ton client mail standard ?
[^] # Re: Caractères absurdes
Posté par Axioplase ıɥs∀ (site web personnel) . Évalué à 3.
Ben, en fait, quand j'envoie des smileys à partir de mon téléphone japonais, il semblerait justement que gmail (client standard ?) les lise correctement !
[^] # Re: Caractères absurdes
Posté par weonbin . Évalué à 1.
Gmail interprete les extensions non standard qu'ont fait les operateurs a SJIS et les transcrit, mais si tu lis les mails sur un client en dur, ca fait du mojibake, meme probleme si tu les envoie a quelqu'un qui utilise un autre service de mail.
[^] # Re: Caractères absurdes
Posté par Space_e_man (site web personnel) . Évalué à 1. Dernière modification le 08 février 2012 à 11:28.
http://boingboing.net/2012/02/03/unicodes-pile-of-poo-cha.html
Ce que je trouve dommage, c'est qu'il ne s'agit pas d'une composition avec accent. J'aurais pu le mettre sur un certain W...
PS: Le caractère en question ne passe pas ici... J'ai du modifier mon commentaire...
[^] # Re: Caractères absurdes
Posté par Grunt . Évalué à 2.
C'est surtout qu'il n'est pas pris en charge par ton navigateur et par la plupart des autres. Mais tu aurais très bien pu poster le caractère unicode (qui serait apparu sous la forme d'un carré avec sa valeur hexa dedans) et, avec le temps, les gens mettant à jour leur navigateur et recevant les nouveaux caractères auraient fini par le voir.
THIS IS JUST A PLACEHOLDER. YOU SHOULD NEVER SEE THIS STRING.
[^] # Re: Caractères absurdes
Posté par Space_e_man (site web personnel) . Évalué à 1. Dernière modification le 22 février 2012 à 00:30.
poster le caractère unicode (qui serait apparu sous la forme d'un carré avec sa valeur hexa dedans)
C'est ce que j'ai fais ! ... et à partir de là, la suite de mon texte avait totalement disparu. J'essaye encore : 💩
ok, ça marche... Par contre, en voulant modifier mon commentaire, le texte disparait à partir de ce caractère.
[^] # Re: Caractères absurdes
Posté par Anonyme . Évalué à 3. Dernière modification le 08 février 2012 à 13:24.
Les clowns ont le droit de ne pas être oublié par les décideurs d'Unicode, c'est compris ?
# Unicode art
Posté par Marotte ⛧ . Évalué à 3.
Unicode art
La galerie n'est pas très remplie ! Allez on se lance :)
# ch c'h
Posté par ɹǝıʌıʃO . Évalué à 2.
En attendant, ch et c'h s'écrivent toujours sous forme de deux et trois caractères, respectivement, ce qui complique le traitement des langues qui les considèrent comme un seul caractère. C'est le cas au moins du breton pour les deux, du tchèque pour ch. Et ce, alors même qu'il existe des caractères pour certaines ligatures, comme ff (ff). Mais voyons le bon côté des choses : avec un peu de chance, à force d'ajouter des hiéroglyphes et des kikoolols, on finira par en trouver des ressemblants.
[^] # Re: ch c'h
Posté par CrEv (site web personnel) . Évalué à 4.
Si je ne me trompe, là il s'agit bien d'un problème de ligature, donc de typographie. En aucun cas ce n'est vu comme un seul caractère (en tout cas pas par une langue). Il ne s'agit au final que d'un problème "visuel", non ?
Ce que je veux dire par là c'est que j'ai l'impression qu'on peut difficilement faire un parallèle entre les deux.
Maintenant, ça reste une bonne question, et d'ailleurs comment ça se passe pour le tchèque ? (oui, le tchèque est plus loin de moi, mais n'est-il pas, un poil, plus utilisé que le breton ? ;-) )
[^] # Re: ch c'h
Posté par Marotte ⛧ . Évalué à 2.
C'est pareil en polonais il me semble : sz et cz (au moins) sont considérés comme une seule lettre (consonne).
[^] # Re: ch c'h
Posté par neil . Évalué à 3. Dernière modification le 07 février 2012 à 20:06.
Les ligatures c'est bien un aspect visuel, mais ch est utilisé comme lettre à part dans certaines langues. Il y a eu un problème semblable avec l'inclusion du œ dans le 8859-1, les représentants francophones pensaient que c'était une ligature !
Dans mes dictionnaires espagnols il y a une entrée pour ch, et 29 lettres sont spécifiées (avec ll, ñ). Dans les nouveaux dictionnaires l'ordre change, mais l'académie espagnole les a considéré comme des lettres à part. Ça a changé en 2010 je pense. Peut-être à cause des problèmes informatiques, comme pour les ortographes avec œ en France.
(s/espagnol/castillan/ pour les ibériques)
[^] # Re: ch c'h
Posté par barmic . Évalué à 2.
Justement regarde bien « ff » est un unique caractère unicode.
Tous les contenus que j'écris ici sont sous licence CC0 (j'abandonne autant que possible mes droits d'auteur sur mes écrits)
[^] # Re: ch c'h
Posté par Antoine . Évalué à 2.
Ce qui est parfaitement idiot puisqu'une ligature n'est pas une lettre, juste un enjolivement graphique.
[^] # Re: ch c'h
Posté par CrEv (site web personnel) . Évalué à 3.
Oui, un caractère unicode.
Mais ça n'a rien à voir (justement) avec un caractère du point de vue de langues et c'est l'objet de la question.
En gros, des caractères inexistant d'un point de vue de langue sont présents en unicode pour des questions de ligature (et donc uniquement de style graphique, de typo).
Mais par contre, d'autres, existant d'un point de vue langue, ne sont pas présent en unicode.
D'ailleurs, une question "bête" : ces caractères (comme ch) s'écrivent comment à la main ? Comme l'association de deux caractères avec une vrai ligature ce qui fait qu'ils n'en font qu'un ou est la juxtaposition de deux caractères ? Dans le premier je trouverais normal que ce soit présent (ce serait une bonne chose logique) dans le deuxième c'est différent car c'est juste un sens spécial donné à deux caractères lorsqu'ils sont l'un à côté de l'autre.
[^] # Re: ch c'h
Posté par rewind (Mastodon) . Évalué à 4.
C'est un caractère unicode. Mais les caractères unicode ne se confondent pas avec les "lettres". 'a' et 'A' sont bien la même lettre mais deux caractères unicode différents.
[^] # Re: ch c'h
Posté par Antoine . Évalué à 2.
Je ne sais pas ce que tu appelles une "lettre" exactement, mais majuscules et minuscules sont bien des symboles distincts sur le plan de la langue : il y a des règles orthographiques qui gouvernent leur usage (si j'avais commencé cette phrase par "je" au lieu de "Je", ç'aurait été une faute).
[^] # Re: ch c'h
Posté par claudex . Évalué à 2.
Si tu avais commencé la phrase par une virgule, ça aurait aussi été une faute, les règles orthographiques ne sont pas uniquement liées aux lettres.
« Rappelez-vous toujours que si la Gestapo avait les moyens de vous faire parler, les politiciens ont, eux, les moyens de vous faire taire. » Coluche
[^] # Re: ch c'h
Posté par Antoine . Évalué à 2.
D'accord, mais utiliser une ligature ou pas ("ff") n'a pas d'incidence sur l'orthographe.
[^] # Re: ch c'h
Posté par Michaël (site web personnel) . Évalué à 4.
En fait la différence entre orthotypographie et orthographe n'est pas toujours tout à fait claire.
Dans certains mots, l'écriture avec ligature est une faute, c'est le cas de shelfful en anglais (l'utilisation d'une ligature ff est incorrecte) et je ne connais pas d'exemple en français.
Dans certains mots, la césure modifie l'orthographe! C'est le cas en allemand, où backen devient bak-ken et Bettuch (ancienne orthographe) devient Bett-tuch.
# CCC
Posté par Sylvain Sauvage . Évalué à 3. Dernière modification le 10 février 2012 à 08:27.
Pour info, « Miao » fait référence à une langue asiatique (celle des Hmong), pas à ces branleurs qui font rien que jouer au babyfoot en fumant des pétards…
Suivre le flux des commentaires
Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.