Journal : Explosion d'UNICODE sur le web
Posté par IsNotGood () le 10 mai 2008
Si on en croit les statistiques de google, UNICODE est devenu le codage de caractère le plus utilisé sur Internet :
http://googleblog.blogspot.com/2008/05/moving-to-unicode-51.(...)
Notons qu'aujourd'hui la majorité des distributions utilise UNICODE par défaut.
Bientôt la fin des charsets. Hourra !
http://googleblog.blogspot.com/2008/05/moving-to-unicode-51.(...)
Notons qu'aujourd'hui la majorité des distributions utilise UNICODE par défaut.
Bientôt la fin des charsets. Hourra !
> Lire le journal (56 commentaires, moyenne: 3,7).
Vous avez demandé le commentaire #929722.



Bientôt, l'unicode sera partout...
... ou presque
Topic for #linuxfr: http://linuxfr.org | ISO8859-15 UNIQUEMENT (pas d'utf8)Quelqu'un a une idée de la raison pour laquelle cet anachronisme perdure ?
[+] [^]Re: Bientôt, l'unicode sera partout...
Sûr ?
Dans les pages j'ai :
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />[^]Re: Bientôt, l'unicode sera partout...
Il parle d'IRC (cf. https://linuxfr.org/~Sufflope/23135.html tiens :D).
Le meilleur hébergeur de forums, gratuit et sans pub !
[^]Re: Bientôt, l'unicode sera partout...
Il y a pas si longtemps les clients en console merdouillaient avec l'utf8, c'est pas encore tout à fait un temps révolu, cela vient peut-être de ça.
[^]Re: Bientôt, l'unicode sera partout...
Parce-que les conversions, c'est parfois super-pête-burne, je suppose ?
[^]Re: Bientôt, l'unicode sera partout...
Quelqu'un a une idée de la raison pour laquelle cet anachronisme perdure ?
Oui, Gniarf.
[^]Re: Bientôt, l'unicode sera partout...
Pour mémoire :
Le canal IRC #linuxfr n'est pas lié au site LinuxFr.org. Ce n'est pas l'équipe du site qui gère ce canal.
[^]Re: Bientôt, l'unicode sera partout...
Je ne sais pas mais le fait de le demander suffit à te faire kicker, le fait de te connecter avec un client UTF-8 aussi.
[+] [^]Re: Bientôt, l'unicode sera partout...
Peut-être parce que si l'on se limite au français, utf-8 n'apporte rien ?
Th. Thomas.
[^]Re: Bientôt, l'unicode sera partout...
©®µ‰‱↞↟↠↡↢↣↤↥↿⇌⇉⇖⇣⇱⇲⇶⇼∫∑∰⋂⌨⍞①②⑥☎☕☔☢☯☺☹♜♞⚢⚣⚄
On peut aussi se limiter à de ASCII. Il y en a encore plein qui utilise un qwerty même en français.
[^]Re: Bientôt, l'unicode sera partout...
©®µ‰‱↞↟↠↡↢↣↤↥↿⇌⇉⇖⇣⇱⇲⇶⇼∫∑∰⋂⌨⍞①②⑥☎☕☔☢☯☺☹♜♞⚢⚣⚄
Donne en ISO-8859-1 :
©®µ‰‱↞↟↠↡↢↣↤↥↿⇌⇉⇖⇣⇱⇲⇶⇼∫∑∰⋂⌨âžâ‘ ②⑥☎☕☔☢☯☺☹♜♞⚢⚣⚄
[^]Re: Bientôt, l'unicode sera partout...
Ben quoi? Avec l'habitude, je suis sûr que ça devient parfaitement lisible!
Les gars dans Matrix ils arrivent bien à voir des blondes au milieu des symboles!
====> [ ]
[^]Re: Bientôt, l'unicode sera partout...
Non c'est une rousse
Attend j'arrive =>[ ].
[^]Re: Bientôt, l'unicode sera partout...
s/voir des/rêver de/
[^]Re: Bientôt, l'unicode sera partout...
2 tte fasson g pa 2 aksen sur mon mobil
You can't grep dead trees...
[^]Re: Bientôt, l'unicode sera partout...
Peut-être parce que si l'on se limite au français, utf-8 n'apporte rien ?ON croirait entendre billou.
Plus de 640K ? Laisse moi rire.
Plus de 256 caractères ? Ridicule !
Comment tu fais si ça te prends des fois de parler de maths avec tes copains de chan ?
A⊕B⇔(A⋁B)⋀¬(A⋁B)
∀m, ∃n∈ℕ, n=m+1
i=√2
{n∈ℕ/16<n²<25}=∅
(Je précise qu'il existe bien des mathématiciens francophones).
Le libre vaincra, tout est déjà joué.
[^]Re: Bientôt, l'unicode sera partout...
Comment tu fais si ça te prends des fois de parler de maths avec tes copains de chan ?
A⊕B⇔(A⋁B)⋀¬(A⋁B)
∀m, ∃n∈ℕ, n=m+1
i=√2
{n∈ℕ/16<n²<25}=∅
Facile ! Avec l'ASCII ART.
A(+)B<=>(A\/B)/\--,(A\/B)
\-/m, 3n€N, n=m+1
i=v'(2)
{n€N/16<n^2<25}=-0-
Comme quoi, l'UTF 8, ça sert vraiment à rien.
[^]Re: Bientôt, l'unicode sera partout...
Facile ! Avec l'ASCII ART.
A(+)B<=>(A\/B)/\--,(A\/B)
\-/m, 3n€N, n=m+1
i=v'(2)
{n€N/16<n^2<25}=-0-
* Sarcastic has been banned by plop (leetspeak)
[+] [^]Re: Bientôt, l'unicode sera partout...
ON croirait entendre billou.
Plus de 640K ? Laisse moi rire.
Plus de 256 caractères ? Ridicule !
Pour une page web, du courrier, etc., je suis bien d'accord.
Comment tu fais si ça te prends des fois de parler de maths avec tes copains de chan ?
Quant à savoir si IRC est adapté à des démonstrations mathématiques, le doute m'habite...
Th. Thomas.
[^]Re: Bientôt, l'unicode sera partout...
J'aime cette habitude désuette qui perdure chez les "bourrés de crânes" qui voient leur monde s'écrouler sans pouvoir y trouver de vrai arguments à redire.
Ouais, bon peut être que ça peut apporter dans certain cas, bon ok ça a pas de vrais désagréments, mais bon, quand même, on a toujours fait comme ça. Un peu de mauvaise foi, et les "pas vraiment désagréments" deviennent des montagnes.
[^]Re: Bientôt, l'unicode sera partout...
>Quant à savoir si IRC est adapté à des démonstrations
>mathématiques, le doute m'habite...
Surement pas sans UTF-8 en tout cas...
[+] [^]Re: Bientôt, l'unicode sera partout...
L'utf8 ca apporte le fait qu'au lieu de gèrer le charset, on est maintenant obligé de modifier tout le code pour faire appel à des librairies pour traiter le tout. On ne fait que déplacer le problème.
En plus, ca entraîne un surcout cpu pour tous ces traitements.
L'unicode c'est bien comme base commune quand on a des langages qui le nécessitent à causes de charsets exotiques qui poseront problème sur le client.
Après si c'est pour recoder en unicode une app Francaise destinée au marché Francais, ce n'est qu'une perte de temps.
[^]Re: Bientôt, l'unicode sera partout...
L'utf8 ca apporte le fait qu'au lieu de gèrer le charset, on est maintenant obligé de modifier tout le code pour faire appel à des librairies pour traiter le tout.
Euh... Perso j'ai besoin librairie que pour supporter les charsets, le contraire de ce que tu dis. J'ai besoin d'une librairie pour pouvoir convertir les charsets en Unicode et pouvoir travailler en Unicode en mémoire... Et c'est super-galère.
Pour UTF-8, aucun soucis, une petite 10aine de ligne de code (c'est long à cause des vérifications) et hop UTF-8 du monde entier en Unicode interne à mon appli.
Et quand tout est en UTF-8, tu ne gère rien...
Après si c'est pour recoder en unicode une app Francaise destinée au marché Francais, ce n'est qu'une perte de temps.
Ca existe encore ça? Pour info, le monde d'aujourd'hui n'est pas centré sur la France... Et les briques que tu construis maintenant en UTF-8 seront réutilisable pour d'autres projet, peut-être pas franco-français...
Et sinon, pour ton "app Francaise destinée au marché Francais", tu fais comment quand un japonais est depuis 30 ans en France, mais a utilisé *un* caractère japonais qui lui plait dans un nom (par exemple, il a mis un truc à lui dans un commentaire, pour dire "pour info les gars, en japonais, on écrit comme ça"). Comment tu fais pour écrire des formules mathématiques? Comment tu fais pour etc...
Tu ne sais pas comment les gens vont utiliser ton appli, même en France. UTF-8 n'est pas un conseil, c'est une obligation : une personne ne faisant pas ça aujourd'hui mérite d'être mis à la porte...
[+] [^]Re: Bientôt, l'unicode sera partout...
Sauf qu'on en revient au même point. T'auras de l'UTF16, 8 et autre et toujours des conversions à faire. iconv a toujours de beaux jours devant lui.
De plus, en publiant une app unicode, si c'est sur le web, c'est pas un problème, les navigateurs le supportent. Mais d'autres type d'applications, sans regarder l'existant et l'utilisation finale, c'est suicidaire. Les gros système ne sont généralement pas prêts pour l'unicode car de nombreuses applications ne le gèrent toujours pas. Ce avec à la clé des pb de sécurité et autre. Tu fais référence à une brique, peut -être, mais si c'est pour être incorporé à un système existant, il faut que ta brique prenne en compte l'existant, tu ne peux pas demander de refaire le reste du système pour que ce soit compatible avec ta brique.
Par ailleurs, si ton langage est natif unicode, comme tu semble le mentionner, ça n'empêche pas que certains langages doivent passer par une librairie spécialisée pour le traiter .
utf8 résout pas mal de problèmes, mais ne fait pour l'instant que réduire le nombre de charsets, car on aura toujours des cas ou la compatibilité ascendente ne pourra être exploitée. 'Partout' sur le web oui, mais ailleurs, c'est pas encore le cas.
[^]Re: Bientôt, l'unicode sera partout...
oui mais elles sont ou ses touches je veux dire comment on fait pour les avoir
c'est vrai qu'avec ça utf-8 roxor des ours
je l'ai meme vu utiliser dans l'usenet et je dois dir que sur fsm ce serait cool de l'utiliser
pour protester contre la dadvsi , je n'achete plus de produit soumis au droit d'auteur ou voisins
[^]Re: Bientôt, l'unicode sera partout...
Certes, c'est génial, mais pour les sortir tous ces caractères, tu fais comment?
Question naïve et sans agressivité, à ma connaissance, la seule solution à ce jour pour les trucs du genre c'était style le plugin LaTeX pour pidgin, de plus je n'ai quasi jamais utilisé IRC.
Ceci dit, pour d'autres exemples, on pourrait se poser la question: comment gérer tous les jeux de caractères fournis par Unicode et utiles ? (je parle pas des langues différentes, ça c'est plutôt au point, mais tous ces symboles)
[^]Re: Bientôt, l'unicode sera partout...
Avec un IME genre scim, il suffit de taper le nom du caractere, par exemple si je tape "arufa" (j'ai que les tables japonaises d'installées mais ca doit donner le même résultat pour d'autres langues) j'obtiendrai une liste avec 4 choix :
α
アルファ
Α
あるふぁ
Ensuite il me reste plus qu'à choisir le bon
[^]Re: Bientôt, l'unicode sera partout...
J'utilise régulièrement SCIM pour taper en Chinois, je connais déjà
Ma question porte plutôt sur les symboles genre ceux postés ci-dessus à titre de démonstration.
[^]Re: Bientôt, l'unicode sera partout...
Si tu utilises une configuration de clavier qui le permet comme le dvorak-bépo.
Sinon tu copies-colles depuis une table des caractères :-)