DChars, pour lire/écrire et modifier des caractères unicodes complexes

Posté par  (site web personnel) . Édité par baud123, claudex, Benoît Sibaud, patrick_g et Xavier Teyssier. Modéré par Xavier Teyssier. Licence CC By‑SA.
27
23
mar.
2013
Python

Dans le cadre d'un projet, j'ai eu besoin d'un module pour analyser et modifier les caractères complexes de certains systèmes d'écriture, en particulier en hébreu, grec ancien ou sanskrit. Mon code commence à devenir utilisable, je le publie donc sous une licence GLPv3 : DChars est un module pour Python3.

J'ai essayé de coller à certains principes facilitant le travail en communauté ainsi que l'écriture de code lisible : tests unitaires, code et commentaires écrits en anglais, surveillance de la qualité du code par Pylint, documentation fournie et écrite avec Sphinx.

Concrètement, je cherche d'autres personnes susceptibles d'utiliser ou d'améliorer mon module. Si vous utilisez les langues concernées, dites-moi si ce que j'ai fait vous convient ! En particulier, si certains connaissent très bien la norme ISO 15919, je suis preneur… De façon générale, n'hésitez pas à faire remonter vos remarques, je n'attends que ça, surtout si elles sont négatives !

Forum Programmation.autre unicode : b en exposant [résolu]

Posté par  (site web personnel) .
Étiquettes :
1
28
oct.
2012

Bonjour,
je cherche le code unicode correspondant à un b (minuscule) en exposant, un peu comme ² (deux en exposant). La liste officielle ne me permet de trouver ce que je cherche.

En passant, dites-moi si ce genre de question est hors-sujet par rapport au forum de Linuxfr.org.

Merci d'avance !

** PS : toutes mes excuse, la liste à consulter est plutôt celle-ci : mon caractère est le 1D47. Désolé pour le flood !

Journal Émoticons d'outre-tombe

Posté par  (site web personnel) . Licence CC By‑SA.
Étiquettes :
14
5
avr.
2012

J'ose confesser mon agacement à l'usage des émoticons qui parsèment la prose des gens branchés en cet âge du silicium. Je suis d'une autre époque, celle qui s'enflammait à la lectures des grands romantiques ; vous en avez pour preuve ici, en ce titre, des mânes de celui qui repose à une portée de mousquet des remparts de Saint-Malo que j'arpente lorsque mon esprit bouillonnant d'algorithmes nécessite un salutaire repos. Que vous dire de mon abasourdissement lorsque, en ce jour funeste, (…)

Journal Unicode c'est beau, mais où sont les polices ?

Posté par  .
Étiquettes :
15
11
fév.
2012

Unicode c'est surement une bonne idée. Mais en attendant, les polices ne suivent pas. Par exemple, pas de hiéroglyphes égyptiens... Et vous que voyez-vous parmi cet ensemble de caractères ? Quelles sont les bonnes polices à installer ? Quelles sont celles qui méritent que l'on se penche dessus ?

Lien (attention, javascript hostile)

Nouvelle version d'Unicode : la 6.1.0

Posté par  . Édité par Benoît Sibaud, Lucas Bonnet et baud123. Modéré par Benoît Sibaud. Licence CC By‑SA.
Étiquettes :
27
7
fév.
2012
Doc

La dernière version d'Unicode a été publiée ce 31 janvier. C'est une version mineure ajoutant 732 nouveaux caractères et portant leur nombre à 110 116. La dernière version majeure, la 6.0, date de février 2011.

Les nouveaux blocs sont :

  • 08A0..08FF Arabic Extended-A
  • 1CC0..1CCF Sundanese Supplement
  • AAE0..AAFF Meetei Mayek Extensions
  • 10980..1099F Meroitic Hieroglyphs
  • 109A0..109FF Meroitic Cursive
  • 110D0..110FF Sora Sompeng
  • 11100..1114F Chakma
  • 11180..111DF Sharada
  • 11680..116CF Takri
  • 16F00..16F9F Miao
  • 1EE00..1EEFF Arabic Mathematical Alphabetic Symbols

Unicode est développé dans le but de remplacer les pages de codes nationales afin de faciliter les échanges mondiaux par le bais de l'outil informatique. Il s'agit de donner à chaque caractère de n'importe quel système d’écriture un nom et un identifiant unique, quelle que soit la plate-forme informatique.

Ce travail est coordonné par le Consortium Unicode (association privée à but non lucratif).

Journal Code2000 : Usurpation ou libération ? Que fait la police ?

Posté par  (site web personnel, Mastodon) . Licence CC By‑SA.
Étiquettes :
20
24
jan.
2012

Je suis sûr que vous êtes nombreux ici à connaître, voire à utiliser la fameuse police Code2000, même si elle n’était disponible qu’en partagiciel : c’était une des police les plus complètes, qui permettait d’afficher un très grand nombre de caractères Unicode.

J’avais été en contact avec son auteur James Kass, il y a quelques années, car je lui avais demandé l’autorisation d’inclure Code2000 à l’arbre des ports de FreeBSD, ce qu’il avait accepté avec plaisir, et nous (…)

Journal Unicode

Posté par  (site web personnel) . Licence CC By‑SA.
Étiquettes :
31
15
avr.
2011

Salut,

Je m'interroge depuis longtemps sur la présence de caractères assez "bizarres" dans unicode, par exemple le fameux bonhomme de neige , ou les fontes windings etc. J'avais crû comprendre que c'était pour des raisons historiques.

Je ne connais pas le fonctionnement du consortium unicode, ni la procédure de soumission et d'acceptation de nouveaux caractères mais je m'interroge sur leur motivation quand ils continuent à ajouter des caractères tels que:

WOMAN WITH BUNNY EARS

SMILING CAT FACE WITH HEART-SHAPED EYES

(…)

Suivi — Suivi Affichage des caractères spéciaux (sous Win32)

#180 Posté par  . État de l’entrée : invalide. Assigné à Bruno Michel.
Étiquettes :
3
23
fév.
2011

Chez moi (cf: Chromium sous Archlinux) l'affichage du site est parfait… par contre au boulot je suis obligé d'utiliser Windows Xp et avec Chrome (même soucis si je bascule sur l'obsolète IE) j'ai un problème d'affichage avec certains caractères spéciaux.

Par exemple, les espaces insécables ne s'affichent pas correctement mais je vois à la place un petit rectangle vide :

Une piste peut-être…

Si j'affiche la source de la page html, les espaces insécables sont aussi représentés par des rectangles.

Open Motif 2.3 : Anticrénelage, unicode et plus…

Posté par  . Modéré par Nÿco.
Étiquettes :
0
29
juin
2007
Linux
Open Motif 2.3 est sortie. Elle est considérée par ses développeurs comme la plus grosse annonce depuis la libération du code en mai 2000 ! Au menu quelques fonctionnalités supplémentaires et pas moins de 25 corrections de bogues. Motif est une des plus anciennes bibliothèques graphiques au-dessus de Xt. Propriétaire jusqu'en 2000, elle est une des raisons de la création de Gtk. D'ailleurs, Gtk 1.0 avait un thème par défaut simulant Motif.

Voici un aperçu des changements :
  • L'anticrénelage est enfin supporté en se basant sur Xft. Voilà une fonctionnalité qui manquait terriblement à Motif face à Gtk+ ou Qt qui gère cet anticrénelage depuis très longtemps (premier patch pour Gtk+ 1.2.8 le 11 mars 2001 !).
  • Autre fonctionnalité non négligeable : l'ajout du support de l'UTF-8. Une fois de plus, Motif rattrape son retard.
  • Encore une fonctionnalité pas nouvelle : support de PNG et JPEG. Seul XPM était supporté jusqu'à présent.
  • Il est maintenant possible d'afficher du texte et aussi des images dans les widgets Label et LabelGadgets et leurs dérivés.

Il semble que l'ouverture de Motif et la contribution de la communauté ait enfin aidé à dépoussiérer Motif de certains archaïsmes. Qt de Trolltech et Gtk+ de GNU ont déjà largement remplacé Motif dans le monde libre.

Motif reste malgré tout un standard de fait pour les UNIX en général par son ancienneté, sa standardisation IEEE 1295, sa portabilité, sa stabilité et son soutien par les grand noms d'Unix.

RedHat annonce la Liberation des polices !

Posté par  . Modéré par j.
Étiquettes :
1
4
juin
2007
Bureautique
À l'instar des polices de caractères Bitstream Vera et Deja Vu, une nouvelle police libre vient d'etre annoncée : Liberation. Liberation a été développée par Red Hat et proposée à la communauté lors du Red Hat Summit, le 9 mai dernier.

La particularité principale de Liberation est qu'elle peut se substituer facilement aux polices Microsoft les plus utilisées, car la taille et l'espacement des caractères sont identiques à celles des polices de la firme de Redmond. Ainsi elles peuvent être utilisées dans un document Word sans entraîner de changements dans la mise en page.

Liberation existe en 3 chasses : Sans (remplaçant Arial, Albany, Helvetica, Nimbus Sans L), Serif (remplaçant Times New Roman, Thorndale, Nimbus Roman) et Mono (remplaçant Courier New, Cumberland, Courier et Nimbus Mono L).

Ces polices sont sous licence GNU General Public License (GPL) version 2.

[RFC] Évolution du clavier « fr-latin9 »

Posté par  . Modéré par Benoît Sibaud.
Étiquettes :
0
13
sept.
2006
Serveurs d’affichage
Depuis quelque temps, le bureau libre a bien changé, notamment avec la généralisation des locales unicodes.

Au vue de cette situation, les claviers doivent s'adapter et l'enjeu actuel est de savoir dans quelle direction vous souhaiteriez voir le clavier fr-latin9 évoluer. En effet, voilà déjà plusieurs années que votre serviteur (Nicolas Mailhot) a repris le clavier fr-latin9 que Guylhem Aznar maintenait et qui a été inclus dans xfree86/xkb. Depuis, je n'ai eu aucun retour à son sujet. Entre temps, Guylhem a succombé au clavier canadien international et n'est plus trop intéressé.

Depuis la situation a évoluée :
  • xorg et xfree86 se sont séparés,
  • la base de définition des claviers a désormais son propre projet
  • et surtout, les locales unicode sont devenue la règle et plus l'exception
Aujourd'hui je souhaiterais revenir sur ce clavier, corriger les erreurs commises précédemment et ajouter quelques symboles unicode qui n'étaient pas possibles à l'époque. Un patch très préliminaire est en ligne et je souhaiterais avoir vos retours sur un certain nombre de points (cf la suite de l'article pour les détails).

Comprendre l'Unicode

Posté par  . Modéré par Brice Favre.
Étiquettes :
0
23
août
2002
Internet
Le célèbre webzine uzine publie un court mais intéressant article sur la problématique de codage ( des pages webs entre autres ) des différents caractères existant dans les langues de notre chère planète. La norme Unicode y est introduite de manière simple et compréhensible.

Note du Modérateur: L'article d'uzine n'est pas si court ;) et relativement explicite. Une bonne introduction en somme.
(La FAQ par contre est exhaustive :) )