Forum Linux.général Système en UTF-8

Posté par  .
Étiquettes : aucune
0
16
nov.
2004
Bonjour,

Bah voilà, j'ai passé mon système en UTF-8 depuis quelques temps, et aujourd'hui je suis face à un problème qui me colle un peu.

Pour donner la config., mes locales sont toutes en fr_FR.UTF-8, xterm aussi, le clavier également, enfin bref tout marche à peu près bien. Généralement, mes données sont formatées en UTF-8 (si possible) et j'ai aucun problème avec. Enfin, xfs tourne avec une police UTF-8 complète (mais ca n'a rien à voir).

Le problème: les applications semblent avoir un mal de fou à utiliser des noms de fichiers / répertoires encodés en UTF-8 (enfin, en utilisant des caractères non US-ASCII pour être exact), comme "modèles.txt" par exemple. Si je me lance un xterm et que je fais un "emacs modèles.txt", emacs ne trouve pas le fichier, car il va interpréter "modèles.txt" comme étant une chaîne ISO8859-1 et non pas UTF-8. Résultat, il tente de charger un fichier appelé "modA~les.txt" (qqc d'approchant) qui n'existe pas. Le même problème se reproduit avec mozilla, latex et bien d'autres encore, à tel point que je commence à devenir paranoiaque sur les noms de fichiers non US-ASCII.

A noter que ce problème arrive quelque soit le fs: de type ext3 ou vfat (iocharset en utf8). Le problème ne se repoduit pas avec vfat et un iocharset en iso8859-1, mais je ne peux pas m'en contenter (ne serait-ce que parce que je veux utiliser ext3, parce que vfat est supposé être codé en UTF et que certaines de mes données doivent garder leur nom non US-ASCII).

Comment faire alors ?
  • # Pourquoi UTF-8 ?

    Posté par  . Évalué à 1.

    J'aimerais aussi savoir si je dois passer à UFT-8. Pour le moment, je n'ai pas compris pourquoi utiliser UTF-8. Pour pouvoir utiliser des noms de fichiers avec des caractères exotiques n'est pas une vraie raison pour moi, y-a-t-il une autre raison plus convaincante ?
    • [^] # Re: Pourquoi UTF-8 ?

      Posté par  . Évalué à 1.

      Bah, UTF-8, c'est l'avenir ! (hmmmm...)

      Plus sérieusement, XML est de facto en utf-8, et de plus en plus d'applis utilisent l'utf-8 en natif désormais.

      Et de toute façon, fat est en utf-8 natif, ext3 n'a pas de codage spécifié. Donc autant en profiter, surtout qu'il m'arrive d'utiliser des noms de fichiers avec des caractères non occidentaux.
      • [^] # Re: Pourquoi UTF-8 ?

        Posté par  . Évalué à 1.

      • [^] # Re: Pourquoi UTF-8 ?

        Posté par  . Évalué à 3.

        Plus sérieusement, XML est de facto en utf-8
        T'es vraiment sérieux là ? Parce que je crois que l'encodage des caractères des fichiers XML est défini dans les premières déclarations du document. On peut très bien faire du XML avec un encodage ISO-*.

        Utilisé l'unicode (UTF-8, UTF-16, UTF-32) permet surtout aux applications de retranscrire quasiment n'importe quels caractères et c'est tout.

        Avec l'encodage Windows-1250, le transcription du e dans l'o (eo) était particulier pour des raisons typographiques. Avec l'ISO-8859-1, le caractère euro n'existe pas.

        L'unicode normalise un peu tout ça tout en offrant une compatibilité ascendante.
        • [^] # Re: Pourquoi UTF-8 ?

          Posté par  . Évalué à 1.

          Quand je disais "de facto", j'entendais "implicitement". Tu peux bien sûr toujours spécifier un encodage alternatif, mais si tu n'en précises pas, le fichier est alors considéré comme utf.

          Il me semble également (pas sûr) que le consortium XML ait très envie de pousser utf-8 comme standard pour xml et virer tout autre encodage.

          Attention à ne pas confondre Unicode et UTF-8, également. Unicode est bien plus qu'UTF-8 (cf. wikipedia).

          Enfin, windows-1250 est une table faite par MS, donc je m'en fous royalement (je te raconte pas les problèmes que j'ai eu à en convertir quand je me suis aperçu que ce n'était pas iso8859-1 mais 1250).

          Et pour la compatibilité ascendante, elle est limitée à US-ASCII (ce qui n'est déjà pas si mal, notamment pour les langages de prog et fichiers de config).

          Voilà pour la précision.
    • [^] # Re: Pourquoi UTF-8 ?

      Posté par  . Évalué à 4.

      UTF-8, c'est un peu comme IPv6. Pour l'instant il y a pas mal d'applications qui marchent pas très bien, voire pas du tout avec, mais il y a un moment où il va falloir s'y mettre car ça va vraiment arranger tout le monde. Il suffit par exemple de voir le nombre de fois où l'on reçoit des emails, consulte des pages web avec des caractères qui passent mal pour se dire : « vivement l'utf-8 ».

      Par exemple on pourra marquer : xxx ¤ sans se demander si le type en face aura le bon caractère, et donc sans se faire chier à mettre "Euros" en toutes lettres pour être sûr qu'il n'y aie pas de problèmes.

      Pour les problèmes de noms de fichiers, je viens de faire quelques essais et j'ai effectivement les même problèmes. Le problème doit venir des applications qui ne sont pas capables de gérer l'utf-8 (ou qui le font mal). D'ailleurs en essayant emacs, j'ai remarqué qu'il fonctionnait bien sans indiquer de locale, mais qu'en la réglant à utf-8 il comprenait tout de travers! D'ailleurs zsh comme bash comme tcsh m'ont l'air complétement à la ramasse lorsqu'il s'agit d'éditer une ligne en utf-8... à moins qu'il existe une petite option planquée quelque part?

      Sinon je ne pense pas qu'il existe de solution universelle pour bien faire tourner l'utf8 sous linux.

      Par ailleurs, ThK, où a tu trouvée une fonte qui couvre l'ensemble de l'UTf-8? C'est téléchargeable quelque part?
      • [^] # Re: Pourquoi UTF-8 ?

        Posté par  . Évalué à 1.

        D'accord avec ton analyse, mais je suis un peu plus optimiste. Chez moi, quasiment tout tourne en utf-8 sans problème majeur (à part latex...).

        Pour la fonte, pas de miracle, aucune ne fournit un support COMPLET. La plus complète que j'ai trouvée pour l'instant (et qui couvre déjà un très, très grosse partie - kanjis et tout ça), c'est Arial Unicode (de chez MS, malheureusement). Elle n'est pas libre du tout, n'est pas livré en standard avec Windows (uniquement Office 2003). J'ai bien cherché des solutions libres - au moins gratuites, mais rien. Donc on fait avec pour l'instant. Elle pèse 23 Mo, si ca te chante.

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.