Journal Ubuntu et utf8, crise de nerfs...

Posté par  (site web personnel) .
Étiquettes :
0
18
juil.
2005
Voila, on me propose cet été d'installer linux sur un pc(utilisé par 5 personnes), je décide donc de me tourner vers Ubuntu(pas le temps de me prendre la tete).

Fan de Kde, je choisis quand meme la version gnome, elle me semble plus adaptée (simplicité). Surtout que je trouve le mode spatial facon ubuntu enfin utilisable.

Installation sans probleme, le modem usb(eagle...) ne fonctionne pas vraiment(déconnexion réguliere).

Mais le plus gros probleme vient d'utf8! Nautilus est pas capable d'afficher(invalid encoding) quoi que ce soit correctement sur les partitions fat32 et impossible d'ouvrir un document openoffice depuis nautilus. Premiere solution, dpkg-reconfigure locales mais gnome en a rien à foutre!

Seconde solution, iocharset=utf8 pour les partoches fat32 mais cela est déconseillé ...

Alors il parait que y'a une variable d'environnement pour changer le comportement de gnome, je la cherche tjs...

Sinon, je sens que je vais installer une kubuntu si ca continue à me prendre le choux.

Voila, tout ca pour dire que utf8 SuXoR! T'installes ubuntu à quelqu'un, il a que ca sur sa machine, tout va bien, il récupere une clef usb formatée en fat32, et commence les ennuis...
  • # fat32, iso, utf-8, g_broken_filenames

    Posté par  . Évalué à 10.

    Voila, tout ca pour dire que utf8 SuXoR!
    Non justement ta partition fat32 est en iso8859 quelque chose, c'est pour cela que ça ne lit rien correctement.

    codepage=850,iocharset=iso8859-1

    Un journal sur le sujet :
    http://linuxfr.org/forums/9/7751.html(...)

    Alors il parait que y'a une variable d'environnement pour changer le comportement de gnome, je la cherche tjs...

    G_BROKEN_FILENAMES=1
  • # Ma solution

    Posté par  . Évalué à 10.

    Voici un extrait de mon fstab qui m'a permis de règler se problème: /dev/hde2 /mnt/sas vfat rw,user,umask=000,utf8,codepage=850 0 0
  • # utf8 SuXoR ?

    Posté par  (site web personnel) . Évalué à 9.

    Bha oui, pourquoi ne pas utiliser l' ISO 8859-1 comme tout le monde ?

    l'UTF-8 ça sert à rien. De toute façon, on connais ni le chinois, ni le Japonais, ni aucune autre langue que le français.

    Les originaires de pays ou l'on parle des langues étranges n'ont qu'a apprendre l'anglais pour utiliser leurs ordinateurs. (Existe t il seulement des ordinateur la bas ?)

    </ironic>

    L'utf8 c'est l'encodage du futur. On est dans une période de transition ou beaucoup trop de chose sont encore en ISO8859.

    Le fait que tout soit en utf8 sur une distribution est une bonne chose.
    Les problèmes d'incompatibilité devraint pouvoir se régler d'une manière ou d'une autre. ( p-e avec KDE :-p )
    • [^] # Re: utf8 SuXoR ?

      Posté par  . Évalué à -2.

      De toute façon, on connais ni le chinois, ni le Japonais, ni aucune autre langue que le français.

      Ce qui ne t'empêche pas de les lire quand tu vois un document rédigé dans telle ou telle langue. Unicode, c'est pareil.
    • [^] # Re: utf8 SuXoR ?

      Posté par  . Évalué à 0.

      Je continue de penser qu'il est absolument néfaste de forcer un encoding/charset dans une application, ou, encore plus fortement, dans une distribution.

      En effet, aujourd'hui c'est UTF-8. Mais on sait qu'UTF-8 n'est pas la panacée, et on peut imaginer qu'un jour il faudra passer à UTF-16, voir d'autres encodings/charsets. Recommencera-t-on alors le même cirque ? Si l'on continue à faire comme à présent avec l'UTF-8, certainement. Le passage se fera dans la douleur, les bugs et les noms de fichiers qui ne se lisent pas.

      Les applications GNOME sont parfaitement indépendantes de l'encoding/charset, comme le sont (ou devraient l'être, mais souvent c'est bien le cas) toutes les applications composant une distribution. Pourquoi alors forcer absolument l'UTF-8 ?

      Il est toujours plus simple de proposer une option par défaut mais cela ne devrait pas empêcher d'en proposer d'autres, dans un menu "avancé", une ligne de commande ou autres ...

      Je pense qu'il est totalement hors de propos de parler d'"encoding du futur" ou autres : cela n'a aucun sens (il y a des encodings plus "universels" ou "futuristes" qu'UTF-8, dont certains déjà utilisés comme UTF-16), et c'est une histoire de choix auquel les utilisateurs ne devraient pas être soumis.

      Par exemple, et je sais qu'il est provoquant, on ne retire pas le support du .DOC d'OpenOffice.org en disant que "de toute façon, .DOC c'est mal".
      • [^] # Re: utf8 SuXoR ?

        Posté par  . Évalué à 4.

        A t'endentre UTF-16 serait meiileur a UTF-8, pourtant ils font la meme chose seulement de maniere diferente : utf-8 respect les API ou les chaine se termine par un 0. De plus utf-16 est une grosse perte de place pour les fichier en ASCII...

        Ensuite que propose tu pour etre independant de l'encoding : une application doit lire une suite de bits, pour pouvoir les interpreter il faut bien quelle sache dans quel encoding il est (et la plupart des fichiers ne contienne pas cette info...)
        • [^] # Re: utf8 SuXoR ?

          Posté par  . Évalué à 0.

          Le plus possible préciser les encodings, comme c'est le cas pour XML.

          C'est facile de dire que tout le monde doit utiliser le même encoding, presque autant que "tout le monde devrait utiliser le même OS" ou "tout le monde devrait utiliser le même système de fichiers".
          • [^] # Re: utf8 SuXoR ?

            Posté par  . Évalué à 2.

            Je trouve que tu confonds les choses. Si on veut que tout le monde utilise le meme encoding, c'est pour l'interoperabilite. Et il n'y a pas besoin d'utiliser le meme OS ou le meme FS pour communiquer les uns avec les autres.

            C'est comme si tu disais "C'est facile de dire que tout le monde doit utiliser le meme standard w3c".
            • [^] # Re: utf8 SuXoR ?

              Posté par  . Évalué à 2.

              Sauf qu'il n'existe pas qu'un format de document, comme il n'existe pas qu'un encoding. Ce qui est important c'est qu'ils soient normalisés. Pas que tout le monde utilise le même.
              • [^] # Re: utf8 SuXoR ?

                Posté par  (site web personnel) . Évalué à 0.

                Tu parle de l'encodage des documents ? Ou l'encodage du nom de fichier utilisé par le système de fichier ? Cela n'a totalement rien a voir.
        • [^] # Re: utf8 SuXoR ?

          Posté par  . Évalué à 5.

          L'utf-8 est très emmerdant pour certaines langues, notamment asiatiques (chinois, japonais...). Il fait perdre beaucoup de place car, étant donné le nombre de caractères que ces langues utilisent, le 16 bits est une obligation (les JIS, EUC... sont en 16 bits).
          La situation est très compliquée.

          Rappelons cette petite remarque anodine :
          < <
          This coded character set is to facilitate the general interchange of information among information processing systems, communication systems, and associated equipment. ... An 8-bit set was considered but the need for more than 128 codes in general applications was not yet evident.
          > >
          --- ASA subcommittee X3.2 American Standard Code for Information Interchange (ASCII) in Communications of the ACM
          • [^] # Re: utf8 SuXoR ?

            Posté par  (site web personnel) . Évalué à 5.

            Un truc qu'ils auraient dû faire depuis longtemps : créer un nouveau format de document "texte", plutôt que de chercher à imposer un encodage. Ce nouvaeu format aurait une seule différence avec l'existant : les premières octets indiquent l'encodage utilisé. Pouf chacun utilise celui qu'il veut. Evidemment il y a le risque de casser la compatibilité avec les programmes existants, mais c'est déjà ce que fait l'UTF-16 par exemple. Enfin c'est une idée comme ca, je suppose que je suis pas le premier à y avoir pensé, il doit y avoir une bonne raison de ne pas l'appliquer...
            • [^] # Re: utf8 SuXoR ?

              Posté par  . Évalué à 2.

              Tu peux faire un fichier xml avec l'entête qui précise l'encoding puis une seule balise root /root (et tout ton texte en CDATA dedans)
              • [^] # Re: utf8 SuXoR ?

                Posté par  (site web personnel) . Évalué à 3.

                Je veux cela pour TOUS les fichiers textes, par exemple apache.conf, ou même les fichiers sources.
                • [^] # Re: utf8 SuXoR ?

                  Posté par  (site web personnel) . Évalué à 1.

                  il existe le multi-byte (taille de caractère variable, c'est le premier octet qui indique si le caractère s'étend ou non sur plus d'un octet), mais c'est vraiment l'horreur à gérer pour les application :-)
          • [^] # Re: utf8 SuXoR ?

            Posté par  . Évalué à 3.

            hehe
            bill gates parle de 640ko de ram et ca fait les choux gras de certains ici, l'ASA x machin laisse entendre qu'ils n'avaient pas vu l'interet de plus de 128 caracteres et ca passe presque sous silence.
            moi j'dis lol.

            un truc qui m'eclate avec ces encodages, c'est qu'ils ont reussi a oublier l'e dans l'o dans chais plus quel encodage iso 8859.
            heureusement qu'ils ont du en faire un nouveau avec l'euro, ca leur a permit de corriger le tir.
            • [^] # Re: utf8 SuXoR ?

              Posté par  . Évalué à 7.

              C'est pire qu'oublié...

              Le type qui représentait la francophonie dans l'établissement de l'ISO-8859-1 savait que l'e dans l'o manquait, mais ça n'a pas été signalé car il bossait pour un fabriquant d'imprimante dont les machines ne savaient pas l'imprimer.
            • [^] # Re: utf8 SuXoR ?

              Posté par  . Évalué à 5.

              Ils avaient aussi oublié le ¾ (y majuscule tréma) alors que le ÿ y était (y minuscule tréma).

              Au passage, il paraît que c'est utilisé en français mais je ne connais que deux exemples : L'Haÿ les Roses (un patelin) et Pierre Louÿs (poète, qui plus est dans un pseudonyme : il s'appelait Pierre Louis). Si quelqu'un en a d'autres...
          • [^] # Re: utf8 SuXoR ?

            Posté par  . Évalué à 2.

            J'oubliais de préciser : cette citation est tirée du TeXBook de D. Knuth (qui a été obligé d'inventer sa table de caractères 8 bits pour MetaFont et TeX).
      • [^] # Re: utf8 SuXoR ?

        Posté par  . Évalué à 1.

        Si les applications sont indépendantes de l'encodage, il ne devrait
        pas y avoir de problèmes non?

        C'est un peu bourrin mais forcer l'UTF-8 permet le debugage.

        plop plop
    • [^] # Re: utf8 SuXoR ?

      Posté par  (site web personnel) . Évalué à 3.

      t'as oublié la balise ouvrante , penses y la prochaine fois, c'est plus difficile à parser au premier abord, cela nescessite parfois une relecture :) et ca ralenti donc le traitement de l'information.
    • [^] # Re: utf8 SuXoR ?

      Posté par  (site web personnel) . Évalué à 4.

      Moi aussi j'ai laché détesté utf8 chez ubuntu.

      Pour moi, le problème ce n'est pas d'avoir choisi utf8 mais c'est d'avoir fait "comme si" ca ne posait pas de problème.

      Et comme il n'y a que très peu d'outils de conf sur ubuntu, on est marons. Je pense qu'en faisant le choix de utf8, il auraient du prévoir de passer quelques heures à développer un script de maj des fstab + une doc et éventuellement une interface graphique.

      C'est pour ce genre d'ouils qui manquent sur ubuntu que je préfère Mandriva. (nottrez que ce n'est pas un troll mais une opinion personnelle argumentée).
      • [^] # Re: utf8 SuXoR ?

        Posté par  . Évalué à 1.

        Pour continuer dans le troll "enchanté" comme disait l'autre, comment mandriva et/ou KDE gèrent ils la chose ?
        • [^] # Re: utf8 SuXoR ?

          Posté par  . Évalué à 4.

          En te donnant le choix, et ce dès l'installation, mais aussi la possibilité de revenir sur ce choix facilement, avec des outils adaptés.

          Et pourtant, je n'ai pas pour habitude d'encenser les outils drak*, mais bon, j'ai testé pas mal de distributions (Mandriva, Fedora, Debian, Ubuntu, SuSE), hé bien franchement, à part avec la SuSE, j'ai toujours regretté les outils de conf de la Mandriva (sauf partiellement avec la Debian, qui offrait le dpkg-reconfigure, mais pas aussi complet)

          Et puis sans vouloir être mauvaise langue, j'ai un peu de mal avec Ubuntu. J'avais tout un stock de packs à écouler, je me suis donc tourné vers un Cash Converters local, pour qu'il les installe sur ses machines en lieu et place d'un windows piraté, et incroyable mes vrai, mais sur 4 PC différents, impossible d'avoir un boot complet (écran noir, kernel-panic, ou écran figé). Bref, je me dis que l'ancienne Ubuntu était trop jeune, je télécharge le dernier DVD 5.04 (qui fait Live DVD également), et là, rebelote, ça fonctionne pas sur la moitié de mes machines, et toujours pas plus concluant chez l'assimilé « Cash Converters ».

          Bilan des courses, pas de Ubuntu distribué officiellement dans le Cash Converters, plus de Ubuntu chez moi, et je reste sous ma Mandriva, en lorgnant vers la SuSE (et potentiellement la Debian pour mon serveur, en raison de son support dans le temps, exception faite du petit problème sur les mises à jour de sécurité récent)

          J'ai réussi à fourguer tous les packs dans mon entourage (j'aillais pas non plus gaspiller 100*2 CD Linux avec pochette cartonnée), mais ce fut dur, et au final, il n'y a eu q'une personne vraiment convertie sur 100 packs distribués, et moins de 5 qui l'utilise occasionnellement, pour ne pas dire exceptionnellement.
          • [^] # Re: utf8 SuXoR ?

            Posté par  . Évalué à 6.

            Hum... Très intéressant, mais heu... j'aurais bien aimé que tu développe plus la partie qui répond a ma question. Ils font quoi les outils drak* merveilleux ? ils convertissent tes partoches ?
        • [^] # Re: utf8 SuXoR ?

          Posté par  (site web personnel) . Évalué à 2.

          Mandriva n'a pas besoin de gérer la chose puisqu'ill n'ont pas choisit utf8 par défaut.

          Mais dans l'esprit, il y à un menu drakconf qui permet de configurer les partitions, (de tout types) que l'on monte et qui permet de configurer les encodages.

          Mandriva semble penser que ses utilisateurs (remarquez le "ses") veulent des menus de configuration et consacre un maximum d'énergie à ces menus. Pour ma part, ça me va.

          Ubuntu configure tout par défaut, sans poser de question mais ne propose (presque) aucune interface de configuration graphique pour adapter l'installation par la suite. Même webmin n'est pas installé par défaut, avec une entrée dans un menu.
      • [^] # Re: utf8 SuXoR ?

        Posté par  (Mastodon) . Évalué à 2.

        Pour moi, le problème ce n'est pas d'avoir choisi utf8 mais c'est d'avoir fait "comme si" ca ne posait pas de problème.


        Tu peux donner justement des exemples de problèmes ?

        Je dois dire que sur mon poste, j'ai aussi des partitions fat32 et je ne me suis rendu compte de rien de spécial au passage d'ubuntu. Alors j'imagine que c'est pas si énorme que ça.
        • [^] # Re: utf8 SuXoR ?

          Posté par  . Évalué à 1.

          Exemples typiques de problèmes : tu avais des partitions en ISO-8859-1(5) (un vrai truc, de l'ext2/3, du XFS, du ReiserFS ...), quelqu'un te file une clé USB avec des noms de fichier en ISO-8859-1(5) ...

          Essaie.
          • [^] # Re: utf8 SuXoR ?

            Posté par  (site web personnel) . Évalué à 1.

            et les é sont remplacés par des ?
            Pas bien grave a mon avis.
            J'ai même du recommer tous les fichiers d'un cd mp3 un jour (après un passage dans la moulinette de mp32ogg)

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.