Journal A propos de l'UTF-8

Posté par (page perso) .
Tags : aucun
0
3
avr.
2005
Bonjour,

Ubuntu Hoary, qui sort demain ou après, est encodée par défaut en UTF-8. Rappelons que UTF-8, c'est l'avenir ;-)

J'ai rencontré quelques petits problèmes :

- sessions ssh foireuses sur machine distante en iso
- noms de fichiers et tags MP3/ogg foireux (et l'outil de conversion de Ubuntu plante lamentablement)

Mais bon, rien d'insurmontable, je savais à quoi m'attendre..

UTF-8, c'est l'avenir, bon, d'accord mais je me pose une question :

- Une hoary en UTF-8 est-elle envisageable pour un non geek (par exemple ma moman) ? Ne risque t'elle pas de rencontrer des problèmes pour lire des mails/txt/doc reçus ? Et surtout, ses correspondants sous Windows ne risque t'ils pas d'avoir des problèmes avec les documents envoyés par ma maman ? Etant donné qu'il s'agit ici d'un environnement professionnel, je ne peux pas me permettre de prendre le risque.


- Un site web en UTF-8 est-il parfaitement compatible avec Internet Explorer ? Je songe à convertir mon blog en UTF-8, mais puis-je faire de même avec des sites professionnels ?


Bref, merci pour toutes les infos à ce sujet. Et si vous avez un utilitaire qui convertit en UTF-8 les tags des MP3/ogg, je suis preneur !

(saleté de utf8migrationtool qui me renvoie :

Traceback (most recent call last):
File "/usr/bin/utf8migrationtool", line 91, in change_setup
os.rename(oldfile, newfile)
OSError: [Errno 2] Aucun fichier ou répertoire de ce type )
  • # Pas de difficulté

    Posté par . Évalué à  4 .

    Toutes mes machines sont en utf-8 depuis quelque temps, et pas de problème particulier.

    Mes correspondants windows, n'ont pas eu de problème à lire mes courriels. A priori, n'importe quel client mail correct doit pouvoir envoyer les courriels suivant le codage que tu veux. Personnellement j'utilise kmail et automatiquement il utilise le codage le plus adapté (ascii; latin-1/9; utf-8). Le seul problème ça peut éventuellement être les courriels envoyés en utf-8 à des gens qui consultent leur boite par un webmail. Enfin, tu peux forcer en latin-1 pour éviter ça.

    Internet Explorer gère correctement l'utf-8. Il y a d'ailleurs un nombre non négligeable de sites qui sont déjà en utf-8, comme http://fr.wikipedia.org(...) par exemple. :)

    Pour la conversion de tes tags je ne sais pas. En revanche pour corriger les noms de fichiers, j'avais utilisé mvconv à l'époque de ma migration. Marche bien et rapidement.

    De façon générale, ne t'inquiète pas pour l'utf-8, les problèmes sont rares et en constante diminution. Il me semble que red hat et dérivés utilisent par défaut l'utf-8 depuis pas mal de temps. Ça a sans doute permis de défricher un peu.
    • [^] # Re: Pas de difficulté

      Posté par . Évalué à  2 .

      A ce propos, existe-t-il un bon HOWTO simple pour passer à l'UTF-8 ?

      D'après ce que j'ai compris, quand on parle d'UTF-8, ce n'est uniquement pour le codage des noms de fichiers dans le filesystem ? Et quelque fois l'encodage dans quelques éditeurs de textes (si j'ai bien compris tout ce qui tourne autour du web précise le codage, donc à priori, pas de problème) ?

      Peut-il y avoir des problèmes lors de l'utilisation de Samba ou NFS ?
  • # utf-8 c'est bon, mangez-en

    Posté par (page perso) . Évalué à  2 .

    Personellement, cela fait depuis un boit de temps que tous mes fichiers texte sont en utf-8.

    Un petit problème avec kwrite, cepandant, régulièrement il me corrompt toutes mes lettres accentués. Du coup les commentaires dans mon code est illisible.

    Sinon, je ne vois pas trop quel problème il pourrait y avoir au niveau des noms de fichiers, le mieux est de ne pas mettre d'accents, ni d'espace dans les noms de fichiers ...
    Mais ce n'est pas très gênant.

    Sinon, pour les mails, il me semble que c'est a part, donc pas de problèmes. C'est aussi sans doute précisé dans les en-têtes

    pour le site web en utf-8, j'ai actuellement un petit problème avec Konqueror. Mais je crois que sous IE, ca passe bien (mais je n'ai pas pu tester).
    pour info, ca passe dans les headers http (Content-type: application/xhtml+xml;charset=utf-8) et éventuellement dans la balise <?xml ... encoding="utf-8"?>
    Mon site en utf-8: http://mildred632.free.fr/(...)
    Le problème c'est que si le serveur ne spécifie pas l'encodage pour les pages HTML (ou texte), le navigateur doit le deviner et ce n'est pas toujours facile. Le problème doit pouvoir se régler avec un <meta http-equiv/> ou le bon truc dans le htaccess
    • [^] # Re: utf-8 c'est bon, mangez-en

      Posté par . Évalué à  3 .

      À propos de ton site, mon konqueror lit ça comme si c'était en latin-1. Dans mes pages en xhtml je mets quelque chose comme ça <meta http-equiv="Content-Type" content="text/html; charset=utf-8" /> pour que ça passe bien. Enfin c'est possible que ce soit une limitation de konqueror qui n'interpréterait pas correctement le <?xml version="1.0" encoding="utf-8"?>

      Med
      • [^] # Re: utf-8 c'est bon, mangez-en

        Posté par (page perso) . Évalué à  6 .

        J'ai été confronté à un pbm de ce genre pour mon site sous SPIP, ce que j'ai retiré de mon expérience :

        Le pbm c'est que certains Apaches sont configurés pour retourner un encodage par défaut si tu ne le précises pas dans le header de ta réponse http.

        Or la règle c'est de n'utiliser l'encodage défini dans le méta http-equiv="Content-Type" que s'il n'y a pas de header Content-type: dans la réponse http.

        Bref, les solutions sont :
        - Forcer l'entête dans tes pages php avec <?php header("Content-type: text/html; charset=utf-8"); ?>
        - Dire à apache qu'il retourne par défaut de l'utf-8 avec AddDefaultCharset UTF-8
        - Supprimer les AddDefaultCharset de la config d'apache, le navigateur se basera dans l'ordre sur le header http Content-type: , sinon sur le meta http-equiv="Content-Type", sinon il essayera de deviner.

        voila, en espérant qui je n'ai pas dit de conneries.

        note : on ne peut plus faire de liste (ul li, etc...) dans les commentaire????
    • [^] # Re: utf-8 c'est bon, mangez-en

      Posté par (page perso) . Évalué à  2 .

      Un petit problème avec kwrite, cepandant, régulièrement il me corrompt toutes mes lettres accentués. Du coup les commentaires dans mon code est illisible.

      Faut écrire tes commentaires en anglais, ton code sera utilisable par le plus grand nombre (ok si tu fais des commentaires en esperanto).
  • # Ogg deja UTF-8

    Posté par . Évalué à  4 .

    A grumdk qui se plaignait que passer en UTF-8 lui casserait tous ses tags Ogg, j'avais repondu ca :

    http://linuxfr.org/comments/512630.html#512630(...)

    Donc, pas de souci au niveau des Vorbis, et par extension les FLAC ou Ogg/FLAC qui utilisent le meme format de tags, a moins que tu n'aies decide d'encoder avec un soft qui ne respecte pas la norme.
  • # Publicité contextuelle : reconnaissance et conversion de charsets

    Posté par . Évalué à  3 .

    Des problèmes d'encodage? On ne se rappelle plus le jeu de caractère utilisé par ses fichiers? On souhaite en importer, mais on ne connait pas leut encodage?

    Utrac est fait pour vous! : http://utrac.sf.net(...)

    Disponible en executable pour le shell, mais surtout en bibliothèque à inclure à vos propres applications qui reconnaîtront automatiquemnt ce que l'utilisateur rentre pour le plus grand plaisir de ce dernier...
  • # password accentués (k)UBUNTU

    Posté par (page perso) . Évalué à  2 .

    un petit problème après une récente installation de kubuntu sur une machine, je constate que mes passwords avec caractères accentués vers mon serveur/passerelle (VNC, SSH ou SMB) ne sont plus acceptés...

    Pourrait-ce être du à ce problème UTF-8 ?

    Si oui, quelle solution ?
    Sinon, une idée ?

    enore une autre remarque, il me semble que la saisie du password (accentué aussi) lors de l'install a déraillé de la mm manière :
    après redémarrage, pas moyen de saisir ce password dans kdm, il marchait uniquement en tty1 (heureusement ;o)

    ça doit faire l'objet d'un bug report kubuntu ?
    • [^] # Re: password accentués (k)UBUNTU

      Posté par . Évalué à  3 .

      > Pourrait-ce être du à ce problème UTF-8 ?

      Oui. un 'é' dans UTF-8 n'a pas le même code qu'un 'é' en ISO8859.
      UTF-8 est compatible avec ASCII (et uniquement ASCII, 127 caractères).

Suivre le flux des commentaires

Note : les commentaires appartiennent à ceux qui les ont postés. Nous n'en sommes pas responsables.