Forum Linux.débutant transformer us-ascii vers utf8

Posté par  .
Étiquettes : aucune
0
7
déc.
2008
Bonjour,
j'ai certains fichier sources en utf8 et d'autre en us-ascii.
qd je fais un file -i temp.tmp
temp.tmp : text/plain charset)us-ascii.

J'essaye de l'enregistrer en gedit, il me dit que c'est en UTF8 mais le file me dit tjr que c'est de l'ascii.

Et justement ce fichier me fait planter mon application à cause des accents dedans...

Any idea??
J'ai essayé
iconv -f ASCII -t UTF-8 temp.tmp > temp2.tmp && file -i temp2.tmp
temp2.tmp : text/plain charset=us-ascii

...GRR
Merci
  • # Est-ce vraiment de l'us-ascii ?

    Posté par  . Évalué à 7.

    La table de caractères us-ascii est strictement inscrite dans utf-8 et tous les caractères de us-ascii ont la même valeur dans us-ascii et dans utf8. Donc vouloir convertir de us-ascii vers utf8 n'a tout simplement pas de sens.

    Cependant tu parles de caractères accentués. Or il n'y a pas de caractères accentués dans us-ascii. Y a-t-il vraiment des caractères accentués dans ton fichier ? Si oui, avec un éditeur hexadécimal (par exemple hexedit) regarde sur combien d'octets ils sont codés. Si ils sont sur un octet, alors c'est probablement du latin1 et la conversion sera à faire de latin1 vers utf8.
  • # Ok

    Posté par  . Évalué à 1.

    En fait ajouter un accents dans le fichier et sauver le transforme automatiquement en UTF8...
    Merci
    • [^] # Re: Ok

      Posté par  . Évalué à 3.

      Non, ça ne le « transforme » pas.

      Ce que t'expliquais Bernard ci-dessus, c'est que tant que tu ne mets pas de caractère spécial dans ton fichier, il n'y a aucun moyen de savoir a priori si c'est de l'ASCII strict ou si c'est de l'UTF-8 dont on n'aurait pas utilisé les extensions.

      Il faut bien comprendre que le jeu de caractères utilisé n'est pas spécifié dans un fichier texte, qui ne contient que des caractères. Exemple bête : si je fais un fichier de 1 seul octet contenant en tout et pour tout la lettre « A ». Quel jeu de caractères considères-tu avoir utilisé ? UTF-8 ? ISO-8859-15 ? ASCII standard ?
  • # Ok

    Posté par  . Évalué à 0.

    En fait ajouter un accents dans le fichier et sauver le transforme automatiquement en UTF8...
    Merci

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.