Journal : Renommer des fichiers de l'iso8859-1 vers l'unicode UTF8

Posté par ccomb (Jabber id, page perso, ) le 28 septembre 2003
0
Il y a environ un an, j'ai passé définitivement mon système de l'iso8859-1 vers l'unicode UTF8, car j'ai besoin d'avoir des noms de fichiers en grec, en turc et en français en même temps.

Donc j'avais besoin d'un outil pour renommer tous les noms de fichiers qui contenaient des accents. J'ai cherché, et comme je n'ai rien trouvé, j'ai écrit un tout petit script python pour faire le boulot, et qui utilise iconv.

Pour ceux qui peuvent avoir un besoin similaire, voici l'url du script :

http://ccomb.free.fr/utfconvert/(...)

La syntaxe est donnée tout simplement avec "utfconvert -h",
et rien n'est modifié réellement tant qu'on a pas mis explicitement "--rename"
Ça permet de tester ce qui doit ou non être renommé avant de le faire.

Ce programme a suffit ponctuellement à mon besoin, mais pour être plus complet, il faudrait ajouter la détection de l'encodage de départ, et aussi une interface graphique pour visualiser et choisir plus simplement les modifications avant de les appliquer. En tout cas, si quelqu'un connait un outil du même genre mais plus complet, merci de prévenir !

> Lire le journal (2 commentaires, moyenne: 1,5).  

Cette discussion est archivée, il n'est plus possible de laisser des commentaires.

Note : les commentaires appartiennent à ceux qui les ont postés. Nous n'en sommes pas responsables.

Re: Renommer des fichiers de l'iso8859-1 vers l'unicode UTF8

Posté par Bernard Massot () le 28/09/2003 à 13:28. (lien). Évalué à 1.

Quelles sont les possibilités des différents systèmes de fichiers supportés par Linux du point de vue de l'encoding ?

  • [^]Re: Renommer des fichiers de l'iso8859-1 vers l'unicode UTF8

    Posté par ccomb (Jabber id, page perso, ) le 28/09/2003 à 13:43. (lien). Évalué à 2.

    Il me semble que les systèmes de fichiers n'ont rien à faire de l'encoding : ils se contentent de stocker le nom de fichier comme une suite d'octets, sans se préoccuper si c'est de l'unicode ou n'importe quoi d'autre.
    Ensuite, il faut évidemment avoir la bonne police de caractères pour l'afficher, mais ça c'est autre chose.

Revenir en haut de page