Forum général.général Problème d'encodage...

Posté par  .
Étiquettes :
0
27
juin
2007
Je souhaite poster un message rédigé en français sur un site
chinois, dans une page comportant un formulaire. Je procède
donc à la démarche (naïve !) suivante :

1) J'écris mon texte en français dans vim et je le sauve sous utf-8
dans un fichier nommé "txt".
2) Je fais iconv -f utf8 -t CN txt
3) Je copie-colle à la souris dans la fenêtre d'édition
du formulaire dans firefox le texte affiché dans le shell par la
commande précédente iconv...

Et le problème est là, en fait, ça reste du utf-8 et donc
le destinataire chinois ne peut pas lire le texte.

Je précise que les options dans Firefox relatives à l'encodage
semble ne rien donner (encodage par défaut -> chinois simplifié)
... même résultat.

Je pense qu'écrire un robot en perl (et donc de maîtriser précisément l'encodage du texte au moment de l'envoi dans le formulaire) est peut-être une solution... mais ça me gonfle, ça paraît un peu disproportionné.

Avez-vous des idées ?
  • # Hum.

    Posté par  (site web personnel) . Évalué à 2.

    Je comprend pas ton problème.

    Si tu t'amuse a écrire ton message en français :
    Salut machinchose, super le t-shirt rouge du parti que tu m'as envoyé. Merci et à la prochaine.

    Tu auras beau t'amuser a le convertir d'iso8859-15 => utf-8 => CN.
    Le résultat sera le même, a savoir tes caractères sont toujours latins et pas des sinogrammes...

    Pour envoyer ton texte pour qu'ils puissent le lire tu dois être sûr que le formulaire de réception des données comprend le charset dans lequel tu l'envoies.

    Tu a de forte chance pour que ça soit un formulaire qui ne comprennent leur encodage local et non ton utf-8 soumis, dans ce cas là c'est mort.
    (a part coder un script qui enverra les infos convertis dans le bon charset + bons en-têtes.)

    Essaye de voir si tu as ajouté le charset chinois au charset supportés, si tu acceptes leur code de langue et autre.
    • [^] # Re: Précision.

      Posté par  . Évalué à 1.

      Merci de me répondre.

      1) Que je sois bien clair. J'écris un texte en
      français que j'envoie par l'intermédiaire d'un
      site chinois à un destinataire francophone.

      2) En fait le formulaire d'envoi ne "comprend"
      pas les jeux de caractères utf-8, c'est tout
      simplement ça.

      3) À la réflexion, c'est vrai que la démarche
      d'utiliser iconv n'a aucun sens. Mais ce qui m'a induit
      en erreur c'est le fait que lorsque je fais :
      iconv -f utf8 -t CN txt
      je n'ai PAS de message d'erreur. Je devais donc penser
      implicitement qu'avec le jeu CN on pouvait AUSSI
      représenter les caractères latins en plus des idéogrammes,
      un sur-ensemble, en quelque sorte. Ok, c'est absurde.

      Enfin bref ça paraît insoluble...
      • [^] # Re: Précision.

        Posté par  (site web personnel) . Évalué à 2.

        Simple si il est francophone, débrouille toi pour rajouter une url dessus, ou ton adresse mail ;)
        (enfin un signe de reconnaissance)

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.