Journal UTF-8, Unicode, LaTex

Posté par  .
Étiquettes : aucune
0
16
fév.
2004
Bon, comme tout le monde le sait l'utf-8 est une matérialisation de l'Unicode. si je prends mon prénom, « Benoît », le î est défini en Unicode comme

U+0069 LATIN SMALL LETTER I + U+0302 COMBINING CIRCUMFLEX ACCENT

et codé en UTF-8 comme

UTF-8 : 0xC3 0xAE


Mon problème : je tape tout en utf-8, avec emacs principalement. Le résulate fonctionne parfaitement.
J'ai systématiquement des problèmes unicode<->utf-8 mais là n'est pas le problème.

Je dois inclure du code dans un rapport, je pensais utiliser texify. Seulement voilà, mon source python est blindé de truc en utf-8. J'ai bien déclaré mon document comme \usepackage[utf8]{inputenc} mais le problème vient du faire que texify fait une convertion en je sais pas quoi, en tout cas mon î se transforme en î

Comment je peux faire pour que texify ne massacre pas tout ? je ne vois rien comme argument pour modifier celà ?
  • # Re: UTF-8, Unicode, LaTex

    Posté par  (site web personnel) . Évalué à 1.

    Je connais pas du tout texify, mais au risque d'enfoncer une porte ouverte, î correspond à la séquence 0xC3 0xAE affichée en iso8859-1 ou -15
    • [^] # Re: UTF-8, Unicode, LaTex

      Posté par  . Évalué à 1.

      oui mais le fait est que j'arrive pas à l'incorporer correctement, que vu dans un buffer utf-8, j'ai pas de î ... mais les deux caractères ...
    • [^] # Re: UTF-8, Unicode, LaTex

      Posté par  . Évalué à 2.

      je commence à comprendre, j'ai des merdes avec emacs/gedit: ces deux idiots comprennent pas le latex généré comme utf-8. donc ça passe en 8859-15. mais après, je n'arrive pas à insérer ce morceau dans un buffer utf-8, puisqu'emacs fait lui même la translation

      hé mais j'y pense

      % -*- coding: utf-8 -*-

      en début de fichier, et pan, emacs fait comme il faut. c'est bête, mais c'est un peu gonflant.

      Question subsidaire : comment on fait pour faire une inclusion de fichier en latex ?
  • # Re: UTF-8, Unicode, LaTex

    Posté par  . Évalué à 1.

    Debian a un paquet latex-ucs pour le support d'Unicode mais j'en sais pas plus.
  • # Re: UTF-8, Unicode, LaTex

    Posté par  . Évalué à 1.

    J'ai eu le même probleme, tu rajoutes dans ton préambule:

    \usepackage{ucs}
    \usepackage[utf8]{inputenc}

    et tu tapes ton fichier en unicode (a priori la t'es en latin-1), sinon tu transcodes tout avec "recode latin1.u8 file"

    inclusion de fichier : \input ou \include. "\Input" si tu veux le forward search (passage dvi<->tex inliune).
    • [^] # Re: UTF-8, Unicode, LaTex

      Posté par  . Évalué à 1.

      le problème en fait, c'était que de l'utf-8 noyé dans du LaTeX mets en échec emacs et gedit, qui m'ouvraient ça en latin-1. moi je pensais que si d'un buffer latin vers un buffer utf-8, y aurait pas de conversion, et si. docn faut que je fasse gaffe qu'emacs m'ouvrent bien tout en utf-8
  • # Re: UTF-8, Unicode, LaTex

    Posté par  . Évalué à 1.

    omega est une variante de tex qui prend de l'unicode en entrée. lambda est l´équivalent de latex, mais en unicode (donc une extension de omega, tout comme latex est une extension de tex). Je n'ai jamais essayé lambda, mais c'est peut-être la solution à ton problème (tu écris tout en UTF-8, tu dis à emacs de lire le fichier comme si c'était de l'UTF-8, et ça *devrait* marcher).

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.