Journal : UTF-8, Unicode, LaTex

Posté par TazForEver () le 16 février 2004
0
Bon, comme tout le monde le sait l'utf-8 est une matérialisation de l'Unicode. si je prends mon prénom, « Benoît », le î est défini en Unicode comme

U+0069 LATIN SMALL LETTER I + U+0302 COMBINING CIRCUMFLEX ACCENT

et codé en UTF-8 comme

UTF-8 : 0xC3 0xAE


Mon problème : je tape tout en utf-8, avec emacs principalement. Le résulate fonctionne parfaitement.
J'ai systématiquement des problèmes unicode<->utf-8 mais là n'est pas le problème.

Je dois inclure du code dans un rapport, je pensais utiliser texify. Seulement voilà, mon source python est blindé de truc en utf-8. J'ai bien déclaré mon document comme \usepackage[utf8]{inputenc} mais le problème vient du faire que texify fait une convertion en je sais pas quoi, en tout cas mon î se transforme en î

Comment je peux faire pour que texify ne massacre pas tout ? je ne vois rien comme argument pour modifier celà ?

> Lire le journal (8 commentaires, moyenne: 1,1).  

Cette discussion est archivée, il n'est plus possible de laisser des commentaires.

Note : les commentaires appartiennent à ceux qui les ont postés. Nous n'en sommes pas responsables.

Re: UTF-8, Unicode, LaTex

Posté par Troy McClure (page perso, ) le 16/02/2004 à 12:27. (lien). Évalué à 1.

Je connais pas du tout texify, mais au risque d'enfoncer une porte ouverte, î correspond à la séquence 0xC3 0xAE affichée en iso8859-1 ou -15

  • [^]Re: UTF-8, Unicode, LaTex

    Posté par TazForEver () le 16/02/2004 à 12:53. (lien). Évalué à 1.

    oui mais le fait est que j'arrive pas à l'incorporer correctement, que vu dans un buffer utf-8, j'ai pas de î ... mais les deux caractères ...

  • [^]Re: UTF-8, Unicode, LaTex

    Posté par TazForEver () le 16/02/2004 à 13:03. (lien). Évalué à 2.

    je commence à comprendre, j'ai des merdes avec emacs/gedit: ces deux idiots comprennent pas le latex généré comme utf-8. donc ça passe en 8859-15. mais après, je n'arrive pas à insérer ce morceau dans un buffer utf-8, puisqu'emacs fait lui même la translation

    hé mais j'y pense

    % -*- coding: utf-8 -*-

    en début de fichier, et pan, emacs fait comme il faut. c'est bête, mais c'est un peu gonflant.

    Question subsidaire : comment on fait pour faire une inclusion de fichier en latex ?

    • [^]Re: UTF-8, Unicode, LaTex

      Posté par TazForEver () le 16/02/2004 à 13:25. (lien). Évalué à 1.

      \input :D

Re: UTF-8, Unicode, LaTex

Posté par Ramso (page perso, ) le 16/02/2004 à 13:44. (lien). Évalué à 1.

Debian a un paquet latex-ucs pour le support d'Unicode mais j'en sais pas plus.

--
Groar !

Re: UTF-8, Unicode, LaTex

Posté par rb14 () le 16/02/2004 à 14:10. (lien). Évalué à 1.

J'ai eu le même probleme, tu rajoutes dans ton préambule:

\usepackage{ucs}
\usepackage[utf8]{inputenc}

et tu tapes ton fichier en unicode (a priori la t'es en latin-1), sinon tu transcodes tout avec "recode latin1.u8 file"

inclusion de fichier : \input ou \include. "\Input" si tu veux le forward search (passage dvi<->tex inliune).

  • [^]Re: UTF-8, Unicode, LaTex

    Posté par TazForEver () le 16/02/2004 à 14:21. (lien). Évalué à 1.

    le problème en fait, c'était que de l'utf-8 noyé dans du LaTeX mets en échec emacs et gedit, qui m'ouvraient ça en latin-1. moi je pensais que si d'un buffer latin vers un buffer utf-8, y aurait pas de conversion, et si. docn faut que je fasse gaffe qu'emacs m'ouvrent bien tout en utf-8

Re: UTF-8, Unicode, LaTex

Posté par Matthieu Weber () le 17/02/2004 à 11:21. (lien). Évalué à 1.

omega est une variante de tex qui prend de l'unicode en entrée. lambda est l´équivalent de latex, mais en unicode (donc une extension de omega, tout comme latex est une extension de tex). Je n'ai jamais essayé lambda, mais c'est peut-être la solution à ton problème (tu écris tout en UTF-8, tu dis à emacs de lire le fichier comme si c'était de l'UTF-8, et ça *devrait* marcher).

Revenir en haut de page