Journal UTF-8, Unicode, LaTex

Posté par TazForEver le 16 février 2004 à 13:04.

Étiquettes : aucune

fév.

2004

Bon, comme tout le monde le sait l'utf-8 est une matérialisation de l'Unicode. si je prends mon prénom, « Benoît », le î est défini en Unicode comme

U+0069 LATIN SMALL LETTER I + U+0302 COMBINING CIRCUMFLEX ACCENT

et codé en UTF-8 comme

UTF-8 : 0xC3 0xAE

Mon problème : je tape tout en utf-8, avec emacs principalement. Le résulate fonctionne parfaitement.
J'ai systématiquement des problèmes unicode<->utf-8 mais là n'est pas le problème.

Je dois inclure du code dans un rapport, je pensais utiliser texify. Seulement voilà, mon source python est blindé de truc en utf-8. J'ai bien déclaré mon document comme \usepackage[utf8]{inputenc} mais le problème vient du faire que texify fait une convertion en je sais pas quoi, en tout cas mon î se transforme en Ã®

Comment je peux faire pour que texify ne massacre pas tout ? je ne vois rien comme argument pour modifier celà ?

# Re: UTF-8, Unicode, LaTex

Posté par Troy McClure (site web personnel) le 16 février 2004 à 13:27. Évalué à 1.

Je connais pas du tout texify, mais au risque d'enfoncer une porte ouverte, Ã® correspond à la séquence 0xC3 0xAE affichée en iso8859-1 ou -15
- [^] # Re: UTF-8, Unicode, LaTex
  
  Posté par TazForEver le 16 février 2004 à 13:53. Évalué à 1.
  
  oui mais le fait est que j'arrive pas à l'incorporer correctement, que vu dans un buffer utf-8, j'ai pas de î ... mais les deux caractères ...
- [^] # Re: UTF-8, Unicode, LaTex
  
  Posté par TazForEver le 16 février 2004 à 14:03. Évalué à 2.
  
  je commence à comprendre, j'ai des merdes avec emacs/gedit: ces deux idiots comprennent pas le latex généré comme utf-8. donc ça passe en 8859-15. mais après, je n'arrive pas à insérer ce morceau dans un buffer utf-8, puisqu'emacs fait lui même la translation
  
  hé mais j'y pense
  
  % -*- coding: utf-8 -*-
  
  en début de fichier, et pan, emacs fait comme il faut. c'est bête, mais c'est un peu gonflant.
  
  Question subsidaire : comment on fait pour faire une inclusion de fichier en latex ?
  - [^] # Re: UTF-8, Unicode, LaTex
    
    Posté par TazForEver le 16 février 2004 à 14:25. Évalué à 1.
    
    \input :D
# Re: UTF-8, Unicode, LaTex

Posté par Ramso le 16 février 2004 à 14:44. Évalué à 1.

Debian a un paquet latex-ucs pour le support d'Unicode mais j'en sais pas plus.
# Re: UTF-8, Unicode, LaTex

Posté par riba le 16 février 2004 à 15:10. Évalué à 1.

J'ai eu le même probleme, tu rajoutes dans ton préambule:

\usepackage{ucs}
\usepackage[utf8]{inputenc}

et tu tapes ton fichier en unicode (a priori la t'es en latin-1), sinon tu transcodes tout avec "recode latin1.u8 file"

inclusion de fichier : \input ou \include. "\Input" si tu veux le forward search (passage dvi<->tex inliune).
- [^] # Re: UTF-8, Unicode, LaTex
  
  Posté par TazForEver le 16 février 2004 à 15:21. Évalué à 1.
  
  le problème en fait, c'était que de l'utf-8 noyé dans du LaTeX mets en échec emacs et gedit, qui m'ouvraient ça en latin-1. moi je pensais que si d'un buffer latin vers un buffer utf-8, y aurait pas de conversion, et si. docn faut que je fasse gaffe qu'emacs m'ouvrent bien tout en utf-8
# Re: UTF-8, Unicode, LaTex

Posté par Matthieu Weber le 17 février 2004 à 12:21. Évalué à 1.

omega est une variante de tex qui prend de l'unicode en entrée. lambda est l´équivalent de latex, mais en unicode (donc une extension de omega, tout comme latex est une extension de tex). Je n'ai jamais essayé lambda, mais c'est peut-être la solution à ton problème (tu écris tout en UTF-8, tu dis à emacs de lire le fichier comme si c'était de l'UTF-8, et ça *devrait* marcher).

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.