Journal : Réflexion sur le format OASIS opendocument et la séparation forme/fond
Posté par ginkyo (page perso, ) le 16 octobre 2005
Bonjour,
Exigeant dans la mise en page et la structuration de mes fichiers (ici openoffice.org), il m'arrive quelquefois de les dézipper pour corriger certaines erreurs de formattage à coup de regexp ou de vi simple. Certaines particularité négative du format sxw m'avait déjà interpellé, et il se trouve que j'ai pu retrouvé ce même type d'erreurs (selon ma compréhension) dans le nouveau format OASIS opendocument.
Je veux parler de la séparation absolue entre le contenu (content.xml) et la forme (style.xml), qui est selon moi une exigence de fait afin de faciliter les traitements de mis à jour, de création, de taille, d'exportation, etc.
Il se trouve que le format OASIS opendocument permet l'insertion de style dans le fichier content.xml
Et lorsque je me suis essayé à supprimer les styles (office:font-face-decls,office:automatic-styles) du content .xml, la mis en page du document se trouvait complètement différente.
Or il est précisé que ces infos de styles sont dupliquées depuis styles.xml
=source [EN]
OASIS OpenDocument Essentials :
http://books.evc-cit.info/odbook/ch02.html
=====
The styles.xml File
The styles.xml file contains information about the styles that are used in the document. Some of this information is also _duplicated_ in the content.xml document.
======
Enfin pour pousser le test un peu plus loin, il y aurait (apparemment) un ordre de préférence entre content.xml et style.xml !
L'exmple :
content.xml :
styles.xml :
Alors le style parent de P1 est il corps de texte ou Standard ;) (ici cela serait Standard)
Il me semble que le groupe d'abiword s'était déjà fait entendre sur ce problème à propos du format sxw, c'était pour cette raison, ilme semble, qu'ils gardaient le format abiword comme référence.
Auriez-vous, s'il vous plaît, donc quelques justifications et/ou explications sur cette limitation du format ? Et les possibilités d'évolutions. Merci d'avance
le fichier de test :
http://alex.6.free.fr/CV_Alexis_Haeringer.odt
Pour ceux/celles qui ne connaissent pas, voici un lien sur le format OASIS Opendocument :
http://fr.wikipedia.org/wiki/OpenDocument
Exigeant dans la mise en page et la structuration de mes fichiers (ici openoffice.org), il m'arrive quelquefois de les dézipper pour corriger certaines erreurs de formattage à coup de regexp ou de vi simple. Certaines particularité négative du format sxw m'avait déjà interpellé, et il se trouve que j'ai pu retrouvé ce même type d'erreurs (selon ma compréhension) dans le nouveau format OASIS opendocument.
Je veux parler de la séparation absolue entre le contenu (content.xml) et la forme (style.xml), qui est selon moi une exigence de fait afin de faciliter les traitements de mis à jour, de création, de taille, d'exportation, etc.
Il se trouve que le format OASIS opendocument permet l'insertion de style dans le fichier content.xml
<office:document-content>
<office:font-face-decls> </office:font-face-decls>
<office:automatic-styles> </office:automatic-styles>
<office:body></office:body>
</office:document-content>Et lorsque je me suis essayé à supprimer les styles (office:font-face-decls,office:automatic-styles) du content .xml, la mis en page du document se trouvait complètement différente.
Or il est précisé que ces infos de styles sont dupliquées depuis styles.xml
=source [EN]
OASIS OpenDocument Essentials :
http://books.evc-cit.info/odbook/ch02.html
=====
The styles.xml File
The styles.xml file contains information about the styles that are used in the document. Some of this information is also _duplicated_ in the content.xml document.
======
Enfin pour pousser le test un peu plus loin, il y aurait (apparemment) un ordre de préférence entre content.xml et style.xml !
L'exmple :
content.xml :
<office:automatic-styles>
<style:style style:name="P1" style:parent-style-name="Text_20_body" style:family="paragraph" style:master-page-name="Standard">
<style:paragraph-properties fo:break-before="page" style:page-number="1"/>
<style:text-properties/>
</style:style>styles.xml :
<office:automatic-styles>
<style:style style:name="P1" style:family="paragraph" style:parent-style-name="Standard">
<style:paragraph-properties fo:text-align="end" style:justify-single-word="false"/>
<style:text-properties style:font-name="Thorndale1" fo:font-size="7pt" style:font-size-asian="5pt"/>
</style:style>Alors le style parent de P1 est il corps de texte ou Standard ;) (ici cela serait Standard)
Il me semble que le groupe d'abiword s'était déjà fait entendre sur ce problème à propos du format sxw, c'était pour cette raison, ilme semble, qu'ils gardaient le format abiword comme référence.
Auriez-vous, s'il vous plaît, donc quelques justifications et/ou explications sur cette limitation du format ? Et les possibilités d'évolutions. Merci d'avance
le fichier de test :
http://alex.6.free.fr/CV_Alexis_Haeringer.odt
Pour ceux/celles qui ne connaissent pas, voici un lien sur le format OASIS Opendocument :
http://fr.wikipedia.org/wiki/OpenDocument
> Lire le journal (24 commentaires, moyenne: 2,8).
Vous avez demandé le commentaire #636956.



dans le fond, je ne dois pas avoir la forme ...
quelle distinction fait on entre forme et fond ?
ma question semble emprunt d'humour et de naiveté, mais j'explique plus en détail :
Tout texte a un message à plus ou moins faire passer. Tout texte a des mises en page/forme qui influe sur la perception du message/fond : c'est la notion meme de didascalie.
il est dur d'imaginer le tartuffe disant "cachez ce sein que je ne saurais voir" sans y mettre la main en bon tartuffe et bon devot qu'il est.
donc la mise en scene ( la main sur le sein ) qui est un element de forme est un element essentiel de fond du message de la piece.
donc la forme elle meme, est un element du fond. Tout comme certains element de fond ne sont la que pour la forme.
Certaines explication comme cette main sur un sein, ne sont en fait le propos de mon message mais plutot un effet de forme pour mieux en exposer le fond.
donc je repose ma question : quelle distinction entre fond et forme ?
Je reprendrai pour exemple, le paradoxe de csszengarden qui pour permettre de faire ce que l'on veut avec la CSS et exposer l'interet d'une distinction forme/fond, est obligé d'ajouter des tags inutiles dans le code HTML et donc de polluer le fond avec de la forme.
Pour en revenir à OpenDocument et OOo, je pense que ce qui m'ennuie le plus est l'illisibilité du format que le manque de distinction.
J'ai comme l'impression que ces histoires de distinction fond/forme, vont finir comme les tableaux HTML : on va finir par polluer car il est impossible de maintenir une distinction dans des choses trop intrinsequement lié ( a moins de n'avoir que des fonds informes et des formes sommes toutes trop superficielles ).
[^]Re: dans le fond, je ne dois pas avoir la forme ...
Je crois que tu mélanges le fond, la forme(1) et la forme(2).
Heu...
Dis comme ça c'est normal de mélanger.
Il y a le fond (ce que le texte veut dire) la forme(1) (comment il le dit) et la forme(2) (quel visuel a le texte).
Peut-être aurait-on du prendre l'habitude de dire :
le fond, la forme et l'apparence...
Le bon la brute et le truand... :)
Je pense que cette expression "le fond de la forme" est utilisée par analogie avec les techniques d'expressions qui manipulent la forme(1) pour faire passer le fond. Mais en se qui concerne les feuilles de style, c'est bien l'apparence qu'elles manipulent, donc la forme(2).
Par exemple :
Les tableaux ne sont pas a bannir s'ils sont utiles à la forme(1) mais on doit les éviter pour définir la forme(2).
la forme(1) c'est la technique d'expression.
la forme(2) c'est le visuel.
Ce que je dis n'enlève rien au fait qu'il soit parfois difficile de séparer le fond de la forme(1) et de la forme(2).
[^]Re: dans le fond, je ne dois pas avoir la forme ...
A force de vouloir prouver que Moun's a tort, tu t'enfonces dans un charabia incompréhensible. Le problème, c'est qu'il a raison : un message sans sa forme perd aussi sa signification. La langue ne peut pas être réduite à des formules logiques impliquant des idées (sinon cela ferait longtemps que les ordinateurs pourraient "penser humainement" grâce à des systèmes symboliques, et ce n'est pas le cas : et cela signifie aussi que les systèmes comme RDF, quoique potentiellement utiles, ne créeront jamais un "Web sémantique" (cette expression est hilarante de charlatanerie)).
Ceci dit, là où Moun's a tort, c'est qu'il étend un peu trop les conséquences de son raisonnement. Certes, on ne peut pas dissocier "forme" et "fond" autoritairement, et cela rabaisse le discours de certains zélotes à de la pure propagande. Par contre, on peut toujours distinguer différents degrés de description, et c'est ce qu'on fait quand on sépare HTML et CSS : non qu'il s'agit de deux domaines totalement distincts dans leur essence, mais qu'on peut tout de même opérer une catégorisation ad hoc, c'est-à-dire perfectible mais tout de même potentiellement utile (pour éviter les redites, etc.).
Merci en tout cas à Moun's pour venir ici lancer ce sujet.
[^]Re: dans le fond, je ne dois pas avoir la forme ...
Hum ...
Finalement tu attestes ce qu'a écrit blobmaster.
En fait, il existe deux notions de formes :
- celle de la sémentique, et qui à mes yeux devrait s'appeler bien forme,
- celle de l'apparence qui devrait garder ce nom : apparence.
Je crois que l'on doit effectivement séparer le contenu de l'apparence, ou plus exactement de la structure d'un document de l'apparence. A mes yeux, la structure et la forme forment le contenu du document. Ceci sachant que cette apparence est aussi conditionnée par des règles typographiques si le contenu est amené à être publié.
(L'apparence donne la fonte, la mise en page, etc.)
Par contre, la structure d'un document ne peut-être distinguée de la forme puisqu'ils décrivent finalement le contenu. (La forme peut-être la mise en emphase, la tournure, etc.)
Aux vues de ceci, finalement, je m'apperçois que le choix des mots peuvent être très important pour la compréhension des choses. Mais malheureusement, il semblerait que cet état de fait soit négligé et qu'il est commun de parler mal.
[^]Re: dans le fond, je ne dois pas avoir la forme ...
En fait, il existe deux notions de formes :
- celle de la sémentique, et qui à mes yeux devrait s'appeler bien forme,
- celle de l'apparence qui devrait garder ce nom : apparence.
Désolé, je ne vois pas la différence entre ce que tu appelles forme et ce que tu appelles apparence.
(L'apparence donne la fonte, la mise en page, etc.)
Je ne vois pas pourquoi cela ne fait pas partie de la forme. Une police de caractères différente, appliquée à un endroit particulier, modifiera la perception du texte.
Les distinctions que tu cherches à mettre en valeur sont difficiles à évaluer et peu opérantes. Il y a peut-être des différences de degré entre ce que tu proposes de distinguer, mais pas de différence de nature.
[^]Re: dans le fond, je ne dois pas avoir la forme ...
Pour mettre en évidence une partie de phrase ou de mots, tu vas utiliser plutôt des caractéristiques de forme : l'emphase par exemple.
Comme cet emphase va être rendu dans ton document (en italique, en gras, en italique avec un pas de caractère constants; etc.) forme l'apparence de cette caractéristique.
Ce qui va alors modifier la perception du texte est la cohérence dans l'apparence de la forme de ton texte : comme est rendu l'emphase, l'abréviation, telle ou telle autre chose par rapport au tout.
[^]Re: dans le fond, je ne dois pas avoir la forme ...
l'emphase n'est pas que la pour de la mise en evidence. sinon a quoi bon parler avec emphase ?
que le gras ou l'italique soit de la mise en forme, il ne faut pas confondre avec l'emphase qui est une information sur le fond, tout comme le fait de signifier que S.P.E.C.T.R.E. est un sigle et non un spectre.
en disant cela, je semble donner des elements allant à l'encontre de mon propos initial : il n'en est rien.
pouvoir faire une distincition, nuit de toute facon :
- a moins de fournir un liant entre le fond et la forme, comment differencier Spectre de S.P.E.C.T.R.E. de spectre, surtout dans le cas ou "le S.P.E.C.T.R.E. ( de james bond ) s'allie avec le Spectre ( de DC ), pour combattre une meutent de spectres dirigé par pas n'importe quel spectre". maintenant, tu y colles toute une histoire autour, et je te pose une question :
est ce des CLASS ou des ID ?
Semantiquement ce sont toujours la meme entité Spectre et S.P.E.C.T.R.E. donc cela devraient etre des ID, sauf que non. de plus, quand on a des spectres et un spectre qui en sort ce sont des CLASS, mais quand c'est pas n'importe quel spectre qui sort, dans ce cas, est ce pas n'importe quel spectre du genre "gros balaize" ou pas n'importe quel spectre ? cette information de fond est essentielle pour la forme, et a moins de gerer du au cas par cas, aucun systeme actuel n'est adapté aux traitements de cette forme.
pour résumer mon opinion, la séparation forme/présentation a du sens quand elle est faite avec du sens, sinon ce n'est que de la benoite devotion à un truc que l'on ne comprend pas et que l'on applique pensant bien faire.
est ce un retour au paganisme ? croire aux dieux XHTML+CSS, XML+XSLT+XSL-FO, TeX/LaTeX, PostScript/PDF, ODT, ...
Je vais dire que non, mais quand j'entend certains ...
[^]Re: dans le fond, je ne dois pas avoir la forme ...
?
Je n'ai jamais dis le contraire. On se s'est pas compris.
De plus, ton histoire d'ID ou de CLASS se réfère à de l'(X)HTML est la question n'est pas là.
Quant à Tex/Latex, la présentation n'est pas détachée de la forme : en fonction de règles typographiques bien définies en vigueur pour la langue dans laquelle est écrite un document, le compilateur Latex va générer une présentation conforme pour chaque balise. Tu peux néanmoins, par des macros Tex ou Latex, surcharger cette présentation.
[^]Re: dans le fond, je ne dois pas avoir la forme ...
Le fond avec forme:
<h1>Un titre</h1>
Et la forme sans fond:
h1 {
font-familly : ...
}
C'est pourtant clair...
[^]Re: dans le fond, je ne dois pas avoir la forme ...
ca se discute. je dirais :
*Le fond :
Un titre :
* Le fond avec structure :
<h1>Un titre</h1>
* Le fond avec une structure et une presentation :
h1 {
font-familly : ...
}
<h1>Un titre</h1>
[^]Re: dans le fond, je ne dois pas avoir la forme ...
*Le fond :
Un titre :
Il manque la sémantique de ton message. Là c'est du contenu plus du fond :)
[^]Re: dans le fond, je ne dois pas avoir la forme ...
arf, exact!!
ptin c'est complique ces conneries...
[^]la forme de la fesse du pion dans le fond
la main sur le sein est un effet visuel necessaire pour comprendre la tartuferie du devot, sinon le propos n'a pas de sens dans la piece, l'image a donc un impact sur le texte.
tu vas me dire que c'est un cas particulier, permet moi de dire l'on est passé de forme/fond à forme1/forme2/fond . a trop vouloir séparer meme avec un bon fond, l'on imagine pas toutes les formes les plus tordues que cela peut prendre ( cf. histoire de l'humanité ) ;)
les aspects visuels pour certains ne sont que de la fioriture, seul le texte importe.I l n'empeche que musiques et images sont des élements essentiels dans un film.
Un exemple au hasard : fahrenheit 911 et l'autre film qui est sorti en meme temps.
l'autre film qui est sortie la meme semaine sur le sujet "bush" etait beaucoup plus interessant que le film de mickael moore. il n'empeche qu'il était un peu chiant dans son montage et lourd par certains moment. Mickael Moore maitrise la mise en scene. conclusion bien que moins bon et plus egocentré sur le realisateur, je me souviens du titre de Fahrenheit 911 et aucunement du second ( et j'ai beau cherché dans ma mémoire, je suppute un truc du genre "l'histoire secrete de G W Bush" ou un nom tout aussi sexy ).
A contrario, les jeux sans fond et les corps aux formes sympathiques nous marquent facilement et meme durablement.
Je rappelle que la chirurgie, comme la physique moderne, comme les bidouilleurs savent tres bien tout séparer mais remonter l'ensemble est toujours beaucoup plus hardu quand le nombre de morceaux est grand. Donc la séparation peut avoir du bon, mais il faut faire gaffe : tout flot de texte n'est pas un mer rouge semantique à séparer. ;)
[^]Re: la forme de la fesse du pion dans le fond
Au théâtre il y a le fond et la forme qui sont du ressors de l'auteur et il y a la mise en scène qui est faite par un metteur en scène.
Le tout étant bien évidemment emmêler.
C'est le rôle du metteur en scène que de mettre en valeur le texte de l'auteur (ou de l'adapter), ce faisant il influence le regard du spectateur sur le travail de l'auteur.
Certaines mises en scène font ressortir la forme, d'autres le fond .
[^]Re: la forme de la fesse du pion dans le fond
Certaines mises en scène font ressortir la forme, d'autres le fond .
On ne peut pas "faire ressortir le fond". On ne peut que faire ressortir une autre forme.
[^]Re: la forme de la fesse du pion dans le fond
C'était "Le monde selon bush" et c'était nul parce que basé uniquement principalement sur l'interview d'une seule personne.
La mort est un phénomène naturel qui se produit par l'avalement répété de petites quantités de salive au cours d'une grande période de temps. - George Carlin