Articles : Normalisation des formats de fichiers des suites bureautiques
Posté par patrick_g (page perso, ). Modéré le 09 décembre 2006.
Depuis quelques semaines le problème de la normalisation des formats de stockage de données des suites bureautiques a beaucoup évolué. L'ISO vient de publier les spécifications du format OpenDocument et l'Ecma vient de voter pour l'adoption du format Open XML de Microsoft. De plus l'utilisation des restrictions numériques (DRM) pourraient bien venir troubler cette apparente ouverture de nos formats de données.
Il est donc temps de passer en revue ces changements et de s'interroger sur les évolutions probables à moyen terme.
Il est donc temps de passer en revue ces changements et de s'interroger sur les évolutions probables à moyen terme.
Open XML devient un format Ecma (874 hits)
Publication de la norme ISO OpenDocument (249 hits)
La menace des DRM dans la bureautique (466 hits)
> Lire la dépêche (66 commentaires, moyenne: 3,7).
Vous avez demandé le commentaire #782750.




Question
Il est reproché à OpenXML d'avoir des spécifications trop importantes, mais d'après ce que j'en ai compris il s'agit d'une version XML des formats MS office. Or la suite Open Office, lit assez bien ces formats. Cela serait il si long d'implémenter une version lisant de l'openXML ?
[^]Re: Question
j'en ai compris il s'agit d'une version XML des formats MS office
Et c'est bien ce qu'on lui reproche. Il colle de trop près au format binaire des doc et xls, ce qui donne un format XML d'une qualité médiocre.
Or la suite Open Office, lit assez bien ces formats. Cela serait il si long d'implémenter une version lisant de l'openXML ?
Mais effectivement, il y a au moins un intérêt, c'est que, d'une part, les développeurs de logiciels ayant déjà un import/export des formats Office binaires n'auront pas trop de difficultés à implémenter openXML (en tous cas pour le sous-ensemble de fonctionnalités déjà supportées en format binaire), et que d'autre part, la documentation d'openXML permet de mieux comprendre les formats Office binaires.
[^]Re: Question
Le XML, c'est l'auberge espagnole, le menu c'est la DTD ou XML-schema. Ces derniers sont la grammaire et le lexique du XML. Or des grammaires et des lexiques, on peut en créer autant qu'on veut.
Une précision : dire qu'on fait du XML, c'est mettre des balises ouvrantes et fermantes de façon à faire un arbre bien structuré. C'est comme si on disait "il parle une langue" sans dire laquelle ni préciser son lexique et sa grammaire.
Entre Open Document et OpenXML, il peut y avoir des concepts qui n'ont pas d'équivalents ou des façons totalement différentes de traiter un problème. C'est un sujet que connaît particulièrement David Faure, l'un des principaux développeurs de la suite Koffice et qui a participé à l'élaboration de la norme Open Document.
Il faut 700 pages pour spécifier ODF et sensiblement le même nombre pour spécifier le PDF. Microsoft a publié les spécifications de RTF (qu'il ne respacte pas) en 100 pages. Jusque là les chiffres sont cohérents. Mais avoir "besoin" de 6000 pages montre très clairement que Microsoft reste fidèle à sa triste réputation. Il suffit que Microsoft n'utilise pas toute la DTD (sans le dire) pour faire un logiciel moins lourd et éloigner la concurrence. Rien ne l'empêche non plus de mettre entre deux balises un flot d'hexadécimal que seul Microsoft saura décoder ni d'utiliser des balises à d'autres fins sans le dire.
En conclusion, faire confiance à Microsoft serait se jeter dans la gueule loup.
[^]Re: Question
J'aimerais bien avoir la réaction de pasbill pasgate ou les zelotes de MS présent à Solution Linux (il y a 2 ans) qui expliquait que le format Open Document était moche et ne séparait pas assez la forme du fond. Bref, que OpenXML était sensé être 10 fois plus clean...
FUD quand tu nous tiens...
[^]Re: Question
> les zelotes de MS
Ceux de linuxfr sont très doués (pbpg, etc). Faut être doué pour soutenir du FUD maintes fois dénoncés, maintes fois constatés.
Parfois ils m'inspirent de l'admiration...
[^]Re: Question
<< humour >>
Bof... Ils ne font que leur boulot :-)))
<< /humour >>
[+] [^]Re: Question
Je me souviens pas avoir dit qu'il etait 10 fois plus clean ou que ODF etait moche, si tu me trouves un commentaire ou je dis ca je serai interesse, parce que j'ai jamais jete un oeil au format lui-meme donc...
Quand au reste, si OpenXML avait fait 600 pages, vous vous seriez plaint qu'il est incomplet et que MS a volontairement oublie des elements pour empecher les autres d'etre compatible, la tout est decrit et vous vous plaigniez qu'il est trop touffu, bref, vous ne serez jamais content quoi que MS fasse, inutile donc d'aborder la discussion ca serait une perte de temps.
[^]Re: Question
> vous ne serez jamais content quoi que MS fasse
Ben si MS fait un filtre d'importation et exportation pour OpenDocument on serait très content.
Si MS avait fait d'OpenDocument son standard (comme Koffice) on serait encore plus content (du moins s'il le respecte, ce qui est loin d'être garanti...).
Si l'installation de Windows ne pourrissait pas systématiquement le MBR du premier disque dur on serait aussi content.
Si MS ne pourrissait pas les normes (HTML, XHTML, etc) on serait content.
etc...
Le créneau de MS c'est de protéger ses monopoles par tous les moyens (brevet, specs incomplètes ou impossible à implémenter, non respect des standards pour imposer les leurs, etc). Ça on n'aime pas. Vu le créneau de MS et s'il n'en change pas, il est difficile d'être content par ce que fait MS.
[^]Re: Question
J'ajoute un truc. Ce n'est pas parce que c'est MS, qu'on n'aime pas MS. C'est ce que fait MS qu'on n'aime pas.
L'accord de Novell avec MS, je n'aime pas. Si Novell l'avait fait avec IBM ou Adobe par exemple, je n'aimerai toujours pas.
[+] [^]Re: Question
Ben si MS fait un filtre d'importation et exportation pour OpenDocument on serait très content.
C'est en cours, de quoi tu te plains ?
Si MS avait fait d'OpenDocument son standard (comme Koffice) on serait encore plus content (du moins s'il le respecte, ce qui est loin d'être garanti...).
C'est sur, et si ils avaient decide d'abandonner Windows et Office pour faire du Linux et de l'OpenOffice t'aurais ete encore plus content j'en suis sur.
Si l'installation de Windows ne pourrissait pas systématiquement le MBR du premier disque dur on serait aussi content.
Et si tu t'informais sur la raison ( http://blogs.msdn.com/oldnewthing/archive/2005/12/20/505887.(...) ) plutot que t'imaginer que c'est automatiquement pour faire chier le monde, tu comprendrais pourquoi.
Si MS ne pourrissait pas les normes (HTML, XHTML, etc) on serait content.
Firefox rejette les pages HTML non-valides ? Non, donc il pourrit les normes aussi.
Le créneau de MS c'est de protéger ses monopoles par tous les moyens (brevet, specs incomplètes ou impossible à implémenter, non respect des standards pour imposer les leurs, etc). Ça on n'aime pas. Vu le créneau de MS et s'il n'en change pas, il est difficile d'être content par ce que fait MS.
Et votre creneau est le meme que le marketing de MS : descendre tout ce qui va contre les interets de vos petits cheris (OO, Linux, ...) pour n'importe quelle raison. Bref, vous n'etes pas mieux que ceux que vous detestez.
[^]Re: Question
Et si tu t'informais sur la raison plutot que t'imaginer que c'est automatiquement pour faire chier le monde, tu comprendrais pourquoi.
Enfin je trouve que la raison est particulierement mauvaise... En effet, ecraser le MBR systematiquement est tres simple, mais dire que prendre en compte les autres OS potentiellement installés serait risqué en cas de corruption du disque est quand meme d'assez mauvaise fois: lorsque l'on installe Linux, c'est le comportement par défaut, et je n'ai jamais entendu quiconque se plaindre que sons systeme ne soit pas bootable a cause de cela.
Donc si le fait que Linux prenne en compte la presence eventuelle de Windows ne pose pas de problemes, je en vois pas en quoi l'inverse poserait probleme! Et puis au pire, une option avancéee... Mais bon, il est plus séduisant de faire au plus simple et de se comporter comme un barbare sur le systeme de l'utilisateur...
Mathias
[^]Re: Question
Tout à fait d'accord. En outre, le lien cité n'explique absolument pas pourquoi c'est la (ou une des) première(s) chose(s) que fait le programme d'installation de windows, avant même de lui demander d'installer ou de réparer une installation existante.
Chose vécue : mettre le CD d'install de Windows XP pro, se rendre compte au premier instant où on a la main que finalement on a une autre solution que de tout réinstaller, retirer le CD et rebooter : impossible !
[+] [^]Re: Question
Donc si le fait que Linux prenne en compte la presence eventuelle de Windows ne pose pas de problemes, je en vois pas en quoi l'inverse poserait probleme!
Oh mais c'est tres tres simple, comment est-ce que MS est sense savoir a quoi le MBR d'un systeme Linux va ressembler 3 ans apres la sortie de leur OS ?
Pourquoi Linux et pas FreeBSD / AROS / ... ?
C'est dit clairement dans le post, tu peux t'amuser a essayer de deviner, et si tu te gourres, c'est l'utilisateur qui l'a dans le fion.
Resultat, c'est la methode la plus sur et c'est celle qui est utilisee.
Mais bien evidemment, encore une fois, ca va etre tourne en histoire d'incompetence ou de complot.
Enfin bon, vu que visiblement personne ici ne semble assez honnete pour laisser les avis divergents s'exprimer vu le moinssage des autres posts, je vais aller passer mon temps avec des gens legerement plus ouverts d'esprit, ca me changera de cette soi-disant "communaute qui prone l'ouverture et la liberte".
[^]Re: Question
Il existe 2 boot loader très connu, lilo et grub. Les autres sont anécdotiques. De plus, le chainage de démarrage doit être relativement triviale à faire, même avec du code inconnu.
C'est marrant que lilo et grub s'arrange très bien de windows mais qu'à l'inverse, une société avec des dizaines de milliers de codeurs n'arrivent pas à copier leur comportement... Et tu voudrais nous faire croire que vous ne le faites pas exprès ?! (histoire d'interdire le dual boot !)
La méthode la plus sur est d'écraser les données des utilisateurs, mdr. J'attend le 1er procès US, tient...
[^]Re: Question
En lisant ces raisonnements unilatérales , ou on est a la fois incapable d'accepter un seul argument des autres et ou on les accuses de ne pas être ouverts :
une idée me vient , et si pbpg et mathiasf étaient une seule et même personne ?
[^]Re: Question
"s/mathiasf/matiasf/"
Toi, le sage, dit nous que en penser ou "seulement" ce que tu en penses. Ca ferait peut-être avancer le débat.
[^]Re: Question
"Si MS avait fait d'OpenDocument son standard (comme Koffice) on serait encore plus content (du moins s'il le respecte, ce qui est loin d'être garanti...).
C'est sur, et si ils avaient decide d'abandonner Windows et Office pour faire du Linux et de l'OpenOffice t'aurais ete encore plus content j'en suis sur."
Je suis sur que tu es capable de faire la différence entre le soutien correct d'un format standard et l'abandon d'un produit. Si, j'en suis sûr ! Tu as l'air bien intelligent donc, cela ne doit pas être trop dur de concevoir cela.
"Si l'installation de Windows ne pourrissait pas systématiquement le MBR du premier disque dur on serait aussi content.
Et si tu t'informais sur la raison ( http://blogs.msdn.com/oldnewthing/archive/2005/12/20/505887.(...) ) plutot que t'imaginer que c'est automatiquement pour faire chier le monde, tu comprendrais pourquoi."
Quels sont les mots qui me viennent à l'esprit ? mmmh, disons "hypocryte", "FUD", "Oh ben mince alors", "on est obliger d'écraser tous les autres".
"Si MS ne pourrissait pas les normes (HTML, XHTML, etc) on serait content.
Firefox rejette les pages HTML non-valides ? Non, donc il pourrit les normes aussi."
Elle est vachement bonne celle-là ! Faudrait que Nitot passe dans le coin pouir y répondre. Cela sera assez poilant (pas pour un MS-guys, mais tu le sais déjà).
"Le créneau de MS c'est de protéger ses monopoles par tous les moyens (brevet, specs incomplètes ou impossible à implémenter, non respect des standards pour imposer les leurs, etc). Ça on n'aime pas. Vu le créneau de MS et s'il n'en change pas, il est difficile d'être content par ce que fait MS.
Et votre creneau est le meme que le marketing de MS : descendre tout ce qui va contre les interets de vos petits cheris (OO, Linux, ...) pour n'importe quelle raison. Bref, vous n'etes pas mieux que ceux que vous detestez.
"
Tu as raison, évidement. Mais saisis-tu la différence entre les interet d'une mutlinationnal et celle des consomateurs ?
Si les monopoles sont illégaux dans un système capitalistique, c'est qu'une société sans concurrence peut se permètre de faire diminuer l'offre vers zéro et augmenter les prix vers l'inifini.
Expliques moi comment ce schéma pourrait exister si des logiciels libres "dominaient". Cela serait vrai en part de marché mais pas en monopole d'une société.
Bref, tu mélanges torchon et serviette. FUD tu connais... et bien même (nous renvoyer dos à dos, c'est tellement facile).
[^]Re: Question
> > Et si tu t'informais sur la raison ( http://blogs.msdn.com/oldnewthing/archive/2005/12/20/505887.(...) ) plutot que t'imaginer que c'est automatiquement pour faire chier le monde, tu comprendrais pourquoi."
>
> Quels sont les mots qui me viennent à l'esprit ? mmmh, disons "hypocryte", "FUD", "Oh ben mince alors", "on est obliger d'écraser tous les autres".
Surtout qu'un comportement par défaut (et non imposé) raisonnable peut être d'écraser le MBR. Pour les utilisateurs "pointus" ou qui veulent installer un OS en parallèle, il suffit d'ajouter par exemple un bouton "configuration avancée".
> > plutot que t'imaginer que c'est automatiquement pour faire chier le monde
C'est uniquement une pratique anti-concurrencielle.
MS n'a aucun excuse valable et je me demande comment tu fais, mon pauvre pasBill pasGate, pour soutenir ce type de pratique minable.
[^]Re: Question
> Et votre creneau est le meme que le marketing de MS : descendre tout ce qui va contre les interets de vos petits cheris (OO, Linux, ...) pour n'importe quelle raison. Bref, vous n'etes pas mieux que ceux que vous detestez.
Pour mon créneau.
Je ne crois pas qu'un monde qu'avec du logiciel libre soit possible ni mieux qu'un monde avec un mix libre/proprio. Dans le domène des jeux par exemple je ne vois pas d'avenir sérieux pour le libre.
Personne ici ne demande à MS de mettre les sources de MS-Office sous GPL. S'ils le font tant mieux ceci dit.
Le représentant les plus reconnu du libre, ne demande pas à NVidia de mettre leurs driver sous GPL. Il demande avant tout que les specs soient à disposition. Ainsi le libre peut faire un driver comme NVidia fait un driver. Puis que le meilleur ""gagne"" au bénéfice de l'utilisateur.
Il est question que le libre et le proprio aient les mêmes chances de réussir. Au détriment de l'un ou l'autre, je m'en fous, mais surtout au bénéfice de l'utilisateur, et disons le de la société.
Les brevets sont une "arme" du logiciel proprio pour tuer le libre. Le libre n'a pas cette arme, ne l'a demande pas. Le libre est contre les brevets, pour sa survie et pour des raisons "philosophique" ou de société.
Le libre ne demande pas la suppression des brevets pour tuer le logiciel proprio, mais seulement pour que le logiciel libre puisse vivre et faire son chemin.
Le logiciel proprio, et plus particulièrement MS, veut des brevets pour tuer le libre (ses concurrents en général). C'est un méthode peu loyale car elle ne s'appuis pas sur des compétences/un savoir faire/etc, mais sur un droit exclusif. Etant un social-libéral, je déteste ça.
De même pour l'abus de position dominante. C'est un truc qui n'arrive et ne peut arriver qu'avec du proprio. Le libre demande des mesures pour que celà ne soit plus possible. Il n'y a pas d'abus de position dominante dans le libre car c'est quasi-impossible.
Si les règles sont justes (pas de brevets, pas d'abus de position dominante) et que MS réussi, tant mieux pour MS. D'ailleur je crois, je suis perçuadé, que MS peut réussi sans ces trucs puants.
Expliques nous en quoi le libre fait du tord à MS ?
Si c'est car le libre est plus choisi par les utilisateurs, et ce librement par ces derniers (pas car le libre aurait des droits exclusifs ou abuserait d'une position dominante), c'est uniquement au bénéfice des utilisateurs. Et des utilisateurs il y en a beaucoup beaucoup beaucoup plus que des employés de MS. Si MS coule et que les utilisateurs sont heureux, ben tant mieux pour les 99,99% des utilisateurs/développeurs/etc d'informatique.
[^]Re: Question
Ben si MS fait un filtre d'importation et exportation pour OpenDocument on serait très content.
Ah non ! MS a quitté le consortium de normalisation du format ODF de l'OASIS parcque justement ils sentaient que y'aurait de toute manière des impasses, que ce soit politique mais aussi technique. C'est à nous de prouver que notre super format universel bien-mieux-que-l'autre-et-facile-a-implementer est capable de s'adapter aux principaux produits du marché.
Si MS avait fait d'OpenDocument son standard (comme Koffice) on serait encore plus content
Si on avait fait en sorte que ca soit techniquement possible, on aurait dû pondre une doc de 6000 pages pour prendre en compte toutes les fonctionnalités des principales suites bureautiques utilisées. Mais bon, visiblement il y avait surtout urgence à sortir un format OASIS/ISO le plus vite possible avant MS pour pouvoir dire aux administrations : regardez que c'est nous qui avons le standard le premier !
Evidemment que le format OpenXML n'est pas clean, que y'a beaucoup trop de trucs de compatibilité avec des anciens produits (mais largement utilisés), mais au final, c'est tou bénef pour le monde du libre : MS aurait pu se contenter de pondre une doc plus clean de 600 pages, et mettre des gros hacks de porcs non documentés pour assurer la compatibilité avec ses propres produits. Non, là ils ont fait le choix de documenter toutes les fonctionnalités des précédentes suites, on va quand même pas se plaindre non ?
Qu'on me dise pas que c'est pas implémentable, rien n'empêche d'implémenter que le principal sans tenir compte des trucs là pour la compatibilité avec les vieux produits, bref comme si la doc ne faisait que 600 pages.
Vous vouliez quoi exactement ? Que MS recode Office 2000/XP/2003/2007 pour qu'il gère un format qui ne dépasse pas 600 pages ?
Le reste c'est HS.
MonoFrance
[^]Re: Question
Il y a quelque chose qui me tracasse, tu dis toujours que l'openXML permet certaines fonctionnalités non prévues dans ODS; mais dans ce cas peut-on vraiment convertir à 100% tous les documents openXML en ODS ?
[^]Re: Question
Bien sûr que non. Et réciproquement. Et c'est là qu'on comprend la situation actuelle :
- Oui, l'ODF comme l'OpenXML ne sont pas des formats d'échange de données mais des formats de travail pour des suites bureautiques.
- Non, MS ne peut supporter nativement l'ODF dans MS Office parcque ses fonctionnalités ne correspondent pas exactement aux possibilités du format ODF.
- Oui, MS était obligé de normaliser un autre format.
- Non, l'ODF ne peut pas être LE standard, juste un standard.
La conversion d'un format dans l'autre impliquera forcement des pertes d'informations (le contenu peut être converti la plupart du temps, on ne perdra pas de données, mais sûrement des informations sur leur structure). Ca ressemblera a des possibilités d'import ou d'export.
L'intérêt reste que nous avons maintenant 2 formats aux spécifications ouvertes, nous somme sûres que les données ne seront pas enfermées d'un format propriétaire empêchant toute éventuelle migration (voir perte des données) ou dépendance envers un acteur particulier.
MonoFrance
[^]Re: Question
Merci pour la réponse :-)
Juste une autre question, que se passe-t'il si le document OpenXML contient un objet Visio par exemple (container ?)
Celui-ci sera convertissable ou visible sur une machine n'ayant pas Visio installé ??
Si la réponse est Non, dans ce cas, on ne pourra pas porter tout-à-fait un document openXML en ODF, je me trompe ? Donc on continuera avoir des formats propriétaires dans l'openXML et le probléme de ces format n'est résolu, j'ai juste ?
[^]Re: Question
Juste une autre question, que se passe-t'il si le document OpenXML contient un objet Visio par exemple (container ?)
Ben dans l'Open XML t'as une partie des spécifications qui concerne la représentation de diagramme telle qu'utilisé par Visio. (DataDiagramingML)
MonoFrance
[^]Re: Question
Une partie des spécifications ...
Des spécifications incomplètes, absentes, partielles ou fausses : ça veut dire inutilisables. Basta.
[^]Re: Question
J'ai pas dis que c'était incomplet, j'ai voulu dire qu'un sous-ensemble de la spécification OpenXML concerne le format de Visio.
MonoFrance
[^]Re: Question
OpenOffice.org importe correctement tous les formats existants de Microsoft et implante les spécifications ODF. Microsoft aurait pu en faire autant. Les 6000 pages de spécifications sont délibérément faites pour noyer le poisson car le besoin de compatibilité avec les anciens documents dont le format n'a jamais été spécifié n'avait pas à être incorporé dans le nouveau standard. C'est le travail des filtres.
[^]Re: Question
Je ne suis pas un "dinosaure" mais force est de constater qu'entre Word 6 et Word 2003, ou Excel 5 et Excel 2003, ou MS-Access 2 et MS-Access 2003, il n'y a pas grand chose de différent. On voit encore aujourd'hui des boites de dialogue qui sentent bon de windows 3.x.
Il y a des assistants en plus (des casses-couilles pour moi) et en gros c'est tout. 99 % de ce que je fais aujourd'hui avec MS-office 2003, je le faisais avec Word6/Excel5/Access2.0 . Et je suis un utilisateur très "affuté" de MS-Office. J'espère que d'autres témoingnerons dans le même sens.
Ceci pour dire que je n'arrive pas à croire que les specs au niveau fichier (un assistant de plus, ça ne demande pas de changer les specs du fichiers) ont beaucoup changée depuis Word6/Excel5/Access2.0 (sortis en 1995/1996 ?). 6000 pages de spec pour Word6/Excel5 (OK, disons 4000), je n'arrive pas à y croire.
> Les 6000 pages de spécifications sont délibérément faites pour noyer le poisson
J'en suis convaincu.
Pour info, il y a avais les documents maitre, les champs, les styles, les tables des matières, les index, le publipostage, etc... dans Word 6 (sortit il y a 10 ans !). Il n'y a pratiquement rien de majeur en plus dans Word 2003. Idem pour Excel et Access.
Ceci dit, je ne reproche pas à MS d'avoir peu fait évolué sa suite. Elle est massivement utilisée et appréciée.
[^]Re: Question
OpenOffice.org importe correctement tous les formats existants de Microsoft.
Alors qu'on vienne pas raconter des conneries comme quoi il est impossible d'implémenter les 6000 pages du format OpenXML qui ne sont que la retranscription sur le papier des formats de MS.
Microsoft aurait pu en faire autant.
MS ne peut se permettre d'être aproximatif comme l'est OOo. On migre pas un parc entier de suites bureautiques systématiquement. Le nouveau PC du collègue qui a la licence du dernier MS Office doit pouvoir travailler tranquillement avec nos documents fais sous une version précédente sans que cela n'est un quelconque impact. Alors non, MS ne pouvait pas faire comme OOo et se contenter de faire de l'import/export. Ils doivent garder un maximum de compatibilité.
C'est le travail des filtres.
Explique, en quoi c'est la solution miracle les filtres ?
MonoFrance
[^]Re: Question
> Alors qu'on vienne pas raconter des conneries comme quoi il est impossible d'implémenter les 6000 pages du format OpenXML qui ne sont que la retranscription sur le papier des formats de MS.
Alors qu'on vienne pas raconter des conneries comme quoi les 6000 pages de spec sont justifiées.
> MS ne peut se permettre d'être aproximatif comme l'est OOo.
Rires.
> On migre pas un parc entier de suites bureautiques systématiquement.
C'est vrai.
> Explique, en quoi c'est la solution miracle les filtres ?
Tu n'as pas remarqué que c'est beaucoup utilisé les filtres ?
Même MS les utilise pour leurs propres besoins. Ne dis pas le contraire.
[^]Re: Question
Alors qu'on vienne pas raconter des conneries comme quoi les 6000 pages de spec sont justifiées.
? T'as lu les specs pour affirmer ca ? Moi de ce que j'en ai vu, c'est que pour chaque balise t'as un texte explicatif, un tableau qui récapitule les attributs possibles avec description associée et un exemple au format XML. Alors oui on y trouve des parties consacrés aux hacks pour les vieux MS Office, mais qui va râler que c'est ENFIN documenté ? On y trouve aussi des hacks pour WordPerfect soit dit en passant. Tiens d'ailleur Corel a pas annoncé qu'il allait supporter le format OpenXML au même titre que l'ODF ? C'est que ca doit être dur à implémenter dis donc.
Moi ce qui me fait marrer, c'est qu'au mois de juin, lorsque OpenXML n'était qu'un draft, un argument qui revenait contre ce format c'était le "manque de documentation" comparé aux 600 pages du format ODF.
Rires.
Très drôle. T'as jamais eu de problème (aussi petits soient-ils) en passant un document de MS Office à OpenOffice.org ?
Même MS les utilise pour leurs propres besoins. Ne dis pas le contraire.
Ca n'en fait pas pour autant un argument. Un filtre ca veut rien dire, tu peux appeler tout et n'importe quoi un filtre.
MonoFrance
[^]Re: Question
"Moi ce qui me fait marrer, c'est qu'au mois de juin, lorsque OpenXML n'était qu'un draft, un argument qui revenait contre ce format c'était le "manque de documentation" comparé aux 600 pages du format ODF."
Quand on parle de "manque" on parle de qualité de la doc, pas du poids du papier...
[^]Re: Question
Merci ! Enfin un commentaire pertinent !
Mais je faisais référence à un article d'un "spécialiste de l'ODF" du mois de juin, et il faisait explicitement référence au nombre de pages. C'est évident qu'il faut se focaliser sur la qualité du contenu et pas sur la quantité.
Et le pire c'est que même l'ODF Alliance y va de son dénigrement du format concurrent en reprenant l'argument débile du nombre de pages : http://www.odfalliance.org/resources/OfficeOpenXMLFactSheet.(...)
On voit même certains tenter de calculer le nombre d'homme/année nécessaire pour implémenter une telle norme pour démontrer que l'OpenXML c'est nul, du grand n'importe quoi.
Au passage on notera que l'ODF c'est pas seulement 600 pages, faut ajouter les specs du format SVG, des XForms, de MathML, de OpenFormula, etc. Y'en a un qui s'est amusé à calculer tout ca et est arrivé à 2500 pages.
MonoFrance
[^]Re: Question
Mais dans ce contexte, des standards établis sont réutilisés évitant d'avoir à réinventer sa propre roue
Laurent
[^]Re: Question
Mais dans ce contexte, des standards établis sont réutilisés évitant d'avoir à réinventer sa propre roue
Effectivement, le standard existe déjà. Ce qu'il faut peut être refaire, c'est l'implémentation (l'intégration d'implémentation existente n'est pas forcement faisable).
Mais bon l'OpenXML se base également sur les formats existant de MS Office, bien que n'étant pas des standards ils existaient déjà et étaient déjà implémentés (par MS Office mais aussi OOo ou WordPerfect), bref y'a pas non plus grand chose à réinventer.
MonoFrance
[^]Re: Question
Pas à réinventer ? pour l'ensemble de la communauté, si, c'est une invention puisque non documenté. De plus ces formats utilisé par MsOffice pour MsOffice sont de son seul fait et sans concertation avec d'autres acteurs alors que SVG, XForms, UTF-8, sont standardisés et accessibles par tous mais de plus ne se cantonnent pas à la simple bureautique mais ont avant tout été guidé par l'utilisation qui en est/sera faite.
De plus, je ne considère pas qu'OOo (wordperfect je sais pas) implémente le format .doc puisque celui-ci est indéfini (puisque pas de specs). Tout au plus ne se debrouille t il pas si mal à en faire le rendu ... ;-)
[^]Re: Question
Pas à réinventer ? pour l'ensemble de la communauté, si, c'est une invention puisque non documenté.
Eh faut pas déconner non plus, le format de Office 2003 (format XML, père de l'OpenXML) a ses specs ouvertes depuis un bon moment.
). Tout au plus ne se debrouille t il pas si mal à en faire le rendu ... ;-)
Le rendu est l'écriture, donc c'est pas si mal ;) Enfin tout ca pour dire que globalement même si tu peux t'amuser à considérer que les specs sont "une nouveauté", reste que va pas y avoir grand chose à réinventer en l'implémentant.
Ah oui, et puis MS n'avait pas de raison de réinventer la roue non plus, son format étant largement plus ancien que la plupart des normes employés dans le format ODF... je sais pas lequel a réinventer la roue ;) (C'est de l'humour bien sûr, les formats utilisés par l'ODF ont l''énorme avantage d'être des standards on est d'accord)
MonoFrance
[^]Re: Question
Dans le cinquième paragraphe, patrick_g précise les difficultés à implémenter ce format : trop lié à Windows, volonté de garder une compatibilité avec les autres formats d'Office, de trucs un peu bizarre apparement (cf. les liens dans le paragraphe).
Bref, ça doit être possible d'implémenter "rapidement" une version qui lit les bases du format. Mais en fait, ça sera ensuite pareil que pour les formats actuels d'Office.
Enfin, c'est mon avis.
[^]Re: Question
"Même si les logiciels concurrents parviennent à implémenter le format Open XML ils ne pourront lire les documents exigeants une clé de libération et les utilisateurs continueront donc à utiliser les produits Microsoft. Le plus beau c'est évidemment que même la simple tentative de retrouver les clés est dorénavant interdite par la loi !"
Le problème n'est pas l'open-xml en lui-même, mais ce qu'il y a autour. Je ne pense pas que microsoft se soit donné la peine d'investir dans un nouveau format semblable à celui qui est libre sans avoir une idée qui leur permette de continuer à gagner des $$$.
[^]Re: Question
La contridiction que tu soulèves s'évanouit si tu prend en compte qu'OpenOffice est le successeur d'une suite (StarDivision) initiée dans les années 80 et que les efforts pour prendre en charge le format .doc ont été longs et douloureux ! C'est "assis sur ces épaules de géant" qu'OpenOffice.org a pu relativement rapidement prendre en charge OpenXML son prédécesseur WordML 2003.
Le point clé à comprendre est que tous ces efforts brûlés à deviner la signification du bit 0x0FEE du auraient pu être consacrés à améliorer la vie des utilisateurs en révolutionnant l'ergonomie, en améliorant les performances, en diminuant les coûts, en innovant par des fonctionnalités qui tuent, en s'intégrant toujours mieux au bureau.
Donc si vous voulez que l'histoire se répête, implémentez aujourd'hui les 6000 pages d'OpenXML pendant que Microsoft avance sur tous ces points là.
KOffice par exemple avoir choisi l'autre voie : pas de cache-catchup avec Microsoft, place à l'innovation[1]
On pourrait imaginer qu'ils aient recours à cette solution pour éviter le piège tendu par les formats de Microsoft : OpenOpenOffice[2], un plugin qui comme son nom l'indique transmet des fichiers dans des formats obsolètes à OpenOffice, contact un serveur OpenOffice qui transforme tout ça en du beau OpenDocument tout propre et le renvoit à l'application
[1] http://linuxfr.org/~patrick_g/21037.html
[2] http://o3.phase-n.com/index.html
[^]Re: Question
Dans l'idée, c'est pas mal, mais je doute que les entreprises accueillent sans broncher ce genre de solution "décentralisée" pour les montagnes de documents internes plus ou moins confidentiels éventuellement à convertir...ggggnnnnnnnnnnnnnnnnn (interprétation libre)
[^]Re: Question
Ben non, il suffira d'installer le serveur-convertisseur OpenOffice-Soap en interne ;-)
[^]Re: Question
J'ai lu un article dont j'aimerais bien retrouver qui expliquait pourquoi les grandes entreprises adoptaient le format ODF plutôt que le OpenXML justement à cause des examples donné ci-haut, Microsoft ne l'auras pas facile avec cette stratégie de mauvais gout envers ces clients.
[^]Re: Question
Dans la mesure ou la norme fait 6000 pages, ( pour comparer "perl en action en fait 900, et c'est le plus gros bouquin d'info que j'ai trouvé, donc, pour visualiser, tu prends le plus gros bouquin d'info que tu as , et tu en prends 6 ou 7 ), je pense que oui, ç'est long.
De plus, la norme définit un format qu'on ne peut pas valider complétement via des moyens normaux ( ie, les bitfields, on ne peut pas dire en xml ce champ doit pas dépasser XX car c'est un bitfield de 3 bit" ), ou justement les bitfields ne sont pas des constantes nommés ( encore une fois, expliqué ici http://www.robweir.com/blog/2006/10/bit-about-bit-with-bits.(...) ). Le manque de validation fait que tu ne sait pas si le fichier entrant est correct ou pas, et pire, tu ne peut pas savoir si tu produit un document correct en sortie à 100%
Et pour finir, les bitfields poseront des problémes certains lors du portage sur des archis ou l'ordre des octets ( endianess : http://fr.wikipedia.org/wiki/Endianness ) différente du i386, comme le ppc, ce qui bien sur va générer des bugs et faire perdre du temps aux developpeurs soucieux de la portabilité ( cad, tout ceux de distributions comme debian, fedora, gentoo, et qui vont faire des rapports de bugs ), et je suis sur à parier qu'il faudra un certains temps avant que tout les problémes soient corrigés et découvert de maniére empirique avec des corrections sans doute différentes ( et générant des fichiers non validés à 100% ).
Et ça, c'est juste sur la base des bitfields, peut être que les 6000 pages du standard cachent d'autres problémes du même genre .
Et de toute façon, novell, dans le cadre de l'accord avec MS, bosse sur le support en question. Les gens ont fait du reverse engineering pour comprendre le format word, qui est quand compliqué, avec la quasi-réimplementation d'un systéme de fichier ( http://sc.openoffice.org/compdocfileformat.pdf ), comme souvent dans les systémes d'archives ( genre le .pak de quake, etc ), en plus de la nécessité de comprendre le format des informations, donc bon, avoir 6000 pages de documentations ne peut pas vraiment être pire.
Bien sur, il ne reste plus qu'à la communauté du libre que de mettre en avant le fait que l'odf, c'est quand même plus facile à supporter, et d'installer autant que possible le convertisseur sur word, http://odf-converter.sourceforge.net/download.html chez les autres.
[^]Re: Question
De toute façon, microsoft ne respectera pas sa propre norme. Pourquoi le ferait il ? Il ne le fait pas pour RTF, par exemple. Ainsi, même si un logiciel concurent la prend en charge parfaitement, il restera moins bon que MS Office...
[+] [^]Re: Question
De plus, la norme définit un format qu'on ne peut pas valider complétement via des moyens normaux ( ie, les bitfields, on ne peut pas dire en xml ce champ doit pas dépasser XX car c'est un bitfield de 3 bit" ), ou justement les bitfields ne sont pas des constantes nommés ( encore une fois, expliqué ici http://www.robweir.com/blog/2006/10/bit-about-bit-with-bits.(...) ). Le manque de validation fait que tu ne sait pas si le fichier entrant est correct ou pas, et pire, tu ne peut pas savoir si tu produit un document correct en sortie à 100%
Hahaha la grosse connerie, ben non hein, personne ne sait comment verifier la valeur d'un champ qu'on lit si il est en binaire.
Et tu crois qu'une DTD c'est un moyen suffisant de faire une validation ? Si c'est le cas je te proposes d'aller faire un minimum de recherche sur les failles de securite via XML.
Et pour finir, les bitfields poseront des problémes certains lors du portage sur des archis ou l'ordre des octets ( endianess : http://fr.wikipedia.org/wiki/Endianness ) différente du i386, comme le ppc, ce qui bien sur va générer des bugs et faire perdre du temps aux developpeurs soucieux de la portabilité
Ah ben oui, c'est tellement complique ca que c'est effectue par quasiment tous les ordinateurs de la planete quasi-constamment.
T'es au courant que TCP/IP contient des champs de plus de 8 bits ? Pourtant la personne n'a de probleme a savoir comment les mettre en ordre, mais bien evidemment dans un format MS c'est impossible a faire pour les developpeurs, ils sont subitement devenus stupides.
Comme dit plus haut, vous ne serez jamais content, il y aura toujours un petit truc ici ou la que vous mettrez sous une loupe pour faire croire que c'est un probleme 100 fois plus grave qu'il ne l'est histoire de casser du sucre sur MS et faire croire que le libre c'est le chevalier blanc face au mechant dragon.
[^]Re: Question
Comme dit plus haut, vous ne serez jamais content, il y aura toujours un petit truc ici ou la que vous mettrez sous une loupe pour faire croire que c'est un probleme 100 fois plus grave qu'il ne l'est histoire de casser du sucre sur MS et faire croire que le libre c'est le chevalier blanc face au mechant dragon.
Force est quand même de reconnaitre que ce format c'est de la m... Si c'était n'importe qui autre que MS, personne n'aurrait jamais accepté de le valider comme norme. Je sais qu'il y a des antécédents et que la compatibilité arrière est importante (j'en suis souvent un ardent défenseur), mais face à 6000 pages de doc, je me dis qu'il y a forcément au moins un piège. Les ingénieurs de chez MS ne sont pas plus cons que les autres, alors pourquoi la spec de leur format est 10 fois plus longue que celle des autres ?
Ceci dit, j'espère que cette normalisation apportera un support correct dans des suites bureautiques autres que celles de microsoft. Pour le moment, le meilleur lecteur de doc word que j'ai trouvé c'est antiword, mais du coup je n'ai pas les graphiques, c'est embetant. Et reste le problème de la génération de ces docs.
[^]Re: Question
> personne ne sait comment verifier la valeur d'un champ qu'on lit si il est en
> binaire.
On sait le vérifier. On sait pas quel sont les bit valables ou pas. Ni la taille admise.
> Et tu crois qu'une DTD c'est un moyen suffisant de faire une validation ? Si
> c'est le cas je te proposes d'aller faire un minimum de recherche sur les
> failles de securite via XML.
C'est pas suffisant, mais c'est toujours mieux que rien. Et je parle de validation par rapport aux formats, pas de l'applicatif.
> Ah ben oui, c'est tellement complique ca que c'est effectue par quasiment
> tous les ordinateurs de la planete quasi-constamment.
dans ce cas, tu peut sans doute pointer l'auteur de l'article sur l'endroit ou il est expliqué quel est l'endianness des champs ?
> T'es au courant que TCP/IP contient des champs de plus de 8 bits ? Pourtant
> la personne n'a de probleme a savoir comment les mettre en ordre,
Un rapide cours de programmation réseau ( genre niveau bac +3 en fac, dans le pire des cas ) te montreras que personne n'a de probléme car justement il y a un format défini. Et des fonctions qui le font pour les développeurs : http://www.die.net/doc/linux/man/man3/htons.3.html
Bien sur, ça implique d'avoir un consensus avec les acteurs de l'industrie. Mais je suppose que tu peut prouver à l'auteur de l'article qu'il a tort, en lui envoyant la page ou il est décrit le sens dans lequel les bitfields doivent être lu ?
Et quand bien même, ça ne changerais rien aux autres points, comme celui la http://www.robweir.com/blog/2006/10/leap-back.html
> Comme dit plus haut, vous ne serez jamais content, il y aura toujours un
> petit truc ici ou la que vous mettrez sous une loupe pour faire croire que
> c'est un probleme 100 fois plus grave qu'il ne l'est
Impressionnant, tu as réagit exactement comme décrit dans http://www.robweir.com/blog/2006/12/how-to-write-standard-if(...)
"Any criticism of the specification can automatically be dismissed as nitpicking. For example, if you are presented with a list of 500 faults in a 6,000 pages specification, you can respond, "That is less than 10%. You are just nitpicking. We can fix that in release 1.1". Or you can even just rely on the familiar justification, "Shipping is a feature". Any finite list of defects can be made minuscule by a sufficiently large specification."
[^]Re: Question
Ai-je bien compris ce que tu écris là ... ?
Cela veut-il bien dire qu'il est impossible de valider la norme "contre" une DTD ou un XML-Schema ?
Je ne connais pas grand chose à XML, mais si j'ai bien compris, un des gros intérêt de la chose est de pouvoir :
1) défnir la structure à laquelle doit se conformer un document
2) être capable de vérifier qu'un document se conforme bien au format sur lequel il dit s'appuyer.
4) de disposer d'utilitaires justement chargés de faire ça
Je passe bien sûr sur les principes de séparation data/structure/présentation et le Xsl ... c'est ici +/- HS.
Donc, s'il est exact que cette norme ne peut être validée, je comprends que l'on puisse être plus que dubitatif voire extrêmement critique sur la chose...
Profitez bien de ce jour
J.L.P.