Journal Les formats {Open|MS}Office Document à la loupe

Posté par  (Mastodon) .
Étiquettes : aucune
0
26
nov.
2005
Voici une très bonne analyse du point de vue du développeur des formats OpenDocument (.odt) et MS Office XML (.docx).

En gros, OpenDocument en sort largement vainqueur grâce à une large réutilisation de standards existants, quant à Microsoft, ils ont apparemment encore voulu tout faire à leur sauce ...

L'article : http://www.groklaw.net/article.php?story=20051125144611543
Vu à partir du blog :
http://braincore.blogspot.com/2005/11/wtf-is-this-xml.html
  • # Des critiques infondées...

    Posté par  . Évalué à 1.

    J'ai brievement survolé l'article et je n'ai pas, comme l'auteur semble le penser, été convaincu de la "supériorité" d'un format devant l'autre.

    Apres tous, les deux formats sont basés sur de xml et ils permettent (si la license de ms l'autorise bien sur, où là j'ai beaucoup de doutes) tous deux l'interoperabilité. En tous cas, ça n'a rien à voir avec les formats actuels utilisés par ms office, et les remarques faites dans cette page, amha, tiennent plus des batailles de chiffonniers que de la vraie argumentation.

    Le format xml est à la base verbeux, alors qu'en a t'on à faire que celui de ms le soit plus que celui de Ooo ? Que les namespaces ne soient pas "standards" ? que celui de ms n'utilise pas Xlink et reinvente la roue ?

    En fait, j'ai surtout l'impression que cet article essaie de casser du sucre sur microsoft parce que c'est microsoft, sans vraiment mesurer l'adaptation du format à l'utilisation qui en est faite : savoir quelle DTD aurait été plus adaptée à la sauvegarde d'une présentation par exemple, serait bien plus interessant que les points abords dans ce texte.
    • [^] # Re: Des critiques infondées...

      Posté par  (site web personnel) . Évalué à 2.

      D'accord pour le verbeux/pas verbeux, un facteur principal est par exemple la taille finale du document à contenu égal, qui n'est ici pas mentionnée. Il est vrai que OpenDocument semble plus lisible que MS XML, cela dit une fois qu'on a les specs de chacun, on s'en balance un peu.
    • [^] # Re: Des critiques infondées...

      Posté par  (site web personnel) . Évalué à 9.

      La verbosité de XML est bonne quand il s'agit d'avoir des noms de balises compréhensibles par l'humain, mais pas quand on multiplie les balises sans comprendre instantanément à quoi elles servent... L'exemple donné dans l'article le montre bien:

      OpenDocument:
      <text:span text:style-name="Strong_20_Emphasis"gt;
      this is bold
      </text:spangt;

      MS XML:
      <w:rgt;
      <w:rPrgt;
      <w:b /gt;
      </w:rPrgt;
      <w:t>this is bold</w:tgt;

      </w:r>

      MS XML est plus verbeux... mais est-ce que ça sert vraiment à quelque chose ici ?

      Concernant la réutilisation des standards je trouve cela évident qu'il vaut mieux utiliser ce qui existe déjà plutôt que de réinventer la roue... sinon on va apprendre un système de liens qui ne servira que pour MS XML alors que XLink peut servir partout où il y a du XML.
      • [^] # Re: Des critiques infondées...

        Posté par  (site web personnel) . Évalué à 2.

        Argh... désolé pour la mauvaise manip, il fallait bien sûr comprendre > au lieu de gt;

        - Merci d'utiliser ce commentaire pour me punir mais pas celui du dessus qui est quand même pertinent, non ? -
        /o\
  • # "une très bonne analyse"?

    Posté par  . Évalué à 3.

    En fait je suis pas du tout d'accord avec l'approche de l'article:

    "As you read this article, think of the following:
    Which format is more understandable?"

    Je pense que la vrai question est: quel est le plus facilement manipulable/modifiable/traitable de façon automatique.

    On devrait même aller plus loin, prendre des use case réel et les appliquer, histoire de voir qui s'en sort le mieux. Par exemple: extraire le texte brut du document, en vue de l'indexer, modifier toutes les images d'un document, rajouter un entête et un pied de page standard à une série de document, purifier (enlever révision, commentaire,...) une série de documents, etc...).

    Cela ne veut pas dire que la conclusion est mauvaise, mais je pense qu'elle serait légèrement différente, dans certains cas un format sera meilleurs que l'autre.

    "Which format reuses existing standards? "

    Dans ce cas ci, je ne pense pas que l'utilisation de "standard" soit pertinente, le point important est la learning curve nécessaire pour arriver à maitriser le minimum requis pour effectuer la tâche.

    Cela n'enlève pas le fait qu'utiliser un "vrai standard" à pein d'avantage, mais je ne pense pas que l'aspect temps d'aprentissage soit le plus important.

    Enfin concernant les standard, il semble que microsoft veuille standardiser son format ( http://www.google.com/search?sourceid=ie7&rls=com.micros(...) ). Un pas dans la bonne direction?
    • [^] # Re: "une très bonne analyse"?

      Posté par  (site web personnel) . Évalué à 10.

      Autant je suis d'accord avec toi sur le premier point, autant sur le second je suis en désacord: le choix des standards existants est important car c'est lui qui garantit l'intéropérabilité entre outils différents et permet à ce que chacun parte d'un pot commun.
      En reinventant la roue, Microsoft ne fait que continuer sa stratégie de toujours :
      - adopte le, modifie le, tue le.
      - enfermer les utilisateurs dans le monde Microsoft (qui est assez étendu) de façon à ce que pour eux l'informatique soit synonyme de Microsoft.
      En reinvantant des choses à sa façon, il complexifie le paysage informatique en imposant, de par son monopole, à ce que les autres s'alignent sur ses technologies sans pour autant leur donner les moyens de le faire facilement.

      Sinon :
      - Microsoft standardise ses formats XML MS-Office au sein de l'ECMA.
      => permettre que ses outils puissent être utilisés dans les administrations qui recherchent ou imposent l'utilisation de standards (et non un "standard de fait" qui n'est qu'un mauvais jeu de mots pour blouser les gens)

      - Microsoft a déposé des brevets autour de ses formats XML MS-Office
      => empêcher que toute concurrence puisse lire/écrire dans son format

      Conséquence : garantir son monopole et tuer ou enfermer à jamais dans des niches ses concurrents.
      • [^] # Re: "une très bonne analyse"?

        Posté par  . Évalué à 1.

        "le choix des standards existants est important car c'est lui qui garantit l'intéropérabilité entre outils différents et permet à ce que chacun parte d'un pot commun."

        Je suis complètement d'accord avec toi, je pense que je me suis mal exprimé, ce que je critique ce n'est pas le fait de réaffirmer qu'utiliser un standard c'est bien©®.

        (argument tordu: d'un autre côté si le format Office devient un standard... mais bon ça c'est le débat/troll sur l'évolution des standards...)

        Ce que je mets en question par contre c'est l'argumentation lié au standard:

        "Reusing existing standards allows the programmer to reuse her existing skills and her existing tools. Also, existing standards are well tested and mature. We know that they work."

        Là j'accroche moins, certains standard, bien que "standard" sont obscur voir mal foutu. Il se peut aussi qu'il ne correspondent pas à 100% au besoin. Et en pratique, ce même argument est souvent adopté contre un standard: passer à un vrai standard requiert parfois un aprentissage... alors pq ne pas rester avec l'existant?

        J'ai l'impression que tout l'article se concentre sur 2 choses: trouver des défauts de standard dans le format MS (et ça vous surprend vous? :p) et argumenter sur l'idée que subjectivement le format de ms est moins "facile à comprendre/apprendre".

        Par contre il est clair, que si un standard existe et qu'il correspond, il vaudrait mieux l'utiliser (et ne pas le modifier à sa sauce) et on sait tous que microsoft n'est pas forcément le premier à cohabiter avec des standard...

        Cependant, dans ce cas précis particulier, on peut se poser des questions sur le "pourquoi ils font ça"... en dehors de l'aspect "c'est mieux ou moins bien" (amha on aura la réponse dans quelques années), les xlink d'open office sont en effet des références externes. Les "liens" d'office 12 sont plus des pointeurs vers des références... le concept n'est donc pas le même, même si le but (référencer qqch) est le même... Je serai par exemple curieux de savoir (et les exemples actuels ne me permettent pas d'en être sûr...) comment office 12 se comporte avec 120 liens pointant vers la même ressource.

        On pourrait imaginer dans ce cas un summary.xml contenant un seul ID pointant effectivement vers la resource. Le développeur aurait alors très facilement la possibilité de changer ce lien pour autre chose, son document resterait cohérent. Si Office 12 ne fait pas cela proprement, on aurait alors 120 ID pointant vers le même lien, mais à nouveau, un seul fichier à modifier. Par contre si la ressource est référencée directement, il faudra aller la chercher partout et faire les remplacement qui vont bien (et ça ce n'est pas forcément trivial, il faudrait sans doute interprété le fichier xml pour vérifier que c'est bien une référence que l'on change et pas le contenu...).

        Tant que j'y suis, la licence des formats XML d'office semble avoir changé récemment: http://blogs.msdn.com/brian_jones/archive/2005/11/22/495876.(...)
        • [^] # Re: "une très bonne analyse"?

          Posté par  . Évalué à 5.

          Tant que j'y suis, la licence des formats XML d'office semble avoir changé récemment

          voici la partie interressante :
          There is no longer really a license that people need to sign up for in any way – You don’t need to sign anything or even reference anything. You are free to use our formats as much as you want and you don’t need to make any mention or reference to Microsoft. You can implement these formats so that you can both read and write the formats with your technology, code, solution, etc. In other words we will not sue people for using the formats even if it is competitive software.


          ca me semble clair, merci microsoft. (d'aucuns diront que c'est normal, mais merci quand même)
          • [^] # Re: "une très bonne analyse"?

            Posté par  . Évalué à 1.

            Malgré tout, tu sais quoi ? Je crois que je ne vais pas prendre le risque :-)
            • [^] # Re: "une très bonne analyse"?

              Posté par  . Évalué à 1.

              Le libre, c'est (souvent) gratuit, et ca marche?
              Malgre tout, tu sais quoi? Je crois que je ne vais pas prendre le risque. :-°
              • [^] # Re: "une très bonne analyse"?

                Posté par  . Évalué à 4.

                Je ne vois pas le rapport. Il est écrit : « On ne fera pas de procès [aux gens qui utilisent nos formats] même si c'est dans des logiciels concurrents ».

                Mon problème est que 1) effectivement c'est normal, 2) rien ne les empêche de changer d'avis par la suite, comme il l'ont fait avec FAT en leur temps. Tant techniquement que juridiquement, un format Microsoft ne sera jamais perenne que pour eux-mêmes.

                Cela ne veut pas dire que je n'écrirai pas de logiciel reconnaissant ces formats à un moment donné, mais jamais je ne m'appuierai sur ceux-ci pour la sauvegarde de données critiques ou pour l'échange d'informations officielles.
                • [^] # Re: "une très bonne analyse"?

                  Posté par  . Évalué à 2.

                  Dès le départ il leur suffit d'intégrer aux documents gérés par leurs logiciels un objet non couvert par le format de doc (je sais pas moi un truc comme une signature numérique là pour 'assurer' la sécurité des documents d'une entreprise, c'est à la mode la sécurité, ou même un logo tridimensionnel de l'entreprise au format wmv tant qu'on y est).
                  Et ensuite à chaque fois que quelqu'un ouvre un document n'incluant pas de signature (donc généré par un logiciel tier) il te braille un truc du genre : "Ce document a été généré sur un système non sécurisé, êtes vous sur de vouloir l'ouvrir ?". Ca refroidira vite...
                  Pour des raisons de sécurité, drm, tout ça quoi, ils peuvent te crypter leur super format ouvert...

                  Sans compter les 'bugs' d'interprétation du format qu'il faudra repérer et reproduire.

                  Bref, pas confiance moi.
                  • [^] # Re: "une très bonne analyse"?

                    Posté par  . Évalué à 2.

                    Oui, c'est vrai, mais mon post faisait justement référence au droit de l'ouvrir. C'est ce qui s'est passé avec le format GIF, également. Unisys l'a laissé se populariser jusqu'à ce qu'il devienne incontournable (GIF animé, absence du PNG à l'époque) puis a déclaré : « au fait, là, toutes ces jolies petites images qui émaillent le web, ben vous savez quoi ? Vous n'avez pas le droit de les utiliser ! :-) ».

                    Aujourd'hui tous les navigateurs web reconnaissent toujours le GIF (d'autant plus que le brevet est caduque) mais tout le monde a quand même compris l'utilité d'un standard ouvert.

                    Donc, pour en revenir à mon premier message, ce n'est pas là faire le procès de Microsoft, c'est même une très bonne chose qu'ils choisissent d'ouvrir leurs formats, c'est juste que je trouve qu'il reste trop risqué et prématuré d'architecturer tout un système autour de ces formats simplement à cause de cette annonce.
  • # Ce n'est pas un standard mais une norme...

    Posté par  . Évalué à 8.

    Voilà c'était mon coup de gueule, juste comme ça.
    Quand on lit standard en anglais, il s'agit de norme en français, l'ECMA n'est pas un organisme de standardisation mais normalisation.
    Merci de votre lecture
    • [^] # Re: Ce n'est pas un standard mais une norme...

      Posté par  . Évalué à 1.

      Il y a quelque chose que je ne comprend pas ...

      Si on en croie la page de wikipedia (http://fr.wikipedia.org/wiki/Standard_industriel) :
      une norme est édictée par un organisme officiel de normalisation (exemple AFNOR, ISO);
      un standard est édicté par une entreprise privé (genre, ecma, justement, ou microsoft); Exemple, le format Word.

      A moins que je n'ai pas compris le coup de gueule, ca me semble plustôt être l'inverse, non ?

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.