Journal Une comparaison des différents formats de document texte

Posté par  (site web personnel) .
Étiquettes : aucune
0
23
déc.
2004
Bonjour (re-bonjour même)

Je viens de lire un rapport qui tente de résumer les différents format de documents (LaTeX, DocBook, PDF, MS Office, OOo, etc.) texte existant, il se trouve par ici :

http://europa.eu.int/ida/servlets/Doc?id=17982(...)

Les critères de comparaison sont nombreux (interopérabilité, XML, DRM), et seuls quelques formats parviennent à remplir ces critères (à noter que les autres formats ne sont pas exclu et leur utilisation dans un domaine particulier est expliqué).

A l'arrivée, seuls restent les formats de Office 2003 et OOo. L'étude ne tombe pas dans une conclusion hâtive visant à prononcer un vainqueur et fini par avancer les qualités de chacun amenant sûrement à une co-existance des 2 formats dans le futur, le format de OOo étant cependant le format le référence en matière d'interopérabilité.

Voilà un bref résumé d'un rapport que j'ai trouvé intéressant et résumant bien la situation. J'en conseille la lecture à tout ceux qui ne sont pas rebutés par l'anglais :)
  • # Commanditaire

    Posté par  . Évalué à 8.

    Il est utile de préciser que ce rapport a été demandé par la commission européenne.
    • [^] # Re: Commanditaire

      Posté par  (site web personnel) . Évalué à 5.

      D'ailleur MS a l'air décidé à lécher les bottes de la commission comme le montre très bien cette lettre ouverte sur l'interopérabilité des formats de MS Office :
      http://www.microsoft.com/office/xml/response.mspx(...)
      • [^] # Et tant qu'à faire ...

        Posté par  . Évalué à 2.

        On va ajouter l'ensemble des liens liés à ce document (qui a été suivi d'autres) :

        http://europa.eu.int/ida/en/document/3439/5585(...)

        M
      • [^] # Re: Commanditaire

        Posté par  . Évalué à 3.

        Je me pose une question qui doit être relativement bête mais si les formats de microsoft sont maintenant standartisé et connu, alors comment ils vont survivre ?
        En effet, MS Office est une des principales voir la principale source de revenu de microsoft. De plus, elle a un énorme avantage qui est celui de ne tourner principalement que sous windows (il y'a bien mac OS X mais c'est un marché un peu spécial à mon gout). C'est donc un des logiciels qui fait que les gens ne migrent pas et restent sous windows.
        Mais si maintenant, OO.o peut lire dans de bonnes conditions ce format pourquoi est ce que les gens continueraient à payer une licence. Bien sur, OO.o ne remplit pas toutes les fonctions de MS office, mais à plus ou moins long terme il le fera. Et à ce moment la quid de la situation ?
        • [^] # Re: Commanditaire

          Posté par  (site web personnel) . Évalué à 7.

          Ben je suppose que leur vision est la suivante : on s'arrange pour que notre format devienne le standard, c'est toujours mieux d'avoir une longueur d'avance sur un standard que de se retrouver avec un autre standard que nos concurrents maîtrise et pas nous...

          mais à plus ou moins long terme il le fera.
          Comme indiqué dans le document il y a certaines parties que OOo aura bien du mal à utiliser, commes les composants OLE et autres trucs windowziens exclusivement.

          MS est pour le moment sûr d'avoir une longueur d'avance sur OOo niveaux fonctionnalités et puissance (ils jugent OOo au niveau de Office 97), donc pour eux il est pour le moment plus utile d'étendre leur techno plutôt que de voir le concurrent OOo imposer son standard (et une plus large adoption)
          • [^] # Re: Commanditaire

            Posté par  . Évalué à 0.

            Sans oublier qu'il y a a ce jour plus de logiciels qui lisent (plus ou moins bien) le format de MS Office que de OpenOffice.

            Si on critique MS Office a se restreindre a Windows, OpenOffice se restreint a Linux sur les plateformes ia32, ppc, s390 et sparc.

            De plus si je ne me trompe pas, seul OpenOffice peut lire son propre format. Le format est bien ouvert mais je ne connais pas a ce jour d'applications equivalentes capable de lire OpenOffice.

            Par contre on trouve OpenOffice, abiword and probablement d'autre applis capable de lire des documents MS Office pas trop complexe.

            Etant utilisateur de Linux sur une plateforme que je n'ai pas cite plus haut, je me vois contraint de demander du .doc

            Et je ne suis pas sur d'etre le seul dans ce cas (On peut ajouter ceux qui trouvent que OpenOffice est beaucoup trop gros).

            Si, de ce fait, le format MS Office assure sa perennite, je ne suis pas certain que l'adoption de OpenOffice soit aussi rapide qu'on le souhaite (meme si Format de Fichier != Application).
        • [^] # Re: Commanditaire

          Posté par  . Évalué à 5.

          Je me pose une question qui doit être relativement bête mais si les formats de microsoft sont maintenant standartisé et connu, alors comment ils vont survivre ?

          Il s'agit des futurs nouveaux formats XML dans MSOffice 2003.
          Pour une raison de compatbilité, les gens enregistreront par défaut en .doc binaire, ne serait-ce que pour pouvoir travailler avec des gens qui n'ont pas MSO 2003.
          Ce type de stratégie permet à MS de ne pas être exclu a priori des futurs appels d'offre publics pour cause de "format non ouvert".
          • [^] # Re: Commanditaire

            Posté par  (site web personnel) . Évalué à 2.

            Futurs ??
          • [^] # Re: Commanditaire

            Posté par  . Évalué à 2.

            [tapez pas trop fort, merci]

            Il me semble avoir lu (mais bon, c'est parce que c'est écrit que c'est plus fiable, surtout quand on a plus les sources) que le contenu des balises XML de MS pouvait être du binaire. Cela peut se comprendre pour des images incluses p.ex., mais je crois qu'il était aussi question de permettre du vieux_format_doc_tout_pourri dans les balises (inclusion par copier-coller d'un vieux .doc ?).

            Quelqu'un peut confirmer/infirmer ?

            Si c'est faux : tant mieux.
            Sinon... hmm, j'attends confirmation (trêve de Noël :o).
            • [^] # Re: Commanditaire

              Posté par  (site web personnel) . Évalué à 2.

              Dans la pratique ça donne que la plupart des balises ne sont pas du binaire mais qu'il en reste.
              Dans la déclaration officielle que j'ai cité plus haut, on peut lire :
              "Non-XML elements: Microsoft agrees with the recommendations regarding non-XML formatted elements and will vigorously pursue the work of documenting those elements in XML as we pursue our current work on the next major release of Office."
              • [^] # Re: Commanditaire

                Posté par  . Évalué à 2.

                Oui, mais as-tu quelques exemples de ces éléments non encore XML ?

                Je cromprends qu'on puisse vouloir inclure directement les images (encodées en base64, p.ex.) plutôt que de traîner les fichiers associés (comme OO), mais si ces éléments correspondent à d'autres types, ça craint le pâté.

                < gros troll velu d'hiver >
                Ou alors, les spécs du format .doc, c'est comme pour les sources de windows, ils en ont perdu des bouts...
            • [^] # Re: Commanditaire

              Posté par  (site web personnel) . Évalué à 4.

              je confirme, les objets autres que le texte sont inclus dans le XML sous forme binaire coupee tout les (genre) 80 caracteres.
              Une vraie boucherie.
              Renommez un fichier oo en .tgz et ouvrez le avec votre decompacteur favori, vous verrez que c'est quand meme plus propre :)
              • [^] # Re: Commanditaire

                Posté par  (site web personnel) . Évalué à 1.

                > Une vraie boucherie.

                Pourquoi ?

                Le but des formats XML de MS est de pouvoir utiliser directement les outils de manipulation de XML dessus. L'approche tout-en-un-fichier me parait plutôt pas mauvaise dans ce contexte.

                Maintenant, c'est vrai que pour quelqu'un comme moi qui parle pas trop le XML et le XSLT, et qui veut juste récupérer une image dans un document, c'est moins pratique ...

                > Renommez un fichier oo en .tgz

                .zip plutôt.
                • [^] # Re: Commanditaire

                  Posté par  (site web personnel, Mastodon) . Évalué à 3.

                  L'approche tout-en-un-fichier me parait plutôt pas mauvaise dans ce contexte.
                  Sauf si tu veux y aller à la main.

                  En effet, avec SWX tu peut facilement récupérer une image, avec un simple dézippeur. Alors qu'avec de la base64, pour peu qu'ils utilisent arbitrairement du big ou litten endian ;)...

                  Au fait, avoir une collection de fichiers balisé, avec en lien des images, du sons, et d'autres documents, ça a fait fureur il y a quelques années. Et on peut facilement naviguer à travers les documents grâce à des hyperliens...
  • # date

    Posté par  (site web personnel) . Évalué à 5.

    Il me parait important de noter que le rapport date de 2003 tout de même. Ca se voit dès le résumé d'introduction où il est dit que le format OOo serait probablement adopté dès la première moitié de l'année 2004.
    • [^] # Re: date

      Posté par  (site web personnel) . Évalué à 3.

      Tu as la date dans la référence sur la deuxième page : 30 décembre 2003, la preuve que même en periode de noël il y a des gens qui bossent...

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.