Encore un argument de poids pour les formats ouverts

Posté par  (site web personnel) . Modéré par Nÿco.
Étiquettes : aucune
0
18
juin
2003
Bureautique
Alors qu'encore aujourd'hui, le libre n'a pas la possibilité d'importer/exporter correctement depuis/vers les formats propriétaires classiques (doc, xls, ppt,...), des failles majeures apparaissent dans le format MS Word (.doc), comme le détaille un très intéressant article de Transfert (1er lien).

On y apprend notamment qu'Alcatel s'était fait avoir avec leurs speed touch home sans firewall par défaut (2nd lien), montrant ouvertement qu'ils n'en avait rien à faire de la sécurité des internautes. Tout cela découvert dans les zones invisible des .doc :)

Encore un argument de poids pour les formats ouverts ?

NdM : et contre les formats propriétaires, fermés et obscurs.

Aller plus loin

  • # Re: Encore un argument de poids pour les formats ouverts

    Posté par  . Évalué à 10.

    hmm..
    ca a ete developpé ya un moment dans un numero de MISC ca .. (tres bon magazine au passage) ..
  • # Re: Encore un argument de poids pour les formats ouverts

    Posté par  . Évalué à 0.

    Voici le message de transfert.net a mon egard :

    "
    Abonnez-vous

    Vous avez dépassé le nombre d'articles que vous pouvez lire gratuitement cette semaine.

    Les articles de Transfert.net sont librement accessibles... à condition de ne pas trop en abuser.

    Aussi, nous vous invitons à vous abonner (essai gratuit pendant 15 jours)... ou à repasser la semaine prochaine.
    "

    Transfert limite le nb de fois ou on peut consulter gratuitement leur nouvelles. Ca serait bien d'eviter de faire de la pub a des sites de news payants. C'est frustant pour les lecteurs de ne pas pouvoir acceder a l'information.
  • # Re: Encore un argument de poids pour les formats ouverts

    Posté par  . Évalué à 2.

    Le gros problème avec ces formats, c'est qu'ils sont devenus de facto des standards. Mes correspondants veulent du .doc, à la limite le rtf ça passe tant que la mise en page reste simplette.

    J'ai bien essayé d'envoyer du html, mais l'impression est... comment dire...

    Le pdf est pas libre, mais lisible partout, et permet de diffuser facilement des documents générés avec des applis libres.

    Quid de xml, depuis le temps qu'on nous dit que c'est l'avenir?
    • [^] # Re: Encore un argument de poids pour les formats ouverts

      Posté par  (site web personnel) . Évalué à 7.

      <?xml version="1.0" encoding="iso-8859-1"?>
      <réponse>
      le XML n'est pas un format de données, c'est un format de format. Cette réponse est du XML parfaitement valide, mais ça ne va pas te servir à grand chose. Il te faut un format basé sur XML pour l'exploiter.
      </réponse>
      • [^] # Re: Encore un argument de poids pour les formats ouverts

        Posté par  (site web personnel, Mastodon) . Évalué à 3.

        avec un petit coup de XSLT sans doute.



        Sinon, j'ai envoyé cette new à la personne qui s'occupe d'envoyer les devis chez nous et le resultat est au dela de mes esperances: ça a fait tilt dans sa tête. Enfin !

        Dorénavant, il enverra les documents en pdf (oui pas libre etc mais à défaut de mieux ...)
        • [^] # Re: Encore un argument de poids pour les formats ouverts

          Posté par  (site web personnel) . Évalué à 1.

          > Sinon, j'ai envoyé cette new à la personne qui s'occupe d'envoyer les devis chez nous et le resultat est au dela de mes esperances: ça a fait tilt dans sa tête. Enfin !

          Hé, faut arreter de bosser là, il est tard !! Tu serais en train de nous raconter un petit bobard ?
          En plus c'est pas a cette heure-ci que tes clients vont le lire ton devis !
        • [^] # Re: Encore un argument de poids pour les formats ouverts

          Posté par  (site web personnel) . Évalué à 2.

          >avec un petit coup de XSLT sans doute.
          Sauf que pour faire du XSLT correctement, tu dois connaitre le format du document, ce que XML seul ne spécifie pas. Pour cela, il te faut une dtd, un schema, ou tout autre moyen qui détermine un langage basé sur XML.

          Connaitre l'alphabet latin ne te permet pas de lire le finlandais ou le basque que je sache. C'est pareil ici.
          • [^] # Re: Encore un argument de poids pour les formats ouverts

            Posté par  (Mastodon) . Évalué à 3.

            Utiliser XML :
            . DocBook (http://www.oasis-open.org/docbook/xml/(...)) avec l'éditeur XML Mind, par exemple (ouais, je sais, cai pas libre : donnez moi d'autres références si si en connaissez, je n'ai pas pris le temps d'aller plus loin).

            . Simplified DocBook (http://www.oasis-open.org/docbook/xml/simple/(...)) moins énorme et plus accessible

            . Forrest : environnement Apache de publication (y compris génération des PDF) : http://xml.apache.org/forrest/(...)

            Pour tos ces formats existent des outils de rendu (HTML, PDF etc.) des documents créés
            • [^] # Re: Encore un argument de poids pour les formats ouverts

              Posté par  . Évalué à 2.

              La cible des deux outils n'est pas du tout la meme. Ecrire une doc/livre de 200 pages est une horreur avec une suite bureautique alors que docbook est la pour ca. Faire son CV ou un note rapide est une horreur avec s/docbook/SGML/ avec que c'est un "plaisir" avec une suite bureautique. Les deux outils coexiserons amha. Par exemple va definir ton propre rendu dans docbook, j'espere que tu as 3/4 mois avant de publier ton documement :-))) Docbook n'est pas la reponse ultime a toute les questions, il faut savoir choisir ses technos judicieusement. Pour simplified docbook je connaissais pas, je bosse avec le "FreeBSD Docbook" c'est a dire la DTD Docbook modifie pour le besoin du projet de Documentation FreeBSD.
        • [^] # Re: Encore un argument de poids pour les formats ouverts

          Posté par  . Évalué à 0.

          XSLT non plus ne te sert à rien si au final tu n'as pas un format de représentation grapique de tes données: HTML, FOO, Format open office et même RTP ou formats offices.
    • [^] # Re: Encore un argument de poids pour les formats ouverts

      Posté par  . Évalué à 3.

      Pour le PDF, le débat reste ouvert, mais ses spécifications sont disponibles pour quiconque se donne la peine de retrouver le lien (que je n'ai plus, mais ca se trouve très facilement). Son seul défaut est d'être (pour autant que je saches) criblé de brevets.

      Pour communiquer un document devant être lu sur écran et/ou imprimé, mais n'ayant pas de raison d'être modifié, le PDF restera mon choix numéro un (en attendant mieux, cela dit).
      • [^] # Re: Encore un argument de poids pour les formats ouverts

        Posté par  (site web personnel) . Évalué à 3.

        Adobe respecte les spécifications qu'il publie (postscript, pdf, ...)
        Microsoft ne respecte pas les spécifications qu'il publie (rtf, doc,...)

        C'est toute la différence !
      • [^] # Re: Encore un argument de poids pour les formats ouverts

        Posté par  (site web personnel) . Évalué à 1.

        > ses spécifications sont disponibles pour quiconque se donne la peine de retrouver le lien

        Essaye d'ouvrir un pdf crypté avec xpdf et regarde le message d'erreur. En gros, ça dit :

        "Aille, celui-la, j'ai pas le droit de l'ouvrir. Désolé :-("
        • [^] # Re: Encore un argument de poids pour les formats ouverts

          Posté par  . Évalué à 1.

          Essaye d'ouvrir un pdf crypté avec xpdf et regarde le message d'erreur. En gros, ça dit : "Aille, celui-la, j'ai pas le droit de l'ouvrir. Désolé :-(" Ca n'empêche pas le format d'être ouvert (ou documenté). C'est bien parce qu'il est ouvert qu'on a pu écrire xpdf. Par ailleurs, on peut patcher xpdf pour qu'il n'honore pas certains bits de protection, comme l'impossibilité de copier/coller ou d'imprimer. Je m'en suis servi récemment pour imprimer un PDF qui était protégé de partout (entre nous, quel intérêt d'avoir un document PDF non imprimable ?). Je ne sais plus si on peut dans la foulée décrypter un PDF chiffré.
  • # Re: Encore un argument de poids pour les formats ouverts

    Posté par  . Évalué à 10.

    Je confirme la facilité de ces fuites...

    Je me souviens d'avoir reçu mon contrat de travail par mail en .doc, avant de l'avoir en version papier. Comme évidemment j'avais rien pour lire ça à l'époque, j'avais fait un bete "strings" dessus... ça m'a sorti les nom, adresse, numero de Secu et salaire d'un autre employé, restes de la version précédente avant modification pour mon cas personnel.
  • # Re: Encore un argument de poids pour les formats ouverts

    Posté par  . Évalué à 4.

    Mouais mais non, concernant alcatel, le "bug" est surtout que si on publie un document contenant des révisions (une fonctionnalité TRES pratique quand on bosse en équipe) sans approuver toutes les révisions avant la publication, n'importe quel lecteur à la possibiltié d'approuver ou réprouver les révisions (et donc de revenir en arrière). Ce ne sont pas des "zones invisibles du doc", ce sont des zones visibles si l'on révise le document. La leçon est amha plus qu'il faut apprendre à utiliser son usine à gaz...

    Je ne discute pas le fait que ce soit mal de publier des documents au format Word, mais en faire un bug... c'est ptêt un peu abusif... (le reste de l'article l'est aussi, les macros dans word, bien qu'un non sens, ne sont plus exécutées par défaut depuis longtemps, et il n'y a plus de GUID dans les documents Word... je ne nie pas que ça a existé, et que ça pose problème pour les gens utilisant encore de vieille version, mais revenir sans cesse dessus est peut-être aussi abusif...).

    j'ajouterais que "format ouvert" ne signifie pas que ce soit facile de faire de l'import/export, par exemple, le RTF est spécifié (et même mis à jour), ça n'en fait pas un format simple à lire et surtout à afficher correctement (c'est même globalement assez pourri). Si on prend simplement l'HTML un format ouvert par excellence, il est déjà difficile de le parser correctement (existe-t-il un seul browser qui le fait totalement correctement?), avec les formats conçus "autour d'une application" et non dans un but d'ouverture, on peut alors imaginer que c'est nettement pire. (et c'est le cas pour beaucoup d'application libre, et évidemment encore plus pour les applications non libre/closed source).

    Je trouve cela dommage que l'on cache parfois le problème des format par leur "ouverture"... un format pourri, mais ouvert, restera un format pourri... et c'est encore pire: un format théoriquement parfait, ouvert, simple, clair, non ambigu, sera parfois désastreux dans la pratique (en terme de performance par exemple).
    • [^] # Re: Encore un argument de poids pour les formats ouverts

      Posté par  (site web personnel) . Évalué à 1.

      > Mouais mais non, concernant alcatel, le "bug" est surtout que si on publie un document contenant des révisions

      Tout à fait. D'ailleurs, OOo fait ça aussi en version 1.1beta.

      Par contre, le truc gênant, c'est que souvent, c'est activé par défaut et l'utilisateur lambda ne le sait pas.
    • [^] # Re: Encore un argument de poids pour les formats ouverts

      Posté par  . Évalué à 1.

      Je trouve cela dommage que l'on cache parfois le problème des format par leur "ouverture"... un format pourri, mais ouvert, restera un format pourri... et c'est encore pire: un format théoriquement parfait, ouvert, simple, clair, non ambigu, sera parfois désastreux dans la pratique (en terme de performance par exemple).

      Peux-tu donner des exemples concrets de ce que tu avances stp? Parce que là, ça s'apparente plutôt à du FUD pur et simple, quelque soit la position prise d'ailleurs.
      Ici, en l'occurence, tu dis que le fait d'avoir un format ouvert ne garantie aucunement d'obtenir un meilleur résultat qu'avec un format propriétaire et qu'on peut même obtenir un résultat pire, tout celà sans donner le moindre exemple confirmant tes dires.
      • [^] # Re: Encore un argument de poids pour les formats ouverts

        Posté par  . Évalué à 1.

        Peux-tu donner des exemples concrets de ce que tu avances stp? parce que là, ça s'apparente plutôt à du FUD pur et simple, quelque soit la position prise d'ailleurs.

        Prends simplement le RTF (qui est complètement spécifié et mis-à-jour), j'ai tenté de l'implémenter: et ben c'est la merde, pq? ils ont pris word, regarder comment il faisait leur bidouille et mapper leur truc dessus. Soyons plus précis les tables par exemples: elles sont mappés sur la gestion des tables de Word, t'as pas le choix, si ton application ne les gères pas de la même façon (c'tait mon cas), tu dois te taper la conversion. Voilà donc un format ouvert qui n'a pas été conçus pour cela, je ne doute pas que ça facilite la vie de word, et qu'il le parse mieux que quiconque...

        Pour les formats ouvert parfois désastreux à l'implémentation, regarde simplement tout les standard existant pas encore vraiment implémenter complètement (rien que du côté w3c y'en a déjà pas mal;-). Mais reprenons notre exemple des tables: le format d'une table HTML est simple, clair, relativement non ambigu... mais il souffre d'un défaut: il faut avoir toutes la table pour pouvoir commencer à la rendre (on peut bidouiller en commencant plus tôt, mais pas dans tous les cas... et ça rajoute des couches...), donc en pratique: le format est théoriquement beau, mais s'il forcait la spécification des tailles de colonnes, l'implémentation du parser serait à la fois plus simple et efficace... dans le cas de l'HTML nos machines sont assez puissantes, et les tables, en principe suffisemment petites pour que ça ne pose pas de problème, mais ça montre je trouve correctement le tradeoff "ouverture *réelle*"/"facilité rapidité de l'implémentation". Je pense que dans la pratique, ça doit être un mix: il doit exister des formats ouvert (et conçus dans un but d'ouverture) pour la publications de document (HTML, PDF, ...) et les formats qui vont bien avec les applications histoire d'avoir des applications plus performantes.

        Ceci dit, je ne dis pas que propriétaire est mieux, je dis simplement qu'il faut pas se leurrer "ouvert" ne veut pas dire que c'est toujours exploitable... tout comme open source ou libre ne veut pas forcément dire logiciel de qualité... Je tenais juste à souligner le fait que le problème des formats est plus complexe qu'avoir les spec, il faut encore savoir en faire quelques choses. La prochaine version d'Office pond des fichiers XML (en ayant regardé rapidement ça a l'air assez "correct", avec schema et ce qu'il faut, j'ai pas fouillé la question cependant), tu crois réellement que ça va permettre à la concurrence de lire parfaitement leur fichier? (la réponse est non pour ceux ayant déjà vu du XML office).
  • # Re: Encore un argument de poids pour les formats ouverts

    Posté par  . Évalué à 5.

    Allez je vais me faire l'avocat du diable, on ne diffuse pas de .doc alors :

    1/ C'est un documenent final, dans ce cas la le PDF peut faire l'affaire, le PS est mieux mais il n'y a pas de lecteur windows digne de ce nom et libre (a ma connaissance). Il y a aussi le HTML.

    Il s'agissait donc du cas "simple"

    2/ C'est un format non final, pour diverses raisons je souhaite que les gens a qui je transmet la doc puissent un jour la modifier.

    => SGML : super, je bosse qu'avec du SGML, mais ca va pas plaire a tout le monde !

    => .SWX : super on peut "revisioner" plein de truc mais si mes colaborateurs utilisent MS Office, Abiword, Koffice ou je ne sais quoi d'autre ?

    => Les autres offices... Pareil

    => .TXT tout le monde est content on est revenu 30 ans en arriere


    Il serait peut etre bon d'arreter de cracher systematiquement sur le .doc et peut etre aussi temps de commencer a faire quelque chose ! C'est bien joli de dire le .doc saismal, mais le libre ne fait pas mieux loin de la. Les differentes suites libres ne proposent aucuns export/import entre elles.

    Le logiciel est peut etre libre mais ca me fait bien rire.... Au final on repasse par le .doc avec les pertes de mise en page que ca entraine.

    note : Les faits enonces sont ceux que j'ai constate il y a quelques mois, maintenant cela a peut etre change, un standard XML (vous savez le super truc qui va changer le monde) devant etre mis en place. Après moi je taffe en SGML...
    • [^] # Re: Encore un argument de poids pour les formats ouverts

      Posté par  . Évalué à 2.

      sauf que le SGML, même si on aime ça, j'ai jamais trouvé d'éditeur win32 correct :-/
      donc de fait ça limite sec
    • [^] # Re: Encore un argument de poids pour les formats ouverts

      Posté par  . Évalué à 3.

      C'est un documenent final, dans ce cas la le PDF peut faire l'affaire, le PS est mieux mais il n'y a pas de lecteur windows digne de ce nom et libre (a ma connaissance).

      Je m'insurge violemment: dire que le PS est supérieur au PDF, du moins dans le cadre d'un échange de document (final) est complètement faux, du moins si l'on se base sur des outils libres de création/lecture de postscript (en gros: GhostScript). La qualité d'un .ps par rapport à un .pdf, que la génération soit faite via la chaîne d'outils *TeX ou autre, est désastreuse: tramages hideux tout partout, pas de possibilités d'hyperliens, et j'en passe.

      Donc "non", le PS n'est pas mieux, au moins techniquement. Sauf si on veut converser avec un matériel spécifiquement postscript, mais c'est un cas particulier et rare. Quand à savoir si le PS est "mieux" philosophiquement, j'aimerais qu'on me prouve que le PS n'est pas aussi criblé de brevets que le PDF, mais vu que les deux formats sortent de la même boite...
      • [^] # Re: Encore un argument de poids pour les formats ouverts

        Posté par  . Évalué à 6.

        J'argumente rapidement par ce que je vais me coucher :

        les PDFs (peut etre de mauvaise qualite certe) ne sont pas aussi portable que l'on croit. Je maintient un gros site de doc, pres du giga et demi de texte, et je peux te dire que des PDFs qui passent sous xpdf mais pas gv, souvent le contraire, et bien il y en a floppee. Pour le hyperliens, c'est un handicap certe mais j'avoue que j'ai rarement dix minutes devant moi pour attendre que cela s'affiche. Et me parait plus gadget dans le cadre de mon utilisation qu'un reel apport. Perdre 1 secondes a cliquer pour choisir ma page n'est rien quand on lis un rapport de 90 pages.

        Que l'on ne vienne par me parler d'Acrobat qui sans rien faire bouffe deja toute ma RAM.

        De plus ma critique n'est pas technique, pour tout dire je me fou royalement de comment le PDF/PS fonctionne, je me base sur les problemes que j'ai de relecture et sur le fait que c'est plus ou moins agreable a lire.

        Pour les brevets j'avoue que j'en sais absolument rien :-/

        Et je ma competence s'arrete au niveau des docs techniques.

        Et on arrive toujours au meme point, les PS/PDF sont des documents morts. Il faut enormement de volonter pour faire evoluer une doc dont on dispose seulement du PS.
        • [^] # Re: Encore un argument de poids pour les formats ouverts

          Posté par  (site web personnel) . Évalué à 1.

          ...les PDFs...
          Je crois bien qu'en français on ne met pas de "s" au pluriel des acronymes. C'est bon en anglais, mais pas par chez nous.
        • [^] # Re: Encore un argument de poids pour les formats ouverts

          Posté par  . Évalué à 5.

          Oui le PDF n'est pas si portable que ça, il y a mille et une façon de le générer et cela pose parfois des problèmes (je contrôle quotidiennement des tas de PDF destinés à l'imprimerie et ce n'est pas toujours une partie de plaisir). Les problèmes proviennent souvent non pas du PDF en lui même, mais des éléments qui le composent (par exemple des images Postscript non conformes).
          Mais le Postscript souffre des même défauts. De plus, son implémentation dans les imprimantes/flasheuses est parfois hasardeuse. Les imprimeurs/flasheurs se sont suffisament arrachés les cheveux sur Postscript et réclament maintenant massivement du PDF car il existe désormais des progiciels permettant de gérer les flux de production PDF de manière sécurisée, ce qui n'existait pas réellement il y a quelques années avec Postscript.
          L'intérêt principal de Postscript est que c'est du texte brut, et il est donc assez simple de le manipuler. Par contre, cela génère des fichiers énormes difficiles à manipuler et à échanger (pour un livre en couleur de quelques centaines de pages, cela peut représenter plusieurs gigaoctets).

          [Vous m'excuserez, cela dépasse largement le cadre de la bureautique...]

          le fait que c'est plus ou moins agreable a lire

          Cela est un problème de l'interpréteur, et non du format de fichier en lui-même. Et finalement, ces formats font de la « description de page », c'est-à-dire que c'est destiné à l'impression. Pour un affichage écran, le HTML (par ex.) me semble plus adapté.

          Et on arrive toujours au meme point, les PS/PDF sont des documents morts. Il faut enormement de volonter pour faire evoluer une doc dont on dispose seulement du PS.

          Ben oui, PDF et PS sont des formats de sortie, ce n'est pas fait pour être retravailler derrière.
          • [^] # Re: Encore un argument de poids pour les formats ouverts

            Posté par  . Évalué à 1.

            Ton truc et tres interessant, tes arguments se tiennent mais en fait on est un peu dans un cas a la "con", la bureautique. >Cela est un problème de l'interpréteur, et non du format de fichier en lui-même. Biens sur ! Mais si tu ne bosses pas dans l'imprimerie... Ce qui t'interesse c'est AUJOURD'HUI d'avoir de bon rendu, pour l'impression classique et sur ordi. On parle bien de diffusion a l'utilisateur final dans le cadre burautique. >Ben oui, PDF et PS sont des formats de sortie, ce n'est pas fait pour être retravailler derrière. On en reviend au meme probleme il n'existe aucun format bureautique digne de ce nom interoperable pour des documents evolues. Ce qui est bien domage
    • [^] # Re: Encore un argument de poids pour les formats ouverts

      Posté par  . Évalué à 2.

      Juste pour faire remarquer que le PS, ca s'imprime, et c'est tout. Et pour cela, meme sous windows, il y a un tres bon outil:
      http://www.cs.wisc.edu/~ghost/gsview/get44.htm(...)

      Concernant la news en elle meme, j'ai cru comprendre qu'il y avait moyen d'eliminer toutes les "choses caches" en faisant un simple "save as..."
      Je n'ai pas la possibilite de tester (J'ai pas office chez moi, donc forcement, ca va etre dur), mais j'essairais quand meme de voir ce qu'il en est rellement: Je trouve que le FUD contre Microsoft s'intensifie de jour en jour, alors que le monde open source n'est pas rose non plus.

      Que certains soient paranos quand il s'agit de logiciels proprietaire, admettons. Qu'on s'insurge contre les formats de documents lisible que part un seul logiciel (payant ou non), tout a fait d'accord.
      Par contre, c'est pas normal de parler de faille de securite pour un probleme, semble t il (pas verifie, je le repete), facile a resoudre (Il suffit d'avoir appris a utiliser le logiciel en question...).

      Il y a 2 ans, tout le monde a crie au scandale lors des FUD Microsoft contre le libre: Pourquoi ferait-on pareil maintenant?

      LoneWolf
    • [^] # Re: Encore un argument de poids pour les formats ouverts

      Posté par  (site web personnel) . Évalué à 2.

      J'ai lu que AbiWord et koffice vont switché vers le format OpenOffice:

      http://nashi.altmuehlnet.de/pipermail/scribus/2003-June/000934.html(...)

      J'arrive pas trouvé d'autre lien qui prouvent cette compatibilité! Qui pour ma part serais une tres tres bonne chose !
      Les formats ouverts oui ! Mais pas 15000 formats différents SVP !

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.