Journal Le PDF/A et l'open source

Posté par .
Tags : aucun
1
24
sept.
2009
Mon bon journal, je sollicite encore une fois ton aide.

Pour les ceusses qui ne connaissent pas le PDF/A est un standard (une norme ISO en gros) qui apporte un ensemble de restriction sur le format PDF (1.4 pour le moment) afin d'assurer une restitution de l'information contenue dans le document sur une longue période de temps.

Je cherche donc une implémentation open source d'un validateur PDF/A. Je n'ai pour le moment mis la main que sur jhove, avec son module pdf-hul [1]. Ca a l'air de fonctionner pas mal, mais de l'aveu de l'auteur, la validation n'est pas complète et le modèle de jhove 1 ne permettra pas de faire toutes les validations demandées par la norme.

Le site du PDF/A competence center [2] ne m'aura pas été d'une grande aide.

Donc mon bon journal, si tu connais des gens qui auraient une solution à mon problème ou simplement qui se seraient posés la même question, je t'en supplie présente les moi.

[1] http://hul.harvard.edu/jhove/pdf-hul.html

[2] http://pdfa.org
  • # L'ISO

    Posté par (page perso) . Évalué à 4.

    L'ISO a tellement honte de ses normes qu'elles ne sont pas publiques... À près de 80 € la norme PDF/A-1 ça doit refroidir plus d'un développeur ! :-(
    • [^] # Re: L'ISO

      Posté par . Évalué à 4.

      Je doute que ce soit vraiiiiiment la bonne conclusion.
      Les docs SMPTE, par exemple, sont payantes. Pourtant ce sont des normes bien gaulées.
      • [^] # Re: L'ISO

        Posté par (page perso) . Évalué à 2.

        Je suis d'accord, mais je ne comprends pas pour autant pourquoi elles ne sont pas accessibles en libre accès. À moins que leur vente rapporte vraiment beaucoup ?

        Ça me semble être un tel frein à leur adoption...
        • [^] # Re: L'ISO

          Posté par . Évalué à 2.

          Je suis d'accord sur le fait que c'est un frein à l'adoption !

          Eux se réfugie derrière l'argument classique : l'indépendance n'est pas gratuite :-)

          Trouvé dans la FAQ sur le site de l'ISO ( http://www.iso.org/ )

          Why aren't ISO standards free?
          ISO standards cost money to develop, publish and distribute. Someone has to pay. The current system whereby users are requested to pay for the standards they use, not only sustains the development process but also, very importantly, ensures that the balance of independent vs. government, private vs. public interests can be maintained.
          • [^] # Re: L'ISO

            Posté par . Évalué à 3.

            Je réagit sur "réfugie".

            Moi je trouve que c'est un bon argument que celui de l'indépendance.1
            Et puis 80€, comme ça, ça me parait un prix raisonnable au vu des objectifs de PDF/A (surtout l'aspect préservation dans le temps).
            • [^] # Re: L'ISO

              Posté par . Évalué à 2.

              Je ne suis pas sûr qu'une grosse institution comme l'ISO réussisse à s'auto-financer rien qu'en vendant des exemplaires de leurs normes... Qui ici a déjà acheté une norme ISO ?
              (mais je ne demande qu'à être convaincu, hein)
  • # C'est quoi au juste, PDF/A

    Posté par (page perso) . Évalué à 1.

    le PDF/A […] apporte un ensemble de restriction sur le format PDF afin d'assurer une restitution de l'information contenue dans le document sur une longue période de temps

    Quelqu'un comprend ce que ça veut dire ? C'est du PDF fait pour être lent à lire ? Du PDF stérilisé à ultra haute température pour se conservé longtemps ?
    • [^] # Re: C'est quoi au juste, PDF/A

      Posté par (page perso) . Évalué à 1.

      pour se conservé longtemps

      Argh. Se conserver.
    • [^] # Re: C'est quoi au juste, PDF/A

      Posté par . Évalué à 2.

      En gros les polices sont systématiquement incorporées dans le PDF plutôt qu'optionnellement, assurant que le rendu reste le même dans le temps, même si les polices ne sont plus disponibles sur l'ordi (ça peut arriver même pour les core fonts : http://en.wikipedia.org/wiki/Core_fonts_for_the_Web )

      Les restrictions visent à maintenir le rendu indépendamment des ressources disponibles sur l'ordi (en dehors du lecteur PDF).
    • [^] # Re: C'est quoi au juste, PDF/A

      Posté par . Évalué à 2.

      Garantir la préservation dans le temps c'est garantir que dans 20 on saura toujours lire le fichier (jusque là je pense que tout le monde à suivi).
      Là ou ça devient subtile, c'est que les personnes qui se posent des questions sur 20 ou 30 ans on vachement les boules de ne plus pouvoir lire leur documents dans 30 ans. Il y en a même qui sont capables de garder de côté tout un ensemble de machines d'époque au cas ou...

      Pour calmer ces peurs j'aurais tendance à dire que il suffit d'utiliser des logiciels libres. Mais cela ne semble pas suffire pour certains utilisateurs de GED. Ils ont peur et le fait d'avoir les sources ne suffit pas. Il faut aussi les avoirs dans 30 ans.

      C'est là qu'interviennent les organismes de normes (genre ISO) ce sont des organismes solides (en tout cas on l'assume) et on imagine qu'il seront là dans 30 ans. S'ils sont là dans 30 ans alors il sera toujours possible de récupérer chez eux, la norme et de la réimplémenter.

      C'est toutefois une opération hasardeuse (réimplémenter une norme vielle de 30 ans) du coup on maximise les chances de réussites de la réimplémentation en ayant une norme simple.
      Conséquence, PDF/A enlève tout le kikoololisme de PDF et voilà !

      La réimplémentation de la norme est évidemment un pire cas (i.e. il n'existe plus aucun éditeur qui maintiennent les accès à ce type de fichiers).
  • # PDF/A et PDF 1.7

    Posté par . Évalué à 3.

    Je n'ai jamais compris l'intérêt d'avoir deux versions normalisé par l'ISO du PDF: le PDF/A et le PDF 1.7 sachant que le PDF 1.7 est une version améliorée du PDF 1.4 sur lequel se base le PDF/A.

Suivre le flux des commentaires

Note : les commentaires appartiennent à ceux qui les ont postés. Nous n'en sommes pas responsables.