EPUB, format libre d'ebooks

Posté par (page perso) . Modéré par baud123.
12
16
juin
2009
Éducation
En ces temps troublés où nos responsables chargés de la "Culture" semblent plus passer leur temps à vouloir restreindre et brider cette culture qu'à la diffuser, et ayant d'autre part découvert récemment l'excellent site Feedbooks qui propose des textes libres de droits, je me suis intéressé d'un peu plus près aux ebooks.

Je vous propose d'examiner de plus près le format libre EPUB.

NdM : Cette dépêche est issue du journal de farvardin. Pour moi, ebooks signifiait avant tout "livres électroniques dans un format fermé avec si possible des DRM". Sans en avoir fait le tour dans le détail, j'imaginais bien chaque vendeur de lecteur électronique développer son format alakon, si possible incompatible avec les autres, et sortir une plateforme de téléchargement façon iThunes avec des livres vendus à prix d'or, que les lecteurs ne pourront peut-être pas relire d'ici quelques années. Le format fermé par excellence. Je n'étais pas si loin de la réalité au niveau des formats, comme en atteste cette page : http://en.wikipedia.org/wiki/Comparison_of_e-book_formats

D'autre part, pour moi les ebooks n'avaient pas forcément d'intérêt puisque un PDF ou un fichier HTML pourra faire tout aussi bien l'affaire.

Je vois néanmoins quelques problèmes avec les PDF ou le HTML :
  • Sur un ordinateur de bureau ces formats ne posent pas de problème particulier, par contre sur des petits ordinateurs (téléphone, tablette, lecteur électronique, embarqué), la place peut devenir un soucis, aussi la taille peut être optimisée en compressant les données (ce que n'a pas le html).
  • La taille d'écran ne permet pas forcément de gérer pleinement les marges imposées en html, ou le format souvent en A4 du pdf ;
  • Un bon rendu html ou pdf n'est pas toujours disponible sur l'embarqué. Le code html peut contenir des choses non désirées sur de l'embarqué (javascript) ;
  • Le pdf est optimisé pour l'impression, et pas toujours pour la lecture à l'écran ;
  • Les images en html ne se trouvent pas dans le fichier mais nécessitent de l'accompagner (pas pratique, sauf si on compresse le tout, ce qui ne sera pas lisible par un navigateur de base).

C'est alors que j'ai découvert le format EPUB [http://en.wikipedia.org/wiki/EPUB], un format ouvert et libre mis en avant par Feedbooks qui permet de stocker des livres électroniques sur des lecteurs embarqués ou sur son ordinateur. Ce format est géré par l'International Digital Publishing Forum (IDPF)
  • C'est du xml + css zippés, aussi cela peut contenir des images, une couverture, des méta-informations sur le document ;
  • Le livre est optimisé suivant l'affichage du lecteur. De plus le rendu est souvent plus agréable que du html ou du pdf ;
  • C'est lisible par l'excellent lecteur libre et multiplateforme FBReader [http://www.fbreader.org/], qui fonctionne sous Linux, FreeBSD, Windows, mais également sous Zaurus, Maemo, Android (contrairement à ce que je laissais entendre dans un précédent journal), quelques téléphones et lecteur epaper (IRex iLiad), Archos, etc. ;
  • Ce format est également lisible par Okular ;
  • Mais si ce format est ouvert, il est malheureusement possible d'envisager des livres au format epub avec DRM. :(

Selon moi c'est une mauvaise chose car cela offre le risque de généraliser un bon format libre au travers de livres sans DRM, habituant les gens aux livres électroniques, et puis progressivement cela proposera du contenu culturel dans des epub avec DRM en laissant croire que c'est dans la continuité du premier.

D'un autre côté, cela peut être compréhensible puisque des grands noms de l'édition sont membres de l'IDPF, comme par exemple Adobe, Amazon.com, des associations d'éditeurs américains, canadiens, italiens, Barnes & Noble, HarperCollins, O'Reilly Media, Sony, Oxford University Press...
Il vaut mieux encore que ces éditeurs poussent vers la diffusion d'un format ouvert, même s'ils comptent rajouter pour leurs propres livres des DRM, plutôt que de pousser la diffusion d'un format complètement fermé même sans DRM, qui empêcherait l'interopérabilité. Mais malgré tout cela reste une arme à double tranchant.


Quoi qu'il en soit, si vous publiez déjà des textes et que vous souhaitez proposer une version epub de vos documents (mais sans DRM hein !), vous pouvez utiliser Calibre [http://calibre.kovidgoyal.net/], qui à partir de document en html, pdf ou autres, peut exporter au format EPUB. (cela semble même possible à utiliser en ligne de commande)
Une présentation de Calibre sur un blog : http://liseweb.fr/BLOG/calibre-pour-creer-des-fichiers-epub-(...)

Si vous préférez avoir plus de contrôle sur le rendu, la méthode manuelle est décrite ici : http://www.jedisaber.com/eBooks/tutorial.asp mais cela semble un peu fastidieux.

Enfin, une fois votre document généré, n'oubliez pas de vérifier sa conformité avec epubcheck [http://code.google.com/p/epubcheck/], d'autant plus qu'avec Calibre le fichier EPUB généré n'est pas toujours très propre, en effet si la base est un fichier html et qu'il y a des options dans les balises qui ne sont pas dans le standard xhtml, il les inclura quand même.

Pour essayer d'être un peu plus exhaustif sur les formats populaires pour les ebooks, il convient de citer également un autre format d'ebooks aux spécifications libres (sous licence GPL) : Plucker.

Enfin, on pourra rétorquer que le pdf ou le html est généralement suffisant pour lire et diffuser des documents, et que des formats supplémentaires, même libres, ne risquent que d'apporter de la confusion.

Mais un lecteur de livre électronique, c'est du matériel embarqué ultra-basse consommation (pour lequel on peut demander jusqu'à plusieurs semaines d'autonomie), donc le moins d'énergie il aura à utiliser pour analyser le fichier, le mieux ça sera. En pratique, le point le plus important de la spécification EPUB, c'est que le texte est découpé en plusieurs fichiers xhtml, ce qui permet d'éviter aux lecteurs d'avoir à calculer la mise en page et de lire une part trop conséquente du texte d'un seul coup.

Utiliser du html, c'est risquer aussi de voir apparaître des balise de mise en forme dans le document (et non dans le CSS). Et cela peut définitivement rendre un livre illisible sur un lecteur embarqué.

Ce genre de considérations ne s'applique pas lors de la lecture sur ordinateur ou netbook, mais le format EPUB n'est pas conçu spécifiquement dans cette optique.
  • # Libre de droits

    Posté par (page perso) . Évalué à 1.

    Par pitié, arretez de dire "libre de droits" lorsque vous voulez parler de logiciel libre. Littéralement, ça veut dire "dans le domaine public", et en termes juridiques c'est une mauvaise traduction de "royalty free" c'est à dire gratuit. Bref le logiciel libre c'est ni l'un ni l'autre (le LL est basé sur le copyright et n'est pas toujours gratuit).
    • [^] # Re: Libre de droits

      Posté par . Évalué à 10.

      et ?
      déformation professionnelle ou lu trop rapidement ?

      Les textes proposés sur Feedbooks sont bien pour la plupart "libres de droits", c'est à dire tombés "dans le domaine public". (Hugo, Sun Tzu, Maupassant...)

      Only wimps use tape backup: real men just upload their important stuff on megaupload, and let the rest of the world ~~mirror~~ link to it

  • # À noter le lecteur epub des complexes (la poule et l'œuf)

    Posté par (page perso) . Évalué à 4.

    http://www.lescomplexes.com/blog/, webreader epub fait par le créateur du CMS la poule et l'œuf (et qui devrait prochainement intégrer la poule et l'œuf directement)

    Dispo sous linux, osx et windows
  • # Okular

    Posté par . Évalué à 4.

    Je viens de tester The Art of War au format epub de chez Feedbooks sur ma debian sid avec okular en version 4.2.4. Le fichier se lit (après installation du paquet okular-extra-backends), mais il y a des caractères en trop (sensés être invisibles), les accents sont assez mal gérés ainsi que la présentation. Dommage, je vais devoir continuer avec le format pdf (et aussi faire un bug report quand j'aurai le temps)
    • [^] # Re: Okular

      Posté par . Évalué à 3.

      je ne remarque pas trop de problème avec ce (ces) fichiers (j'ai testé la version "restored translation" ainsi que l'autre). La seule chose que je vois, (avec okular 4.3 beta), c'est que les énumérations (avec des nombres) continuent avec des lignes vides. Dans la version pdf cela s'arrête correctement. Et avec FBReader, le même fichier epub n'affiche pas les énumérations avec des nombres mais juste des points (c'est peut être modifiable dans les options).

      En plus okular semble afficher ce type de fichier comme si c'était un pdf (coupure en pages A4), alors que cela n'est pas le but de ce format, c'est plutôt fait pour s'afficher correctement quelle que soit la taille de l'écran des lecteurs embarqués (téléphone, livres électroniques)

      Only wimps use tape backup: real men just upload their important stuff on megaupload, and let the rest of the world ~~mirror~~ link to it

      • [^] # Re: Okular

        Posté par . Évalué à 4.

        Cela m'agace assez de voir que l'on re-invente sans cesse ce qu'etait HTML à l'orgine.
        Le HTML est un media indépendant à l'aide de balise indépendante du formalisme (, ... (les tag font ne sont qu'un ajout issue de la volonté de certains acteurs par le passé...je ne citerai personne...)

        * HTML : Contenu
        * CSS : Formalisme de mise en mise en page.
        * Javascript : c'est un ajout pour permettre l'interraction coté client.

        Le meilleur format de representation de l'information est bien HTML, rien ne sert d'inventer d'autre format que de propriatairisé les formats....

        Le seul manque :
        * Pouvoir intégrer les images dans le meme fichier ;-)
        • [^] # Re: Okular

          Posté par . Évalué à 3.


          Le seul manque :
          * Pouvoir intégrer les images dans le meme fichier ;-)


          Il est possible en HTML d'intégrer les images directement dans le code HTML. C'est, bien entendu, pas recommandé, pour des raison évidente de mémoire, mais ça reste possible en précisant l'url de cette manière (dans l'attribut src) : data:image/png;base64,[...]. Le [...] contient le contenu en base64 de l'image.

          Mais c'est que c'est pas facile d'essayer de montrer du HTML dans les commentaires de DLFP ! J'aurai bien donnée une balise tout faite, mais soit elle s'affichait pas, soit elle s'affichait avec des "e; ou < et >.

          Bref, mes 2 centimes.
        • [^] # Re: Okular

          Posté par (page perso) . Évalué à 5.

          Epub utilise en interne du xhtml ou du DTbook (XML + SMIL) pour les livres parlés, mais le xhtml ne gère pas par essence les données dublin core et autres informations relatives à la presse et aux livres (citations, collophon, annexes et tout le tintouin), ce que prend en charge epub.
        • [^] # Re: Okular

          Posté par . Évalué à 4.

          Le meilleur format de representation de l'information est bien HTML

          attends un peu...

          tu parles du HTML 2.0, HTML 3.2., 4.0, HTML 4.01, XHTML 1.0, XHTML 1.1 ou HTML 5 ?
          En version strict ou transitional ?

          En supportant les frames ou pas ? Et les hacks de IE6 ?

          Le but n'est pas de remplacer le html, mais de pouvoir proposer des livres électroniques dans un format clairement défini, facile à parser, et contenant des informations que l'on n'a pas avec du html. De plus, en n'ayant qu'un seul document à télécharger contenant tout le livre, c'est pratique et rapide sur les ordinateurs embarqués n'ayant pas un gestionnaire de bureau complet.

          Only wimps use tape backup: real men just upload their important stuff on megaupload, and let the rest of the world ~~mirror~~ link to it

  • # O'Reilly Media

    Posté par . Évalué à 3.

    Juste une précision, à ma connaissance, O'Reilly Media a justement une offre numérique libre de DRM. Ils ont même amélioré le truc depuis la dernière fois que j'y ai acheté un bouquin : ils proposent maintenant les formats PDF, EPUB dont tu parles, et MOBI (le format Mobipocket).
    • [^] # Re: O'Reilly Media

      Posté par . Évalué à 3.

      note to self, ne jamais poster avant le premier café. Désolée.
    • [^] # Re: O'Reilly Media

      Posté par . Évalué à 3.

      Dans une optique plus récréative, Baen (éditeur de SF/Fantasy) est l'un des rares éditeurs à avoir une offre ebook réellement intéressante : prix bas (et même très bas pour les packs), version eARC très potables, formats multiples sans DRMs (dont sony, lit (MS), ePub, mobi, html, rtf)... Il offre également un grand nombre d'ebook gratuits pour allécher le lecteur.
      http://www.webscription.net/ (offre ebook Baen)
      http://www.baen.com/library/ (librairie de livres gratuits, et explication de leur politique vis-à-vis des ebooks, intéressant, surtout quand on réalise que leur solution a été l'une des première disponible et a perduré dans sa forme initiale jusqu'à aujourd'hui avec un succès très respectable)

      Évidemment c'est en anglais.
  • # Si vous voulez contribuer au libre:

    Posté par . Évalué à 2.

    Voici quelques projets auxquels vous pouvez contribuer pour que le libre l'emporte sur les liseuses (nom donné par l'Académie Française aux livres à encre électronique):
    http://openinkpot.org/ est un OS complet pour les liseuses de type Hanlin V3 (et ses nombreux modèles compatibles) bloqué dans ses portages vers deux modèles concurrents (Sony et Cybook) par manque de specs. Mais il avance sur le V3, et sera porté sur les prochains modèles aux spécifications ouvertes.
    Il contient deux logiciels de lecture:
    http://www.fbreader.org/
    http://www.coolreader.org/e-index.htm
    Qui tous les deux ont besoin de code pour étendre leurs possibilités, comme celle de lire les Wikipedia mobipocket entièrement libres publiés par un allemand plein d'abnégation en plusieurs langues, mais inutilisables car les liens d'un fichier index vers des fichiers contenus dans le même dossier ne sont pas supportés:
    http://pinguinburg.de/wpmp
    • [^] # Re: Si vous voulez contribuer au libre:

      Posté par . Évalué à 2.

      Comme la précisé Bruce Le Nain nous avons créé un lecteur epub (sous xulrunner) et bientôt un plugin pour firefox le tout est sous GPL ! La poule ou l'œuf permet l'exportation au format epub (utilisé par exemple pour le livre de François Élie «Économie du logiciel libre» chez Eyrolles). Nous cherchons aussi des contributeurs − pour que le libre l'emporte sur les liseuses − car pour l'instant le monde de l'édition ne voient que par les DRM et des moteurs de rendu propriétaires et les projets comme Openinkpot sont encore trop rare !

Suivre le flux des commentaires

Note : les commentaires appartiennent à ceux qui les ont postés. Nous n'en sommes pas responsables.