Journal EPUB, format libre d'ebooks

Posté par .
Tags :
17
15
juin
2009
En ces temps troublés où nos responsables chargés de la "Culture" semblent plus passer leur temps à vouloir restreindre et brider cette culture qu'à la diffuser, et ayant d'autre part découvert récemment l'excellent site Feedbooks [http://feedbooks.com/] qui propose des textes libres de droits, je me suis intéressé d'un peu plus près aux ebooks.

Pour moi, ebooks signifiait avant tout "livres électroniques dans un format fermé avec si possible des DRM". Sans en avoir fait le tour dans le détail, j'imaginais bien chaque vendeur de lecteur électronique développer son format alakon, si possible incompatible avec les autres, et sortir une plateforme de téléchargement façon iThunes avec des livres vendus à prix d'or, que les lecteurs ne pourront peut-être pas relire d'ici quelques années. Le format fermé par excellence. Je n'étais pas si loin de la réalité au niveau des formats, comme en atteste cette page : http://en.wikipedia.org/wiki/Comparison_of_e-book_formats

D'autre part, pour moi les ebooks n'avaient pas forcément d'intérêt puisque un PDF ou un fichier HTML pourra faire tout aussi bien l'affaire.

Je vois néanmoins quelques problèmes avec les pdf ou le html :

- Sur un ordinateur de bureau ces formats ne posent pas de problème particulier, par contre sur des petits ordinateurs (téléphone, tablette, lecteur électronique, embarqué), la place peut devenir un soucis, aussi la taille peut être optimisée en compressant les données (ce que n'a pas le html).
- La taille d'écran ne permet pas forcément le supporter pleinement les marges imposées en html, ou le format souvent en A4 du pdf.
- Un bon rendu html ou pdf n'est pas toujours disponible sur l'embarqué. Le code html peut contenir des choses non désirées sur de l'embarqué (javascript)
- Le pdf est optimisé pour l'impression, et pas toujours pour la lecture à l'écran.
- Les images en html ne se trouvent pas dans le fichier mais nécessitent de l'accompagner (pas pratique, sauf si on compresse le tout, ce qui ne sera pas lisible par un navigateur de base)

C'est alors que j'ai découvert le format EPUB [http://en.wikipedia.org/wiki/EPUB], un format ouvert et libre mis en avant par Feedbooks qui permet de stocker des livres électroniques sur des lecteurs embarqués ou sur son ordinateur.

- C'est du xml + css zippés, aussi cela peut contenir des images, une couverture, des méta-informations sur le document.
- Le livre est optimisé suivant l'affichage du lecteur. De plus le rendu est souvent plus agréable que du html ou du pdf
- C'est lisible par l'excellent lecteur libre et multiplateforme FBReader [http://www.fbreader.org/], qui fonctionne sous Linux, FreeBSD, Windows, mais également sous Zaurus, Maemo, Android (contraiment à ce que je laissais entendre dans un précédent journal), quelques téléphones et lecteur epaper (IRex iLiad), Archos etc.
- Ce format est également lisible par Okular.
- Mais si ce format est ouvert, il est malheureusement possible d'envisager des livres au format epub avec DRM :(
Selon moi c'est mal [http://drm.saimal.fr/] car cela offre de risque de généraliser un bon format libre au travers de livres sans DRM, habituant les gens aux livres électroniques, et puis progressivement cela proposera du contenu culturel dans des epub avec DRM en laissant croire que c'est dans la continuité du premier.

Quoi qu'il en soit, si vous publiez déjà des textes et que vous souhaitez proposer une version epub de vos documents (mais sans DRM hein !), vous pouvez utiliser Calibre [http://calibre.kovidgoyal.net/], qui à partir de document en html, pdf ou autres, peut exporter au format EPUB. (cela semble même possible à utiliser en ligne de commande)
Une présentation de Calibre sur un blog : http://liseweb.fr/BLOG/calibre-pour-creer-des-fichiers-epub-(...)

Si vous préférez avoir plus de contrôle sur le rendu, la méthode manuelle est décrite ici : http://www.jedisaber.com/eBooks/tutorial.asp mais cela semble un peu fastidieux.

Enfin, une fois votre document généré, n'oubliez pas de vérifier sa conformité avec epubcheck [http://code.google.com/p/epubcheck/]
  • # Commentaire supprimé

    Posté par . Évalué à 3.

    Ce commentaire a été supprimé par l'équipe de modération.

    • [^] # Re: Les maths ça passe comment là-dessus ?

      Posté par . Évalué à 2.

      je ne lis pas de textes scientifiques (pas avec équation en tout cas), il y a un article sur le sujet là dessus : http://www.dessci.com/en/reference/ebooks/EPUBMath_spec.htm

      Pour la gestion des espaces, c'est le lecteur qui fait cela. Si le lecteur est bon, cela ne devrait pas poser de problème, et la justification devrait être désactivable.

      Un livre c'est souvent plus agréable, mais cela prend plus de place.

      Only wimps use tape backup: real men just upload their important stuff on megaupload, and let the rest of the world ~~mirror~~ link to it

  • # Du bon usage de la css

    Posté par (page perso) . Évalué à 6.



    <!--
    @media handheld
    {
    /* ... définition de formats pour une sortie écran compact... */
    }
    -->



    HTML me semble tout à fait correct pour un livre. Certes tu ne peux pas incorporer les images dans un seul fichier, mais entre glisser un répertoire et un fichier pour qu'il soit copié sur ton ebook, l'effort est le même. HTML peut aussi contenir des métadonnées.

    Le rendu n'est pas un problème de format de fichier mais de logiciel de rendu. Ton navigateur doit normalement te permettre de désactiver le javascript, dans le cas ou il le gère.

    Je trouve qu'un nouveau format de fichier est franchement pas utile au vue de ce que tu me dis. Enfin tant que c'est un format ouvert et documenté, je m'en fiche, chacun est libre de réinventé la roue.
    • [^] # Re: Du bon usage de la css

      Posté par . Évalué à 3.

      Certes tu ne peux pas incorporer les images dans un seul fichier,

      Euh, si, tu peux. C'est modérément standard, mais les "data URLs" marchent au moins sous Firefox et Arora (donc Webkit, je suppose).
    • [^] # Re: Du bon usage de la css

      Posté par . Évalué à 6.

      Mais justement, le format epub c'est du xhtml/css...

      ... avec juste certains éléments gadgets des spécifications css en moins et surtout, une spécification précise de comment doivent être packagés les fichiers. Et c'est ce dernier point le plus important.

      Un lecteur de livre électronique, c'est du matériel embarqué ultra basse consommation (on lui demande quand même plusieurs semaines d'autonomie), donc le moins d'énergie il aura à utiliser pour parser le fichier, le mieux ça sera. En pratique, le point le plus important de la spécification epub, c'est que le texte est découpé en plusieurs fichiers xhtml, ce qui permet d'éviter aux lecteurs d'avoir à calculer la mise en page/lire un part trop conséquente du texte d'un seul coup.

      Et puis utiliser du html, c'est risquer de voir apparaître des balise de mise en forme dans le document (et non dans le CSS). Et ça, ça peut définitivement rendre un livre illisible (typiquement un fichier html qui indique la police à utiliser pour chaque paragraphe, j'ai déjà croisé et c'est absoluement imparsable pour un lecteur matériel...).

      Evidemment ce genre de considérations ne s'applique pas lors de la lecture sur ordinateur/tablette lcd/subnotebook et autres, mais le format epub n'est pas conçu pour ça.
      • [^] # Re: Du bon usage de la css

        Posté par . Évalué à 2.

        je n'ai pas précisé non plus dans le journal, mais il existe aussi un autre format d'ebooks libre(GPL) : c'est plucker

        De plus au niveau de Calibre, même s'il est capable de produire un fichier au format epub (et aussi plucker je crois), cela n'est pas toujours très propre, si la base est un fichier html et qu'il y a des options qui ne sont pas standard dans les balises (genre "div align center" et compagnie), il les mettra quand même.

        Only wimps use tape backup: real men just upload their important stuff on megaupload, and let the rest of the world ~~mirror~~ link to it

  • # feedbooks

    Posté par (page perso) . Évalué à 4.

    J'ai essayé à une époque essayé l'"excellent" feedbooks. J'ai été surpris de trouver des livres issus de gutenberg qui en comportaient pas les informations de license qui sont obligatoires sauf à supprimer toute référence au projet gutenberg (ce qui a l'air autorisé) et surtout sans la phrase "his eBook is for the use of anyone anywhere at no cost and with almost no restrictions whatsoever. You may copy it, give it away or re-use it under the terms of the Project Gutenberg License included with this eBook or online at http://www.gutenberg.org" mais avec “Strictly for personal use, do not use this file for commercial purposes.”.
    J'ai lancé un troll sur le blog feedbooks [http://blog.feedbooks.com/?p=155], et a priori, ils considèrent qu'ils respectent la license.
    • [^] # Re: feedbooks

      Posté par . Évalué à 2.

      pas évident de savoir.

      Effectivement, si on retire la référence au Project Gutenberg cela semble autorisé. Mais il me semble que la moindre des choses c'est de citer la source du document, quel qu'il soit.
      Ce lien sur feedbooks ne me semble pas superflu, ni ambigu vis à vis du projet. Je pense que ce que Gutenberg cherchent à éviter, c'est que certains puissent se faire passer pour le projet gutenberg (renommée) et fassent payer des livres pour cela.

      Un petit lien ne me semble pas porter préjudice à l'esprit de la licence, mais il faudrait contacter le projet gutenberg pour savoir ce qu'ils en pensent.

      Only wimps use tape backup: real men just upload their important stuff on megaupload, and let the rest of the world ~~mirror~~ link to it

      • [^] # Re: feedbooks

        Posté par (page perso) . Évalué à 2.

        > Un petit lien ne me semble pas porter préjudice à l'esprit de la licence, mais il faudrait contacter le projet gutenberg pour savoir ce qu'ils en pensent.

        Ce qui est préjudiciable à gutenberg, c'est de proposer une version à libertés restreintes (interdire l'usage commercial) où est mentionné le projet gutenberg. On peut donc croire que les livres gutenberg ne sont pas sous license libre !
  • # Sony PRS (et Adobe DE). ePub, PDF et LRF. Calibre. OpenInkpot.

    Posté par . Évalué à 3.

    Bon, ceux qui comme moi ont un Sony PRS 505 ont pu se rendre compte de la gestion désastreuse du format ePub: pas de justification du texte, beurk.
    Même problème avec les PDFs reflowés. (mais pourquoi ont-il supprimé le mode "bête zoom" dans les dernières versions... grr!)
    Enfin dans ces déboires, le seul tort de Sony est en fait d'avoir choisi la visionneuse d'Adobe.

    Du coup, pour les romans, j'utilise le format LRF qui est bien mieux géré. (c'est là où Calibre vous sauve la vie !). Pour les papiers scientifiques, je reste bloqué... un moyen serait que je retraite les PDFs pour enlever les marges, mais je ne suis pas sûr que ce serait écrit assez gros.

    Voilà, sinon j'attends avec impatience des nouvelles du projet OpenInkpot, dont le but est de développer un firmware libre pour les principales visionneuses d'eBooks.
    • [^] # Re: Sony PRS (et Adobe DE). ePub, PDF et LRF. Calibre. OpenInkpot.

      Posté par . Évalué à 2.

      le seul tort de Sony est en fait d'avoir choisi la visionneuse d'Adobe.

      Il me semble que c'est la seule possibilitée pour pouvoir lire les pdf avec drm...
      • [^] # Re: Sony PRS (et Adobe DE). ePub, PDF et LRF. Calibre. OpenInkpot.

        Posté par . Évalué à 2.

        Et comment fait la concurrence ?
        Et quels besoin avaient-ils de les gérer de toute façon ?
        PDF n'est pas franchement le meilleur format pour ces bébêtes, à moins que le fichier ait été prévu dès le départ pour la taille de l'écran... mais dans ce cas, autant partir sur du LRX (LRF drmisé).
        • [^] # Re: Sony PRS (et Adobe DE). ePub, PDF et LRF. Calibre. OpenInkpot.

          Posté par . Évalué à 3.

          Et comment fait la concurrence ?

          Iliad ne gère pas les pdfs avec drms, pour les autres je ne sais pas. Mais il me semble que c'est une histoire de license: adobe certifie une plateforme et te contraint à utiliser son outil (j'ai lu ça quelque part, mais ça reste à vérifier)

          Et quels besoin avaient-ils de les gérer de toute façon ?

          Car ça serait se passer d'une partie des contenus vendus en ligne
          En gros on a 3 formats sur les boutiques en ligne: prc, epub et pdf, chacun avec son type de drm, chacun avec ses avantages et inconvénients, et surtout chacun avec ses oeuvres... commercialement, je pense que sony ne pouvait pas se passer des oeuvres sous ce format

Suivre le flux des commentaires

Note : les commentaires appartiennent à ceux qui les ont postés. Nous n'en sommes pas responsables.