Journal Tous les trolls dans ta poche !

Posté par  .
Étiquettes : aucune
22
5
sept.
2010
Ami possesseur de "liseuse" ou tout autre appareil permettant de lire des livres électroniques, tu vas pouvoir désormais profiter confortablement de tous les derniers trolls à la mode depuis les transports en commun, la plage, ...

À cet effet, je viens de terminer une première version de "recette" (un script Python) pour le logiciel Calibre (http://calibre-ebook.com/ ), qui permet de télécharger les dépêches et journaux LinuxFR de la journée sous forme de livre électronique.
Le fichier se trouve pour l'instant ici, je vais sans doute le soumettre dans les jours à venir sur les forums officiels de Calibre, voire pour inclusion dans le logiciel.

Pour ceux qui ne le connaissent pas, Calibre est un logiciel libre permettant de gérer presque tout ce qui se rapporte aux livres électroniques (bibliothèque, conversion entre formats, transfert vers une liseuse, téléchargement de contenu web...)

Je suis à l'écoute de toutes vos remarques pour améliorer ce script (y compris les horreurs que j'ai pu faire en Python, c'est la première fois que je m'y colle...).

Quelques détails sur les choix que j'ai fait, principalement pour optimiser l'affichage sur des appareils de type liseuse :
- les notes (journaux, commentaires, ...) sont supprimées
- tous les liens relatifs (internes au site) ont été supprimés (seul le texte est conservé), car ils ne sont pas utilisables dans ce cadre
- les liens externes ont été conservés, pour ceux qui auraient la possibilité de se connecter à internet sur leur liseuse ; les liens relatifs faisant un "redirect" via linuxfr ont été remplacés par des liens directs
- les commentaires sont présents (trolls inclus ;-) ) ; ils sont tous affichés quelque soit la note ; le premier commentaire est séparé du texte de l'article par une ligne "Commentaire" ajoutée (original, non ? ;-) )
  • # installation

    Posté par  (site web personnel) . Évalué à 6.

    Ai installé "Calibre" parceque ... ton script :p
    Permière remarque : description = u'Articles et journaux du site d''actualite autour du logiciel libre LinuxFR.org'
    le ' ' ne pose pas de pb ?
    actualités avec un accent (et un s), non plus ? Ou il s'agit d'un choix délibéré de ne pas utiliser d'accent (à ce moment peut être alors employé un autre terme, genre "informations' qui sera plus passe-partoutf8

    Bon, Calibre est extra, super, agréable à utiliser et beau. Par contre il manque la fonction de scan des répertoires. Parceque là, je lui donne à manger le répertoire ~/Documents/Ebooks comme dossier de référence pour lui, avec son assistant de configuration.
    Mais il ne trouve aucun livre dedans. Donc "ajout livre", un à un. Et puis je m'aperçois qu'il a dupliqué les livres, tout les livres, dont leur propre répertoire. Là y a un truc qui m'échappe.... s'il s'agit de versions "optimisés" crée par lui pour le transfert sur un lecteur, pourquoi ne pas opérer cela à la demande (plutot que de charger le disque avec plein de doublons).

    Bon, passé ce micro-détail, calibre est vraiment génial. GENIAL. enfin j'ai pas mal de soucis (en fait avec tout les recipe) du genre :

    Parsing stylesheet.css ...
    Creating EPUB Output...
    Traceback (most recent call last):
    File "/usr/bin/calibre-parallel", line 19, in
    sys.exit(main())
    File "/usr/lib64/calibre/calibre/utils/ipc/worker.py", line 98, in main
    result = func(*args, **kwargs)
    File "/usr/lib64/calibre/calibre/gui2/convert/gui_conversion.py", line 24, in gui_convert
    plumber.run()
    File "/usr/lib64/calibre/calibre/ebooks/conversion/plumber.py", line 919, in run
    self.opts, self.log)
    File "/usr/lib64/calibre/calibre/ebooks/epub/output.py", line 143, in convert
    self.workaround_ade_quirks()
    File "/usr/lib64/calibre/calibre/ebooks/epub/output.py", line 380, in workaround_ade_quirks
    for rule in stylesheet.data.cssRules.rulesOfType(CSSRule.STYLE_RULE):
    AttributeError: 'CSSRuleList' object has no attribute 'rulesOfType'

    Ton Recipe n'apparait pas dans la liste. J'ai crû à un moment que sa syntaxe particulière en était la cause, et ai ajouté d'abord un en tête (pas seulement "author" mais aussi "license" donc), et modifier deux trois trucs, mais rien à faire il n'apparait toujours pas.

    Je dois avoir deux bras gauche ce soir encore
    En tout cas Merci.
    • [^] # Re: installation

      Posté par  . Évalué à 2.

      dans la liste des "news", une fois la recette intégrée, il ne faut pas chercher dans "Français", mais dans "Personnalisé" (moi aussi j'ai mis du temps avant de comprendre).

      Sinon Calibre est très bien, mais ça fait un peu usine à gaz je trouve.

      Pour ton problème d'ajout de livres, tu n'es pas obligé de les ajouter un par un, tu peux ouvrir un répertoire, et sélectionner les livres que tu veux, ou même tout. Par contre je n'aime pas qu'il sauvegarde dans un sous-dossier, en reformatant le titre, j'aurais préféré qu'il récupère les infos sur mes livres dans une base à lui, et qu'il convertisse à la demande, dans le cas d'un export vers une liseuse spécifique par exemple. Au lieu de ça, j'ai l'impression d'avoir un genre d'iTunes.

      On peut modifier ces paramètres en théorie, mais je n'ai pas l'impression d'avoir bien le contrôle sur ce qui est fait, car mes options n'ont pas l'air d'être prises en compte (par exemple j'ai demandé à remplacer les espaces par des _, de mettre le nom de l'auteur en premier, de ne pas sauvegarder la couverture dans un fichier à part en plus, mais quand j'importe un livre cela reste avec le comportement par défaut).

      Only wimps use tape backup: real men just upload their important stuff on megaupload, and let the rest of the world ~~mirror~~ link to it

    • [^] # Re: installation

      Posté par  . Évalué à 6.

      Hello,

      - le '' : effectivement, je n'avais pas vérifié, il n'a pas l'air de passer ; je ne connais pas Python, et dans d'autres langages de script, ça permet d'insérer le caractère ' dans une chaîne délimitée par ce même caractère - remplacer par \' règle le problème

      - pour le 's'... pas taper ! (dire que je viens d'envoyer des listes de corrections sur des livres électroniques...)

      - pour les accents, c'est un autre problème ; il ne s'agit pas d'un choix délibéré, mais "forcé". J'ai écrit et testé le script avec les méthodes conseillées, c'est à dire en dehors de Calibre, en mettant les accents nécessaires (d'où le u devant la chaîne, pour préciser que c'est de l'unicode), mais une fois remis dans l'éditeur, impossible de le faire passer, messages d'insulte sur des problèmes d'encodage - étrange, sachant que j'ai travaillé tout du long en utf-8 ; si quelqu'un à la solution (même en retapant directement dans l'éditeur intégré de Calibre, pas moyen)

      - pour l'ajout de livres et pour retrouver ma "recette", farvardin a déjà répondu - a priori, les catégories autres que "Personnalisé" sont réservées pour l'instant aux recettes inclues dans le logiciel

      - personnellement, comme farvardin, je trouve Calibre un peu usine à gaz, mais pour l'instant, je n'ai rien trouvé d'autre... (bon, je me suis mis à la lecture électronique y a quoi, 8 jours ?). Autant cet aspect ne me gène pas tant que ça, j'ai l'habitude des bloatwares, autant un point que tu évoques me hérisse les cheveux sur la tête : comme beaucoup de gestionnaires photos, Calibre veut gérer lui même tes livres, il fait ses propres copies et tout et tout : ça, j'ai beaucoup de mal à le supporter... Pourquoi ne pas simplement indexer, et laisser l'utilisateur faire ce qu'il veut de ses fichiers ?
  • # notes

    Posté par  . Évalué à 7.

    c'est vraiment bien ce truc, par contre des trolls sans les notes, c'est comme une comparaison ubuntu / fedora sans benchmark.

    Only wimps use tape backup: real men just upload their important stuff on megaupload, and let the rest of the world ~~mirror~~ link to it

    • [^] # Re: notes

      Posté par  . Évalué à 2.

      C'est un peu vrai, et j'ai pas mal hésité.
      Mon raisonnement est plutôt le suivant : les notes - surtout sur les sujets à fort potentiel trollogène - sont parfois très "volatiles" et suivant le moment où on va télécharger, des commentaires peuvent en fonction des aficionados divers qui sont passés être à +10 ou à -10...
      Combien de commentaires très intéressants ne sont presque jamais lus car ils ont été notés "inutiles" par quelque kabbale "ennemie" ?
      Disons que c'est une question de confiance dans le système, de temps et de l'intérêt consacré à la lecture - je fais partie des gens qui naviguent "en -42", d'où l'absence de notes...

      Pour remettre les notes :

      1. Commenter les deux lignes suivantes dans remove_tags
      dict(name='i'),
      dict(name='span', attrs={'class':'content-score'}),

      2. Rajouter juste avant le return soup de preprocess_html la ligne :
      soup.find(name='span',attrs={'class':'content-score'}).insert(0,'Note : ')

      Le 2. permet juste d'insérer un texte devant la note de la dépêche / du journal, qui sinon apparaît seule sans libellé.
      • [^] # Re: notes

        Posté par  . Évalué à 2.

        les notes sont parfois très "volatiles"

        ah oui c'est vrai. Dans ce cas l'absence de note se justifie pleinement. Merci pour l'astuce pour les remettre quand même.

        Only wimps use tape backup: real men just upload their important stuff on megaupload, and let the rest of the world ~~mirror~~ link to it

      • [^] # Re: notes

        Posté par  . Évalué à 4.

        Combien de commentaires très intéressants ne sont presque jamais lus car ils ont été notés "inutiles" par quelque kabbale "ennemie" ?

        Zero.
        • [^] # Re: notes

          Posté par  . Évalué à 3.

          Il n'y a pas de cabale!

          Depending on the time of day, the French go either way.

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.