Forum général.cherche-logiciel Imprimer facilement une documentation HTML

Posté par  .
Étiquettes :
0
10
déc.
2007
Bonjour,
j'ai trouvé (grâce à vous chers lecteurs) une très belle documentation html, du coup j'aimerais pouvoir la lire facilement. Elle est sous la forme de liens...donc soit je passe beaucoup de temps à faire un documentation openoffice et j'imprime soit il existe un utilitaire pour faire facilement une transformation. Merci de vos réponses (eh oui avec un s optimiste le gars).
Cordialement
  • # cat

    Posté par  . Évalué à 2.

    pas très propre, mais cela peut fonctionner, avec cat tu peux concaténer les fichiers entre eux. Du genre :

    cat page1.html page2.html page3a.html page3b.html > documentcomplet.html

    Only wimps use tape backup: real men just upload their important stuff on megaupload, and let the rest of the world ~~mirror~~ link to it

    • [^] # Re: cat

      Posté par  . Évalué à 1.

      for i in *hmtl;do cat "$i">>documentcomplet;done

      marchera mieux si y a 500 million de fichier, mais bon en plus y aura redondance de code html dans le resultat faudra retoucher tout ça
      • [^] # Re: cat

        Posté par  . Évalué à 3.

        >for i in *hmtl;do

        oui, sauf s'il veut le faire dans un ordre précis...

        Only wimps use tape backup: real men just upload their important stuff on megaupload, and let the rest of the world ~~mirror~~ link to it

      • [^] # Re: cat

        Posté par  . Évalué à 2.

        Et pourquoi pas un cat *html > documentcomplet.html plutôt ?

        De toutes façon, cela reste dégueu. Il faut au filtrer chaque fichier pour ne conserver que le contenu de , et ensuite aller remettre un header général en tête de fichier avec les CSS.
        • [^] # Re: cat

          Posté par  . Évalué à 2.

          parce qu'avec un cat *html > documentcomplet.html il aura son document dans le désordre s'il se présente ainsi :

          chapitre-deux.html
          chapitre-quatre.html
          chapitre-trois.html
          chapitre-un.html

          ou même plus simplemement

          chapitre1.html
          ...
          chapitre20.html


          je caricature, mais c'est sur que s'il est structuré de la sorte

          chapitre001.html
          ...
          chapitre020.html etc

          il peut faire un cat *html car cela sera dans le bon ordre.

          après, pour le côté "dégueu", c'est pas pour publier sur internet hein, et s'il veut l'importer ensuite dans openoffice, il aura tout les titres etc, et cela retirera les entete redondants.

          Après, si tu as mieux à proposer...

          Only wimps use tape backup: real men just upload their important stuff on megaupload, and let the rest of the world ~~mirror~~ link to it

          • [^] # Re: cat

            Posté par  . Évalué à 3.

            parce qu'avec un cat *html > documentcomplet.html il aura son document dans le désordre s'il se présente ainsi :


            Oui, ça tu viens de le dire. Moi, je voulais savoir ce qu'un for i in *hmtl;do cat "$i" avait de plus qu'un cat *. On dirait que beaucoup de gens sont restés à l'idée que cat ne sert qu'à afficher le contenu d'un fichier. C'est oublier que "cat" signifie avant tout "catenate" et sert précisément à concaténer le contenu de plusieurs fichiers.

            Après, si tu as mieux à proposer...


            C'est bon, je l'ai fait plus bas.
            • [^] # Re: cat

              Posté par  . Évalué à 2.

              ah oui pardon, j'avais mal vu le fil de discussion...

              c'est vrai que selon les programmes on ne peut pas se permettre d'utiliser un caractère joker tout le temps.
              D'ailleurs je ne sais pas sur quels critères cela se fait, parce que cela ne fonctionne pas avec unzip, mais cela fonctionne avec dpkg par exemple...

              Only wimps use tape backup: real men just upload their important stuff on megaupload, and let the rest of the world ~~mirror~~ link to it

              • [^] # Re: cat

                Posté par  . Évalué à 2.

                D'ailleurs je ne sais pas sur quels critères cela se fait, parce que cela ne fonctionne pas avec unzip, mais cela fonctionne avec dpkg par exemple...


                Je ne sais pas mais à mon humble avis, il n'y pas de critères. A la place, il doit y avoir les programmes écrits sous Unix à la base, donc par des programmeurs habitués à cela, et les programmes importés du DOS, dont les services proposés de ce côté se résument au minimum.

                Il y a une chose que l'on sait, par contre, c'est que l'opérateur * développe une liste de fichiers en argument, mais n'appelle certainement pas le programme itérativement.

                L'avantage du "for" en shell, c'est que non seulement il permet d'utiliser de cette manière les programmes qui n'attendent qu'un nombre fixe d'arguments, mais surtout de faire des lignes de commandes composées (et notamment, de choisir à chaque fois le fichier de sortie).
              • [^] # Re: cat

                Posté par  . Évalué à 2.

                En général c'est le shell qui transforme le caractère "*" en la liste des fichiers.
                Après il faut voir si le programme accepte effectivement plusieurs noms de fichiers en argument. Si unzip (de même que tar en mode extraction) n'accepte qu'un seul nom de fichier archive, c'est parce qu'on peut lui demander de n'extraire que certains fichiers de l'archive.

                Certains programmes (grep, sed, find) peuvent interprèter le caractère "*", ce qui fait qu'il faut parfois, euh, l'échapper pour qu'il ne soit pas modifié par le shell.

  • # html2ps

    Posté par  . Évalué à 2.

    Je l'utilise pour convertir rapidement une doc html en pdf (via ps2pdf).
  • # Sous forme de liens ?

    Posté par  . Évalué à 2.

    Bonjour,


    Salut,

    j'ai trouvé (grâce à vous chers lecteurs) une très belle documentation html,


    Oui ? Laquelle ?
    Tu peux nous filer un lien ?

    du coup j'aimerais pouvoir la lire facilement. Elle est sous la forme de liens...donc soit je passe beaucoup de temps à faire un documentation openoffice et j'imprime soit il existe un utilitaire pour faire facilement une transformation.


    Ca dépend beaucoup de ce que tu veux faire. Quand tu dis "elle sous forme de liens", ça veut dire qu'elle est sur plusieurs pages ?

    Si elle formatée en HTML de base, noir sur blanc avec des liens bleus, il y a de fortes chances pour qu'elle soit elle-même issue d'un document SGML ou DocBook. Dans ce cas, la version continue est en général sur le même site, ainsi que la source en Sgml. Il te suffit donc de récupérer ce fichier-là pour le transformer ensuite en n'importe quoi.

    Sinon, avant de concaténer tes pages, il te faut déjà toutes les récupérer. La commande wget avec l'option -r peut suivre récursivement les liens HTML et donc se comporter en aspirateur de site. Attention toutefois à ne pas être indélicat vis-à-vis du serveur.

    Merci de vos réponses (eh oui avec un s optimiste le gars).


    T'en a déjà six, donc ça rentre.

    Cordialement


    De même.

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.