Forum Programmation.shell wget récursif mais pas tout, juste sur certaines urls

Posté par  .
Étiquettes :
0
5
juil.
2005
Bonsoir,

Dans cet article il présente le wget :
http://www.framasoft.net/article1871.html(...)

il donne la commande wget -rkpE http://www.framasoft.net/(...)
si je souhaitais par exemple faire un backup uniquement des articles de framasoft c'est à dire uniquement les url qui contiennent la chaîne de caractère : "article"

naïvement (?) j'ai fait un :

wget -rkpE http://www.framasoft.net/(...) | grep article

mais cette commande me donne le même résultat sans le grep

il y a t'il une solution à cette enigme ?


PS: j'avais pensé a faire un script avec un lynx -dump ... et un wget des résultats mais j'aurais aimé le faire plus simplement sans script.Qu'il télécharge juste ce que je veux et pas tous le site.

merci d'avance

Cdlt,
  • # RTFM

    Posté par  (site web personnel) . Évalué à 7.

    Bonsoir,

    un man wget (ou info wget) t'apprend que wget a une option -A (ou --accept).
    Ainsi, en rajoutant:
    -A *article*
    tu ne téléchargeras que les pages dont le nom contient 'article'. Tu peux aussi ajouter les images (-A *article*,*.png), etc.

    Pour ton "énigme", grep traite la sortie standard de ton application, et non les fichiers qu'elle télécharge (man grep?)

    n sprnt q ç t'dr

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.