Retourner aux forums || Retourner au forum Linux.general

Linux.general : wget

Posté par redrum () le 25 octobre 2004
0
avec wget, je ne voudrais télécharger queles fichiers *.pdf d'un site http://monsite.fr(...) tel que la taille du pdf soit supérieur ou égal à 100 Ko.
J'ai potassé la doc de wget mais j'ai pas trouvé mention de cela. QQn a une idée ? merci !

> Lire le message (2 commentaires, moyenne: 2).  

Cette discussion est archivée, il n'est plus possible de laisser des commentaires.

Note : les commentaires appartiennent à ceux qui les ont postés. Nous n'en sommes pas responsables.

Restriction sur les types de fichier

Posté par durandal () le 25/10/2004 à 20:14. (lien). Évalué à 3.

Tu peux ne télécharger que des pdf en utilisant l'option -A (accept) : wget -A pdf site

http://www.gnu.org/software/wget/manual/wget-1.8.1/html_node/wget_1(...)

Pour la limitation en taille, je ne sais pas si c'est possible.

petit script

Posté par Khanh-Dang (page perso, ) le 26/10/2004 à 07:02. (lien). Évalué à 1.

Tu écris un script qui prend la liste de tous les fichiers à télécharger, regarde l'extension du fichier (ou toute autre règle simple à implémenter et qui sert à déterminer le type d'un fichier), qui filtre la taille.

Tu passes ensuite tous ces noms de fichiers à wget pour qu'il les télécharge.

Je ne peux pas t'écrire le script car je ne sais pas à quoi ressemble la page de ton site: est-ce un listing de fichiers du type Apache, ou est-ce que les noms des fichiers sont inclus dans une page html ?

Si tu ne peux pas obtenir la taille, bin je crains que ça ne soit fichu pour toi. Tu peux toujours écrire un patch pour wget, mais je ne sais pas si tu en le temps, ou les moyens :)

Revenir en haut de page || Retourner aux forums || Retourner au forum Linux.general