Forum Programmation.web récupérer du texte, sans se faire brère

Posté par  .
Étiquettes : aucune
0
3
juin
2005
Salut à tous, voilà mon problème :
je veux récupérer du texte ( long plusieurs pages ), à partir d'un site qui génère ses pages en php. Si je fais un coupier coller ça ne marche pas, j'ai regardé les sources de la page, il y a bien mon texte mais il n'est pas totalement en clair ( les accents é et è sont codés ) et la mise en page est perdues, ( avec les illustrations). Quelqu'un a une idée ?
Cordialement.
  • # recuperer du texte

    Posté par  . Évalué à 1.

    enregistrer sous puis "document texte" ne marche pas non plus ?

    ouioui je suis automatiquement invisible sur dlfp *magique*
  • # wget

    Posté par  . Évalué à 1.

    man wget
    voir notamment les options "r" pour recursif et -s pour le mode "spider"
    (de memoire, tout ceci est a verifier)
    • [^] # Re: wget

      Posté par  . Évalué à 2.

      Et -l niveau pour définir le niveau de récursion, et -k pour convertir les liens en local.
  • # Tu es sûr que tu as le droit de faire ça ?

    Posté par  . Évalué à 2.

    Par défaut, si la license du site ne l'autorise pas, c'est interdit.
  • # re

    Posté par  . Évalué à 2.

    utilise la commande lynx avec l'option --dump.

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.