Forum Astuces.divers Graver la copie d'un site internet

Posté par  (Mastodon) . Licence CC By‑SA.
Étiquettes :
0
30
sept.
2016

Bonjour à tous,

Là où je travaille, je dois faire la sauvegarde "statique" d'un ancien site internet, navigable.
J'ai récupérer le contenu du site à l'aide de wget, et je souhaite maintenant graver ce site sur dvd, qu'on en parle plus…

Ce site est base une CMS "old school", avec des noms compliquées pour les ressources avec plein de paramètres passés dans les requêtes, sensible à la casse, long…

Ma copie statique doit être navigable. J'ai essayé de graver la copie avec brasero, mais elle n'est pas navigable : les noms des fichiers trouvés générés par wget sont renommés pour la gravure, et du coup j'ai des fichiers manquants car les liens dans les pages pointent sur fichiers qui ont été renommés.

J'ai essayé d'utiliser le format de système de fichier udf pour la génération de mon iso, mais ça ne marche pas…

Avez-vous déja rencontré ce genre de problème ? Comment le solutionner ? Je pense qu'il doit exister des scripts (en PERL, j'en suis quasi-sûr) pour gérer de type de problématique, mais je n'ai pas vraiment le temps de me lancer à coder un truc comme ça (et puis mon PERL est tout rouillé, ça fait 10 ans que je n'y ai pas mis les pieds)

PS : bien sûr, le dvd doit être lisible sous windows :)

Merci d'avance de vos piste !

  • # archive + avfs

    Posté par  . Évalué à 1. Dernière modification le 30 septembre 2016 à 11:35.

    bonjour,

    une solution pourrait etre de créer une archive à graver sur le dvd, puis de naviguer dedans à l’aide de avfs

    un exemple d’utilisation :

    thiss virtual fs to browse through

    edit : ah oui, pour windows, je ne vois pas par contre

  • # Option wget

    Posté par  (site web personnel) . Évalué à 3. Dernière modification le 30 septembre 2016 à 13:26.

    Dans la documentation il y a une option --restrict-file-names qui peut éventuellement te dépanner (permet de choisir comment sont traités les caractères spéciaux dans les noms de fichiers générés).

    Cf https://www.gnu.org/software/wget/manual/wget.html

    Voir aussi éventuellement --local-encoding--convert-links

    Python 3 - Apprendre à programmer dans l'écosystème Python → https://www.dunod.com/EAN/9782100809141

  • # Httrack

    Posté par  . Évalué à 2.

    J'ai déjà utilisé Httrack qui permet de naviguer dans la copie du site téléchargé. Il faudrait ensuite graver la copie du site.
    http://www.httrack.com/page/1/fr

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.