Journal C14 l'archivage chez Claude

Posté par  . Licence CC By‑SA.
Étiquettes :
19
26
juin
2016

Dans la série des sauvegardes en ligne, voici C14 (attention pub, fermez les yeux) https://www.online.net/fr/c14 que j'ai testé hier.

Le prix est très attractif 0.002 €/Go/mois + 0,01 € par Go par opération, mais attention c'est de l'archivage, pas du partage de fichiers.

Le principe est simple, on crée une archive qui nous ouvre un espace de stockage temporaire accessible par ssh (rsync, scp, sftp) ou ftp ou webdav pendant 7 jours (ou moins). Ensuite on copie tout ce qu'on veut dedans et on attend 7 jours ou on lance l'archivage. L'archive en question est alors réellement archivée (dans un abri soit disant anti-atomique) et on n'y a plus accès. Si on veut retrouver nos données il faut commencer par désarchiver, ce qui donne théoriquement accès au stockage temporaire et ainsi de suite. Chaque archivage/désarchivage compte pour une opération, dont le coût dépend du volume.

L'UI est très claire, il y a également une API, les transferts sont très rapides (je n'ai pas mesuré car je suis parti d'un serveur utilisé que je ne voulais pas plomber). J'apprécie de pouvoir utiliser rsync et une clé ssh ! Les données sont théoriquement cryptés, on récupère la clé et on l'efface de leur interface. Les données sont dupliquées sur plusieurs machines mais toutes au même endroit à priori.

Pour l'instant je n'ai pas pu restaurer d'archive, ça boucle sans fin depuis hier. Un ticket est ouvert, un admin est entrain de creuser (l'abri anti atomique ? car une petite étoile mentionne qu'il n'est finalement pas encore accessible).

Bref, voilà une solution à la hauteur du tarif c'est à dire pas encore abouti mais qui pourrait le devenir, qui sait ?

  • # Backup Incrémental ?

    Posté par  . Évalué à 1.

    Le tarif est attractif, mais je n'ai pas compris le coût que pourrait avoir un backup incrémental. J'ai l'impression que ce n'est pas du tout fait pour et qu'il faudra débourser la somme d'un désarchivage complet à chaque incrément, ce qui n'est pas du tout rentable. Vous avez compris ça comme moi ?

    • [^] # Re: Backup Incrémental ?

      Posté par  (site web personnel) . Évalué à 2.

      C'est ce que j'ai compris également.
      C'est d'ailleurs le fonctionnement de la plupart des solutions de ce type, comme Amazon Glacier.

      Peut-être y a-t-il des solutions de backup spécifiquement adaptées à ce type d'outils…

    • [^] # Re: Backup Incrémental ?

      Posté par  . Évalué à 2.

      Tu as bien compris, ça n'est pas adapté à de l'incrémental.

      Ou bien avec http://mattmahoney.net/dc/zpaq.html qui permet de créer un nouveau fichier à chaque incrément et donc d'archiver ce nouveau fichier, mais ça ne serait pas très pratique pour désarchiver.

      Je n'ai pas précisé mais la suppression est également payante, c'est une opération (donc coût en fonction du volume), du coup un jonglage avec les archives aurait un coût.

    • [^] # Re: Backup Incrémental ?

      Posté par  (site web personnel) . Évalué à 2.

      Effectivement, tu ne pourras pas faire de backup incrémental en branchant juste C14, mais si ta solution de backup te permet de sauvegarder l'index des blocs existants en parallele des blocs de données, alors tu peux te débrouiller pour n'envoyer que les blocs de données dans C14. Si ton logiciel est bien fichu, le(s) fichier(s) d'index peut dans le pire des cas être régénéré depuis les blocs de données, au pire tu peux le(s) sauvegarder dans un autre système accessible plus dynamiquement tel que S3.

  • # _o/

    Posté par  . Évalué à 10.

    Pour l'instant je n'ai pas pu restaurer d'archive, ça boucle sans fin depuis hier.

    C'est parce que je stocke dans /dev/null.

    « Rappelez-vous toujours que si la Gestapo avait les moyens de vous faire parler, les politiciens ont, eux, les moyens de vous faire taire. » Coluche

    • [^] # Re: _o/

      Posté par  . Évalué à 8.

      Niveau confidentialité des données y a pas mieux \o/

    • [^] # Re: _o/

      Posté par  . Évalué à 2.

      Le bug a été corrigé avec un appel téléphonique pour me prévenir. Un bon point Claude.

  • # cryptés

    Posté par  (site web personnel) . Évalué à 10. Dernière modification le 27 juin 2016 à 07:48.

    Chiffrées ! A moins qu'elles ne soient dans une crypte anti atomique :)

    https://fr.wikipedia.org/wiki/Cryptographie

    Is it a Bird? Is it a Plane?? No, it's Super Poil !!!

  • # Merci

    Posté par  (site web personnel, Mastodon) . Évalué à 3.

    Merci de l'explication parce que le site est tellement jargon que j'avais rien pigé comment ça marchait.

    Du coup c'est pas fait pour des backups, c'est pas du stockage personnel type cloud/drive, donc j'ai pas compris à quoi ça sert si on peut pas l'utiliser pour les backups ni comme stockage…

    « Je vois bien à quels excès peut conduire une démocratie d'opinion débridée, je le vis tous les jours. » (Nicolas Sarkozy)

    • [^] # Re: Merci

      Posté par  . Évalué à 3.

      C’est pour archiver des données que tu veux/dois garder X temps, mais que tu n’auras besoin d'y accéder que rarement voir jamais.

      • [^] # Re: Merci

        Posté par  . Évalué à 3.

        Rarement OK, voir très rarement. Mais jamais c'est quoi le but dans ce cas ? C'est pour créer des données fossiles pour les générations futures ?

        • [^] # Re: Merci

          Posté par  (site web personnel) . Évalué à 7.

          Des logs que tu dois légalement garder mais que ça te fait chier et qui ont une probabilité nulle de devoir être consultés. Comme ça tu respectes la loi, ils sont disponibles si un juge les veut, et tu factures.

          • [^] # Re: Merci

            Posté par  . Évalué à 2.

            Touché. Merci, j'arrivais pas à trouver un cas concret.

            • [^] # Re: Merci

              Posté par  . Évalué à 5.

              Autre cas concret : avoir énième une copie de tes fichiers précieux, et tu y accédera uniquement si :
              − google a perdu la copie dans leur cloud
              − La maison de la tante chez qui tu en gardait une autre copie a brûlé
              − Tu as oublié la clé qui chiffre la copie que tu garde sur ton NAS
              − etc.

          • [^] # Re: Merci

            Posté par  (site web personnel, Mastodon) . Évalué à -2.

            Les logs doivent être supprimés après un an… C'est justement la loi qui le dit…

            « Je vois bien à quels excès peut conduire une démocratie d'opinion débridée, je le vis tous les jours. » (Nicolas Sarkozy)

            • [^] # Re: Merci

              Posté par  . Évalué à 5.

              Dans le monde hospitalier et l'éducation il y a une obligation de rétention des dossiers plusieurs années.

              Tous les contenus que j'écris ici sont sous licence CC0 (j'abandonne autant que possible mes droits d'auteur sur mes écrits)

            • [^] # Re: Merci

              Posté par  (site web personnel) . Évalué à 1.

              Tu as lu ça où ?

              Je crois plutôt que les logs de connexion doivent être conservés au minimum un an. Si tu les gardes plus longtemps, ça passe aussi.

              • [^] # Re: Merci

                Posté par  (site web personnel, Mastodon) . Évalué à 2.

                Pas compris pourquoi j'ai été moinssé, encore des gens qui ne savent pas lire…

                Donc je ne sors pas ça de mon chapeau mais du le code des postes et télécommunications, article L34-1 III:

                https://www.legifrance.gouv.fr/affichCodeArticle.do?cidTexte=LEGITEXT000006070987&idArticle=LEGIARTI000006465770

                III.-Pour les besoins de la recherche, de la constatation et de la poursuite des infractions pénales ou d'un manquement à l'obligation définie à l'article L. 336-3 du code de la propriété intellectuelle ou pour les besoins de la prévention des atteintes aux systèmes de traitement automatisé de données prévues et réprimées par les articles 323-1 à 323-3-1 du code pénal, et dans le seul but de permettre, en tant que de besoin, la mise à disposition de l'autorité judiciaire ou de la haute autorité mentionnée à l'article L. 331-12 du code de la propriété intellectuelle ou de l'autorité nationale de sécurité des systèmes d'information mentionnée à l'article L. 2321-1 du code de la défense, il peut être différé pour une durée maximale d'un an aux opérations tendant à effacer ou à rendre anonymes certaines catégories de données techniques.

                Il faut bien rappeler que la conservation de logs est une exception à la règle qui doit être de ne rien conserver… Donc conserver après un an des données non anonymisées est illégal.

                Évidemment tu ne trouvera pas beaucoup de policier qui fait une enquête et qui va t'engueuler parce que tu as gardé les données 3 ans au lieu d'un an et que du coup il a accès à ces données… Mais quel est l'intérêt de l'hébergeur ? Pour moi c'est respecter ses clients et la loi…

                « Je vois bien à quels excès peut conduire une démocratie d'opinion débridée, je le vis tous les jours. » (Nicolas Sarkozy)

                • [^] # Re: Merci

                  Posté par  . Évalué à 3.

                  Pas compris pourquoi j'ai été moinssé, encore des gens qui ne savent pas lire…

                  Où alors, c'est toi. Personne ne parle spécifiquement des logs de connexion. Il y a plein de log différents (log d'accès à une machine, à une salle à accès restreint…).

                  « Rappelez-vous toujours que si la Gestapo avait les moyens de vous faire parler, les politiciens ont, eux, les moyens de vous faire taire. » Coluche

                  • [^] # Re: Merci

                    Posté par  (site web personnel, Mastodon) . Évalué à 0.

                    Ou alors c'est toi. Je ne fait que répondre à ce commentaire moi, qui parle des logs légaux:

                    Des logs que tu dois légalement garder mais que ça te fait chier et qui ont une probabilité nulle de devoir être consultés. Comme ça tu respectes la loi, ils sont disponibles si un juge les veut, et tu factures.

                    « Je vois bien à quels excès peut conduire une démocratie d'opinion débridée, je le vis tous les jours. » (Nicolas Sarkozy)

                    • [^] # Re: Merci

                      Posté par  . Évalué à 4.

                      Je ne fait que répondre à ce commentaire moi, qui parle des logs légaux

                      Les logs légaux ne se limitent pas au logs de connexion à un service web.

                      « Rappelez-vous toujours que si la Gestapo avait les moyens de vous faire parler, les politiciens ont, eux, les moyens de vous faire taire. » Coluche

        • [^] # Re: Merci

          Posté par  (site web personnel) . Évalué à 1.

          Mais jamais c'est quoi le but dans ce cas ?

          L'idée derrière un backup est d'en n'avoir jamais besoin.
          Mais quand tu en as besoin (ton RAID1 qui casse jamais… a cassé), tu es content.

          Les backups, c'est 99% inutile, dont tu n'as jamais besoin. Mais tu ne sais jamais de quel 1% tu vas avoir besoin.

          • [^] # Re: Merci

            Posté par  . Évalué à 6. Dernière modification le 27 juin 2016 à 22:45.

            Les backups, c'est 99% inutile, dont tu n'as jamais besoin.

            Le but ce n'est jamais de faire une sauvegarde. C'est d'être capable de faire une restauration. Or la seule façon de t'assurer que la restauration fonctionne et que tout est OK c'est de le faire.

            Donc si tu as besoin d'une sauvegarde, tu as besoin d'accéder aux données régulièrement. Sinon tu crois au père noël.

            Mais quand tu en as besoin (ton RAID1 qui casse jamais… a cassé), tu es content.

            Un RAID1 ne protège que d'un tout petit sous ensemble des problèmes possibles. Il ne peut rien contre une erreur d'administration, une corruption lente du à un bug etc.

            • [^] # Re: Merci

              Posté par  (site web personnel) . Évalué à 3.

              Le but du RAID 1 n'est pas de faire des sauvegardes mais de faire de la haute dispo. Du coup c'est normal qu'il ne protège pas des erreurs humaines.

          • [^] # Re: Merci

            Posté par  . Évalué à 6.

            Tu confonds :

            • le backup

            qui est une sauvegarde qui doit être facilement disponible, qui n’a pas vocation à stocker des données "anciennes" mais plutôt ce qui est nécessaire de mettre à disposition rapidement, en cas de crash du système ou de simple erreur de manipulation, des données « fraîches »… là il y a de la rotation…

            • l’archivage

            où il s’agit de conserver des données de la manière la plus pérenne, sans considération d’accessibilité immédiate, mais plutôt de plan à long terme pour transférer les données de support au grès des avancées technologiques…

            • [^] # Re: Merci

              Posté par  . Évalué à 3.

              Il me semble que l'archivage apporte aussi la notion d'être consultable dans les générations futures sans obligation d'un type de logiciel et/ou matériel spécifique…

              • [^] # Re: Merci

                Posté par  . Évalué à 3.

                être consultable dans les générations futures sans obligation d'un type de logiciel

                Oui, d’où l’intérêt des formats ouverts.

                ou matériel spécifique…

                Pour le matériel malheureusement on est forcément lié a un matériel spécifique.

                Si tu as tes archives sur LTO3 par exemple il va falloir prévoir de passer un jour à LTO5 (ou un autre support plus récent) avant que les lecteurs compatibles LTO3 disparaissent.

                Ton archivage est forcément lié à un matériel donné, à un moment donné. Et il devra être transféré régulièrement de matériel en matériel au gré des avancées technologiques.

                • [^] # Re: Merci

                  Posté par  . Évalué à 1.

                  On est pas forcement lié à un matériel donné…

                  article slate sur l'enfouissement de déchets radioactifs

                  Par exemple dans cet article on y dit qu'une solution déjà adoptée pour ça c'est… Le papier ! Avec de l'encre et tout, low-tech (même si c'est du papier super hi-tech). Mais là, c'est vrai que c'est assez particulier, il y a relativement peu de données, qui doivent être accessible vraiment très longtemps.

            • [^] # Re: Merci

              Posté par  (site web personnel) . Évalué à 1.

              Tout à fait. Et c'est très classique, dans ce cas, de faire payer la récupération des données. Il y a même des outils (amazon glacier il me semble, mais plus tout à fait sûr) qui fait payer très peu la récup si tu acceptes de l'avoir "sous 7 jours" (oui, 7j, pas de faute de frappe), un peu plus cher si tu veux ton fichier sous 1j, cher si tu la veux sous 8H et horriblement cher si tu la veux dans l'heure (genre un facteur 100 entre 7j et 1H)

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.