Journal Corruption de systèmes de fichiers

Posté par  .
Étiquettes :
0
27
mar.
2004
Bonjour cher journal,

Voilà, ça devait bien arrivé un jour ou l'autre : le système de fichiers de mon serveur corrompu. Comme tout bon serv' qui se respecte, je rebootais très peu souvent, si bien que ça faisait 280j que ma partition /home n'avait pas été analysée par fsck (j'en étais à 71j d'uptime).

Comme tous les jours, j'allume mon PC de bureau (dual boot Slackware / XP) et me décide à ranger un peu mon /home via Windows (partages Samba) mais là, ho surprise, tout est en lecture seule... hum ... bizarre.
Je lance donc un SSH et en effet, apparemment, tout le FS s'est auto-remonté en read-only (y'a surement des erreurs ce qui explique le remontage automatique).
Bref, je lance un fsck.ext3 et là, c'est le bins', tout part en c****, ça arrete pas de me poser des question (ignorer l'erreur, re-écrire l'inoeud, ...etc). Du coup, je bascule en mode intéractif en forçant toutes les réponses à 'yes' (option '-y'). Après plusieurs reboot et plusieurs fsck le système de fichiers est dit "clean". Tellement clean que j'ai perdu plein de données. Alors après on me fait les éloges de ext3 car c'est journalisé, que c'est génial, meme si le PC crashe, on recouvre ses données, blabla ... Là mon serv n'a pas planté, à croire que le FS a été / s'est corrompu au cours de la nuit, comme ça, par enchantement (car il est complètement coupé du net donc impossible que ce soit un virus, une attaque ou quoi que ce soit d'autres).

Ca fait deux fois que ça m'arrive sous Linux alors que sous Windows c'est bp plus rare (pour mon expérience en tout cas (c pas un troll, 'suis trop énervé par cette histoire pour lancer des trolls gratuits)). Bref, maintenant, je me demande QU'EST-CE QU'IL FAUT FAIRE pour conserver l'intégrité des données sur un serveur sous Linux mis à part des sauvegardes. Changer de FS (xfs par ex.) ? Démonter le /home pour l'analyser chaque mois par exemple ?

Et sinon, qu'est-ce qui a pu se passer sur mon FS pour qu'il plante comme ça ss raison alors que la veille il n'y avait aucun pb ?

Autant de questions qui trouveront peut-être réponses, grâce à toi, journal chéri :)
  • # Re: Corruption de systèmes de fichiers

    Posté par  . Évalué à 2.

    Avant qu'acuser le fs a tu verifier si ton disque n'etait pas en train de te lacher ?
  • # Re: Corruption de systèmes de fichiers

    Posté par  (site web personnel, Mastodon) . Évalué à 1.

    Mon routeur tourne en ext3 sans interruption depuis septembre. Il a un uptime actuel de 110 jours (il est dans une armoire et un livre est tombé sur le boutton reset il y'a quelques mois).

    Je n'ai aucun problème, ni même l'ombre d'un problème.

    Je penche donc plutôt pour un disque dur déffectueux.

    Dans ce cas là, je comprendrais que l'ext3 pose problème. en effet, la journalisation entraine qu'il y'a des accès au disque beaucoup plus fréquent, même quand celui-ci n'est pas utilisé.

    Si donc ton disque est déffectueux (une tête de lecture trop proche d'un disque par exemple), le problème apparaitra beaucoup plus vite sur un système journalisé que sur un système non journalisé (du moins si ton serveur n'est pas soumis à de fortes requêtes).

    Solution : changer de disque dur.

    J'ai un amis qui avait plein de problème avec un nouveau disque dur : pertes dedonnées, crash, etc... Il a fait remplacer le disque, il y'a avait en fait un défaut de fabrication.

    Mes livres CC By-SA : https://ploum.net/livres.html

    • [^] # Re: Corruption de systèmes de fichiers

      Posté par  . Évalué à 1.

      C'est vrai que mon disque est souvent utilisé : tout est sur le réseau chez moi (mes musiques, mes vidéos et mes documents personnels), donc le disque fonctionne plusieurs heures par jour.

      Pour info, c'est un Maxtor 120 Go Diamons Plus 9 (8 Mo de cache)
  • # Re: Corruption de systèmes de fichiers

    Posté par  . Évalué à 1.

    raid redondant, sauvegardes régulières. Évidemment ça nécessite une carte raid (quoi que ça doit se faire en logiciel) et éventuellement un périphérique de sauvegarde.
  • # Re: Corruption de systèmes de fichiers

    Posté par  (site web personnel) . Évalué à 1.

    As tu regardé dans /lost+found/ si certains de tes fichiers disparus ne s'y trouvaient pas?
    • [^] # Re: Corruption de systèmes de fichiers

      Posté par  . Évalué à 1.

      shame on me, non. Mais il me semble voir vu pendant les multiples fsck qu'il transférait le contenu de lost+found dans les répertoires adéquats. Je ne suis pas chez moi en ce moment, je regarderai donc ce soir...
  • # Re: Corruption de systèmes de fichiers

    Posté par  (site web personnel) . Évalué à 2.

    Sans vouloir nourri le troll...
    Ca fait deux fois que ça m'arrive sous Linux alors que sous Windows c'est bp plus rare
    Récemment j'installais des drivers d'un souris sur le XP d'un ami. Elle etait sur le port PS2 et on voulait la passer en USB. Une fois le redémarrage effectué, pas de souris dispo. J'éteind, je repasse la souris en PS2, windows fait une verification du système de fichier (tient bizarre), mon ami me demande si c'est grave, je souris en lui disant que non pas du tout. Et là, une fois l'ordi redémarré... plus rien. Xp tout neuf, plus de programmes d'installés, répertoires vides, drivers absents. Ah si, il restait le fond d'ecran. Restauration système inutile. J'avais jamais vu ça, et quand j'en parle aux gens, beaucoup ne me croient pas.
  • # Re: Corruption de systèmes de fichiers

    Posté par  . Évalué à 1.

    et un petit reboot hebdomadaire ne te fera pas de mal : si ton serveur est un PC standard, la ram n'est pas prévue pour tenir 400 jours d'affilée. Ca permettra aussi de purger les fuites mémoires, et de controler les disques de temps en temps.
    • [^] # Re: Corruption de systèmes de fichiers

      Posté par  . Évalué à 1.

      Oui mais c'est pas normal de rebooter un serveur toutes les semaines car le FS a une autonomie de 7 jours ! Je veux bien mais niveau qualité de service ... hum hum (moi c un serveur perso donc je m'en fiche un peu mais dans un cadre professionel ...voilà quoi !)
    • [^] # Re: Corruption de systèmes de fichiers

      Posté par  (site web personnel, Mastodon) . Évalué à 1.

      reboot hebdomadaire [...] la ram n'est pas prévue pour tenir 400 jours [...] purger les fuites mémoires

      Oula, mais c'est qu'il faudrait argumenter tout ça... J'ai un PC standard qui tourne pratiquement sans interruption depuis janvier 1999, avec des uptimes parfois supérieur à 150 jours, et je n'ai jamais eu ce genre de problèmes. Par contre, quand j'ai installé la machine je me suis empressé de configurer pour que le fsck soit systématique à chaque démarrage. Et cette machine tourne vraiment beaucoup (pov + postgresql essentiellement). Voir la charge moyennée sur la journée:
      http://tontonth.free.fr/images/avgload2.gif(...)


      Quand même, ram pas prévue pour tenir 400 jours, il faut être JLA pour comprendre ce que ça veut dire...
      • [^] # Re: Corruption de systèmes de fichiers

        Posté par  . Évalué à 2.

        quand je dis standard, c'estpar exemple de la ram non certifiée ECC. Dans ce cas, les erreurs (infimes certes) se cumulent et deviennent génantes au bout de plusieurs semaines. Bien sûr ça dépend de l'utilisation qui est faite du PC.
        Tout ça pour dire qu'on ne peut pas forcément blamer le système d'exploitation quand on a un plantage au bout d'une semaine.
        Après tu peux avoir de la chance, et tomber sur du bon matériel.
        • [^] # Re: Corruption de systèmes de fichiers

          Posté par  . Évalué à 1.

          c'est faut : soit la RAM et bonne et fonctionne correctement, soit elle est mauvaise et certains bits foirent, mais il n'y a pas d'"erreurs infimes" (c'est quoi des erreurs infimes, des demi bits ?) et encore moins de cumulation. Si elle est mauvaise tu l'échanges contre une bonne là ou tu l'as acheter, tu ne te dis SURTOUT PAS "tiens ma RAM est foireuse, bon, ben je vais rebooter une fois par jour et ca marchera !". Pour info la ram est rafraichit à intervals de temps réguliers (DRAM = dynamic RAM != Static RAM)

          Deuxièmement ECC n'est pas une certification, mais une RAM comportant des bits supplémentaires de correction d'erreurs, ainsi la probabilité que la RAM foire est infime (et la probabilité qu'un bit change une fois tous les 10 ans à cause d'un rayon gamma est nulle ;)

          Ce que tu appeles bon matériel n'est en fait que du matériel en état de fonctionnement, le "mauvais" matériel étant bien sûr à remplacer immédiatement sous peine de problèmes extremement graves ! (pertes de données, kernel panic, plantage d'applis)
  • # Re: Corruption de systèmes de fichiers

    Posté par  . Évalué à 1.

    Il m'est arrivé la même chose hier : erreurs sur le disque détectées au démarrage sans plantage auparavant, lancement de fdisk, et pertes de fichiers. Dans mon cas, ça n'était pas trop grave, seuls des fichiers peu importants ont été touchés et (presque ?) tous récupérés dans lost+found.

    Je n'ai toujours pas compris le pourquoi du comment. Si quelqu'un connait la réponse, je pourrais terminer mon histoire :-) : http://linuxfr.org/~Cyberdivad/10952.html(...)
  • # Re: Corruption de systèmes de fichiers

    Posté par  . Évalué à 1.

    je penche pour le disque .... Car les disques dur de "particuliers" ne sont pas fait pour tourner 24h/24 ... ce qui fait qu'ils meurent très rapidement ( 2-3 mois d'utilisation intensive ).
    • [^] # Re: Corruption de systèmes de fichiers

      Posté par  . Évalué à 1.

      avec mes 6-9 mois je dois donc m'estimer heureux !! Plus qu'à économiser pour un/des SCSI ... :(
    • [^] # Re: Corruption de systèmes de fichiers

      Posté par  . Évalué à 1.

      A chaque fois je vois le temps moyen avant erreur mais le temps de fonctionnement continu. Qu'est-ce qu'il faut acheter pour avoir un disque qui tienne ? SCSI ?
    • [^] # Re: Corruption de systèmes de fichiers

      Posté par  (site web personnel) . Évalué à 1.

      Ca c'est des légendes urbaines, j'ai un IBM 75GXP 45 Go (une mauvaise série a ce qu'il parait ...) qui tourne 24h/24 depuis au moins 3 ans et il fonctionne toujours parfaitement.
    • [^] # Re: Corruption de systèmes de fichiers

      Posté par  . Évalué à 1.

      J'espère que c'est faux ça me ferait ch*** de devoir racheter un disque dur tous les 3 mois. J'ai un disque dur de 80Go dans un serveur NFS et est donc très utilisé la journée et le reste du temps il est sollicité toutes les 5-10 minutes pour récupérer des mails sur le net avec fetchmail + spamassassin.

      De plus j'ai un disque dur qui a bien 5 ou 6 ans (un disque de 680 mégas!) sur mon firewall (pentium 120, 16Mo de RAM) qui est aussi très sollicité et toujours aucun souci...

      Bref j'espère que ce que tu dis n'est que de la légende... En tout cas sur tous les disques que j'ai eu un seul à lâché et c'est après qu'il ait heurté violemment le sol :)
      • [^] # Re: Corruption de systèmes de fichiers

        Posté par  . Évalué à 1.

        "De plus j'ai un disque dur qui a bien 5 ou 6 ans (un disque de 680 mégas!) sur mon firewall (pentium 120, 16Mo de RAM) qui est aussi très sollicité et toujours aucun souci..."

        Oui mais là c'est pas du jeu ! Tous les vieux DD tiennent mieux que les derniers cris (cf. le DD de mon vieux P90 qui tiend tjs la route :))
    • [^] # Re: Corruption de systèmes de fichiers

      Posté par  . Évalué à 1.

      J'ai deux babasses qui compilent dans les 18 heures par jour non stop depuis un an. Les HDs ont 3 ans (un 20 et un 40 Go) plus de 50 000kms dans une soute de bus. Et toujours aucuns problemes. J'ai aussi deux autres 20 Go qui ont 4 et 1 ans qui tourne h24 depuis leur achat pour des taches moins lourde (serveur mail/http). Et jamais aucun problemes.

      C'est meme *tres* solide ces betes la vu ce qu'elles prennent dans la geule.

      Bon j'ai decide de faire souffrir un peu moins mes HD est compilant tout en RAM. Depuis ca gratte moins, ca va plus vite du bonheur quoi.
  • # Re: Corruption de systèmes de fichiers

    Posté par  . Évalué à 1.

    J'ai eu le meme probleme il y a 1 mois !
    ext3, et du jour au lendemain, tous les fichiers creer ou accede depuis 8 jours :
    perdu !

    (mais je fais un backup tous les jours sur un HDD externe !)

    Disque dur Samsung 120Go (repute fiable) 25 % du disque avec des clusters HS !!!

    J'ai change de marque depuis ! (apers avoir gueller sur ext3)

    Salut!
  • # Re: Corruption de systèmes de fichiers

    Posté par  (site web personnel, Mastodon) . Évalué à 2.

    tout bon serv' qui se respecte, je rebootais très peu souvent, si bien que ça faisait 280j que ma partition /home n'avait pas été analysée par fsck

    Tout bon serv' vérifie des systèmes de fichiers à chaque reboot, non ?
  • # Re: Corruption de systèmes de fichiers

    Posté par  . Évalué à 1.

    Alors après on me fait les éloges de ext3 car c'est journalisé, que c'est génial, meme si le PC crashe, on recouvre ses données, blabla
    Encore une légende urbaine. Un système de fichiers journalisé ne garantit en aucun cas la cohérence des données mais uniquement les méta-données.
    En gros, ext3 par défaut (mode ordered) c'est juste un ext2 avec un fsck de 5 secondes maximum.
    • [^] # Commentaire supprimé

      Posté par  . Évalué à 2.

      Ce commentaire a été supprimé par l’équipe de modération.

      • [^] # Re: Corruption de systèmes de fichiers

        Posté par  . Évalué à 1.

        Après tout dépend ce que l'on appelle cohérence des données. Un fichier à moitié écrit ou avec du 'garbage', pour moi c'est pareil. Un fichier cohérent c'est soit il est entièrement bon ou pas du tout écrit sur le disque un peu comme le systèmes des transactions dans les bases de données.
  • # Commentaire supprimé

    Posté par  . Évalué à 2.

    Ce commentaire a été supprimé par l’équipe de modération.

    • [^] # Re: Corruption de systèmes de fichiers

      Posté par  . Évalué à 1.

      /!\ troll detected /!\
    • [^] # Re: Corruption de systèmes de fichiers

      Posté par  . Évalué à 0.

      Sauf que sans vouloir troller, en 10 ans d'informatique sous Windows, j'ai perdu 1 seule fois des données : le disque dur avait laché et était irrémédiablement mort !

      En 2 ans de Linux, ça fait la deuxième fois que suite à fsck je perds des fichiers de travail ! (je précise que c'était toujours sous Mandrake, histoire de peut-être trouver une relation de cause à effet)

      Alors sans vouloir troller, la robustesse de ext3fs ne me semble effectivement pas atteindre celle d'un bon NTFS (je ne parle pas de FAT qui lui m'a par contre perdu un max de données), mais nous sommes peut-être des cas isolés, je ne mets encore cela que sur le compte de la malchance ;o)
    • [^] # Re: Corruption de systèmes de fichiers

      Posté par  . Évalué à 1.

      Hou la maroufle ! Tu te trompes lourdement sur mon cas. Si je suis passé sur Linux, c'est par curiosité, tout simplement :) Je ne fais pas l'apologie de Windows, je fais juste quelques constats sur ma mince expérience.

      Mais d'un autre coté, ton post me rassure, car il montre bien que sur DLFP, il y'a encore, des vrais, des puristes, des extrémistes, des intégristes qui sont la version "geek" des chiennes de gardes à la Alonzo. Donc, merci pour ton post intégriste sans dicernement :)

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.