Forum Linux.debian/ubuntu Gros plantage étrange

Posté par (page perso) .
Tags : aucun
2
10
avr.
2011

Bonjour, j'ai eu aujourd'hui un bon gros plantage de ma machine, et je cherche à savoir si il pourrait se reproduire.

À un moment, je branche ma souris, et je me rends compte que malgré le fait qu'elle est alimentée, elle n'est pas détectée. Aucun problème au niveau de la souris, car elle fonctionnait 10 secondes avant (passage d'un ordi à un autre), et 30 secondes après (vérification sur l'autre ordi). C'est peut-être l'usb qui avait un problème, mais je n'ai pas vérifié.

Un peu plus tard, je met l'ordinateur en veille. Au retour de veille, je me retrouve avec un écran noir, avec juste la souris (dirigée par le trackpad puisque l'usb était en grève) qui clignote à chaque déplacement.

Je me suis dit que c'était unity qui avait pété un plomb. Dans une console virtuelle (ctrl alt f1) que j'avais déjà ouverte, je relance donc gdm : «sudo service gdm restart».

Et là, sudo me fait un segfault. Étrange. Je teste avec ls, et là aussi, un segfault.

Voyant le bordel, je tente de me connecter en root, pour rebooter, mais impossible, que des erreurs de segmentation mémoire.

Là, j'ai certainement fait ce qu'il ne fallait pas faire, le reboot à l'arrache sans passer par les touches magiques super compliquées que je ne retiens jamais.

Donc après avoir éteint électriquement la machine, le boot a été assez sympathique. Plus de système. Avec un livecd, je me rends compte que la table de partitions a disparue.

Je tente testdisk, mais il ne fonctionne pas, et photorec qui me retrouvera uniquement mon historique zsh (et pas mon travail de la matinée, évidemment).

Donc bref, j'ai tout réinstallé proprement, et je fait des git pull toutes les 30 secondes en attendant de voir pourquoi ça a fait ça.

J'ai fait un memcheck récemment, mais je vais en refaire un après avoir posté ce message. À priori, la mémoire est bonne pourtant.

Voici les informations capitales :

  • J'utilise Ubuntu 11.04 en béta sur de l'amd64
  • J'ai depuis deux jours un SSD OCZ qui bombarde, mais qui est une cause probable de ces erreurs (enfin, la perte de l'usb, je vois pas le lien, et à prioris, ls et sudo étaient dans le cache en ram du noyau).

Donc est-ce un bug super rare de corruption mémoire dans le noyau qui a tout fait planter ? Est-ce mon SSD qui fait de la merde ?

Quel est votre avis ?

  • # Problèmes similaires avec Ubuntu 10.10

    Posté par (page perso) . Évalué à 5.

    Sur une machine d'un utilisateur que "j'administre de loin" (ie: je lui ai installé une Ubuntu, et il m'appelle lorsqu'il a des problèmes), j'ai des problèmes assez semblables:

    • le / a été perdu 3 fois de suite, complètement irrécupérable. Un "hexdedit" sur la partition montre une structure anormal (ce n'était plus du ext4). fsck.ext4 a tout cassé plutôt que réparer. J'ai dus tout réinstaller "from scratch".
    • le /home a aussi été corrompu à une occasion. Par chance, fsck.ext4 a pu corriger les problèmes.

    J'ai peu d'information sur ce qui s'est passé sur la machine, mise à part que de temps en temps X plante complètement et la que machine se retrouve sous GDM (login graphique). Passé un temps d'ailleurs, il suffisait d'aller sur une page web de la BBC (avec firefox) pour arriver à planter X. La même page, visualisé en même temps avec une Debian Wheezy/Testing ne posait pas de problème.

    A une occasion, j'ai pu prendre la main à distance suite à un crash, et j'ai retrouvé un "load" de 8, qui montait sans cesse. Le /var/log/kern.log était remplit d'erreurs de plantages du module "ati"

    De temps en temps, les crashs faisaient tellement planter que le système, que l'utilisateur ne pouvait faire autre chose que d'arrêter la machine en force.

    J'en ai déduit que ext4 supportait très mal les arrêts en force. Et comme l'indique la dernière dépêche sur le dernier kernel Linux https://linuxfr.org/news/le-noyau-linux-est-disponible-en-version-2638#RC-5 / https://lkml.org/lkml/2011/2/12/50 , des problèmes "assez sérieux" ont été corrigés sur ext4 ("fairly serious regressions").

    En solution temporaire, les partitions sont maintenant formatées en ext3.

Suivre le flux des commentaires

Note : les commentaires appartiennent à ceux qui les ont postés. Nous n'en sommes pas responsables.