Forum Linux.noyau Machine Check Exception ?

Posté par .
Tags : aucun
0
13
déc.
2007
Bonjour,

J'ai des plantages réguliers sur une machine AMD64 bi-Opteron 242 avec 4
x 1 Go de RAM que j'utilise comme station de travail.
Le message d'erreur est (par exemple, les adresses mémoires sont
différentes à chaque fois, et il apparait aussi avec 1 Bank 1) :

==
CPU1 - Machine Check Exception
4 Bank 4 : b64e2001000083
TSC 6f6d3c5879 ADDR f160f160

This is not a software problem. Run through mcelog --ascii
to decode and contact your hardware vendor.
Kernel panic. Not syncing.
==

Le problem est lié à l'utilisation de la mémoire, et contrairement à ce
que dit le message, ce n'est probablement pas un problème hardware.
La machine peut quelque fois tourner un mois sans problèmes, suivant
l'utilisation.

J'ai bien évidemment fait tourner Memtest86 plusieurs fois, dont une
fois 19 heures sans aucune erreur. J'ai aussi essayé d'intervertir les
barrettes : même comportement. A noter que je n'ai pas réussi à planter
la machine avec seulement 2 x 1 Go de RAM.

Avec certaines versions du kernel (compilé avec CONFIG_MK8=y), le
plantage est systématique lorsque l'utilisation de la mémoire dépasse
150 Ko à 500 Ko (juste après le boot donc, lorsque l'on lance une
application quelconque). Avec le kernel standard Debian (2.6.22-3-amd64
#1 SMP, CONFIG_GENERIC_CPU=y) le plantage est moins fréquent et plus
aléatoire. Je me demande si j'ai pas un bug du kernel.

J'ai testé plusieurs distributions : Gentoo, Debian 32 bits avec kernel
64 bits, Debian 64 bits, et Ubuntu 64 bits. Le problème se produit dans
tout les cas, sauf avec Debian 32 bits avec kernel 64 bits.

Je n'obtiens aucune information avec

mcelog --ascii
mcelog --ascii --k8
mcelog --ascii --generic

Toute idée et suggestion bienvenue !

Par avance, merci.

Yann
  • # barrette par barrette, proc par proc

    Posté par . Évalué à 1.

    si tu as le temps et que tu peux.

    fait ta config avec mk8 (pas sur que ce soit adapter à un opteron)

    essaie les barrettes une par une.
    essaie eventuellement en mode mono processeur

Suivre le flux des commentaires

Note : les commentaires appartiennent à ceux qui les ont postés. Nous n'en sommes pas responsables.