Bonjour cher journal...
J'ai besoin de ton aide car j'ai un serveur en production qui crash
regulierement (tous les 2j ) et je ne sais vraiment plus quoi faire :(
Le serveur fais souvent des oops ou se fige tout simplement. On
arrive parfois a recuperer une stack dans le kernel :
call_do_irq
sock_def_write_space
sock_wfree
__kfree_skb
net_rx_action
net_tx_action
do_softirq
do_IRQ
call_do_IRQ
le kernel est un 2.4.20-28.8smp sur une redhat 8.0...
Merci pour ton aide
# Plus d'infos
Posté par Obsidian . Évalué à 4.
Peux-tu donner plus d'infos ? Est-ce arrivé du jour au lendemain, suite à une mise à jour logicielle, ou bien est-ce que cela a toujours été le cas ?
Si récement ton serveur s'est mis à faire des crashs sévères et complètement sans raison, il est fort possible que ce soit hardware:
1) Une RAM défectueuse (memtest86).
2) Une machine plus assez ventilée. As-tu rajouté du matériel autour de ton serveur récement ?
Bon courage.
[^] # Re: Plus d'infos
Posté par Nong . Évalué à 1.
[^] # Re: Plus d'infos
Posté par Obsidian . Évalué à 2.
J'ai recompilé un noyau pour ma machine récement, et me suis mis à me prendre des « Oops » noyau au démarrage, après le lancement de Init et des trucs à RedHat.
Après une brève recherche, je me suis rendu compte que j'avais compilé le noyau pour le mauvais processeur, en l'occurence Pentium 3 au lieu du P2 de la machine en question.
Moralité, surveillez toujours cette entrée car par défaut, le noyau est configuré pour compiler sur le processeur le plus courant. Celui-ci change avec le temps.
[^] # Re: Plus d'infos
Posté par methos . Évalué à 1.
Il arrive fréquemment à un des serveurs de prod installé chez un de nos clients de crasher très souvent(auparavant tous les 15 jours, à présent tous les 2/3 jours).
Nous utilisons exactement la même version de kernel, et la même distrib Linux.
La pile d'appel de fonctions est similaire à celle que tu as mis dans ton post.
Utilise oracle, quelle version de gcc, helios Ethershare ??? ...
# Crash repete serveur linux
Posté par chl (site web personnel) . Évalué à 4.
regulierement (tous les 2j ) et je ne sais vraiment plus quoi faire :(
Le serveur fais souvent des oops ou se fige tout simplement.
Ca fait ca depuis le debut de la mise en prod ? Sinon qu'avez vous fait avant que ca "crash" tous les 2j ?
Vous avez essayé de mettre a jour le noyau ?
Le dernier 2.4 est le 2.4.27
Suivre le flux des commentaires
Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.