Forum Linux.debian/ubuntu Petits blocages depuis le kernel 2.6.31

Posté par  (site web personnel) .
Étiquettes :
2
16
déc.
2009
Bonjour,

J'utilise une Debian "Sid" depuis longtemps sans problème, mise à jour régulièrement (en gros une fois par semaine).
Depuis le passage au kernel 2.6.31 et c'est toujours le cas avec le 2.6.32 (mais cela peut dater de la 2.6.30, je ne le garantirai pas), j'ai constaté que j'avais régulièrement des petits "blocages" : l'affichage se fige, la musique s'arrête pendant quelques secondes, puis tout repart comme si rien ne s'était passé. Aucune trace dans les logs, aucun message !
À noter par ailleurs :
- cela peut se produire sans que la machine n'ait d'activité particulièrement importante
- cela suffit pour parfois faire planter certains processus (comme par exemple Jackd si j'ai un client connecté au moment de l'arrêt).

Quelques éléments de configuration :
- processeur Intel Core 2 Duo (3 GHz)
- carte graphique NVidia avec drivers propriétaires (je sais, c'est mal...)
- 5 disques durs SATA (dont 3 en RAID 5)
- environnement Gnome avec Compiz-Fusion

Si quelqu'un a une petite idée du pourquoi de la chose et/ou sur la façon d'en trouver l'origine, je suis bien évidemment preneur...

À bientôt,
Thierry
  • # Kernel

    Posté par  . Évalué à 2.

    Le coupable le plus courant dans ce cas la c'est un driver.
    Pas de trace suspecte avec dmseg ?
    Alors la seule solution c'est de changer petit a petit les drivers les uns les autres pour voir de qui ca pouvait venir.
    Je commencerais par changer le driver nvidia par l'equivalent libre, puis il faudra déactiver les autres, soit au démarrage, soit par un rmmod.
  • # top, oprofile, SystemTap

    Posté par  (site web personnel) . Évalué à 3.

    Le plus simple je pense que c'est de commencer par laisser tourner top -b > top.log ou un truc du genre et de voir si tu trouves quelque chose d'anormal là dedans quand le problème se produit. Typiquement, soit tu vas voir un pic de consommation CPU, soit des I/O disque.

    Pour les pics CPU, OProfile et/ou sysrq-w peuvent t'aider à comprendre ce que le système fait exactement. Pour les I/O, SystemTap, blktrace et sysrq-t.

    Sinon pour limiter le champ d'investigation, tu peux aussi éliminer des éléments jusqu'à ce que le problème disparaisse.

    pertinent adj. Approprié : qui se rapporte exactement à ce dont il est question.

    • [^] # Re: top, oprofile, SystemTap

      Posté par  (site web personnel) . Évalué à 1.

      Il y a une paire d'outils bien pratiques pour monitorer tout ça: sar et kSar. Voir [http://www.cyberciti.biz/tips/identifying-linux-bottlenecks-(...)].
      • [^] # Re: top, oprofile, SystemTap

        Posté par  (site web personnel) . Évalué à 2.

        sar va te dire si t'as des pics d'I/O ou de CPU mais il ne va même pas te dire le thread concerné. top, oui.

        pertinent adj. Approprié : qui se rapporte exactement à ce dont il est question.

        • [^] # Re: top, oprofile, SystemTap

          Posté par  (site web personnel) . Évalué à 1.

          J'ai fait quelques tests avec SysStats mais je n'ai encore rien trouvé de concluant.
          Manifestement la "résolution" de ce type d'outil n'est pas suffisante pour arriver à déterminer l'origine de mes problèmes...
          Mais j'ai par ailleurs constaté un petit souci avec la dernière version de JackD (la 0.118) qui a tendance à planter régulièrement. Est-ce que les deux pourraient être liés ?? Affaire à suivre, mais JackD même en mode "verbeux" ne s'avère pas très bavard...
          • [^] # cap'tain obvious sez

            Posté par  (site web personnel) . Évalué à 2.

            Ben tu tues jackd et si le problème apparait toujours tu sais que c'est pas ça.

            pertinent adj. Approprié : qui se rapporte exactement à ce dont il est question.

            • [^] # Re: cap'tain obvious sez

              Posté par  (site web personnel) . Évalué à 1.

              Ben... c'est ce que je viens de faire...
              J'attends de voir si cela a quelque effet, n'ayant pas encore trouvé de moyen simple de forcer l'apparition du problème (le fait de "stresser" la machine ne semblant pas avoir d'incidence particulière sur les symptomes) :-(
  • # Bonjour Thierry

    Posté par  . Évalué à 1.

    J'ai exactement le même problème que toi.

    3 disques en RAID 5 (3 * 1To)
    2 disques en RAID 1 (2 * 40 Go)
    4 tuner TV (2 * MCE500)
    Carte NVIDIA onboard avec driver proprio
    Mythtv en version 0.22 + fix
    le kernel est 2.6.31.16 ou 17

    Je regarde un film et de manière aléatoire l'image se fige pendant quelques secondes, de même pour la musique. Cela peux se produire 3 ou 4 fois sur la durée d'un film ou ne pas se produire. Pour visionner un film je n'utilise pas le moteur de rendu inclus dans Mythtv mais mplayer.

    Aucun messages provenant du kernel n'est remontés.

    As-tu des nouvelles ? mon intuition me dit que cela à un rapport avec le RAID software.

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.