Forum général.général Idées pour provoquer un bug / diagnostic.

Posté par . Licence CC by-sa.
Tags : aucun
6
18
déc.
2019

Bonjour,

On m'a passé un ordinateur portable à réparer qui, assez régulièrement, plante d'un coup : l'écran se fige et contraint l'utilisateur à redémarrer en hard reset.

Problème, je n'ai pas réussi à provoquer le bug en deux jours. Également, c'est sous Windows. J'ai tenté :

  • De lire une vidéo HD sur Youtube pendant plusieurs heures.
  • De jouer à un jeu vidéo pendant plusieurs heures (bon, il tournait en fond).
  • De faire un stress-test (en live linux et sous Windows). Rien à faire, le problème n'est pas apparu et les températures sont normales.
  • Un memtest, pareil, aucun problème.
  • De brancher, débrancher, différents appareils USB.
  • De manipuler l'ordinateur physiquement (rabattre l'écran, le pencher).
  • De lire un DVD.
  • De sortir de veille, d'hibernation, etc.
  • Tous les logiciels courants sur ce PC (pas nombreux, d'ailleurs).

Mais là, je sèche. Pourtant, la personne m'assure que le problème est régulier, lui arrive même en faisant du traitement de texte (j'ai essayé aussi ! )…

Bref, vous avez d'autres idées pour provoquer ce bug ? En gros, tout se fige (comme une fuite mémoire, peut-être…ou un bug graphique…bref, je ne sais pas !).

Ma dernière idée est de mettre l'erreur qui se situe entre la chaise et la clavier devant l'ordinateur, mais c'est contraignant et pour le coup, c'est peut-être moi l'erreur puisque je n'arrive pas à recréer un évènement normal…xD

Merci pour vos suggestions !

  • # PEBKA

    Posté par (page perso) . Évalué à 3 (+1/-0).

    Il m'est déjà arrivé d'avoir des cas de "PC défectueux" qui sont en fait des cas d'usages incorrect par l'utilisateur. Mais pas forcement des usages conscient.

    ça peut être tout simplement des mains qui se placent aux mauvais endroit, ou un potentiel static de l'utilisateur qui est trop important.

    • [^] # Re: PEBKA

      Posté par (page perso) . Évalué à 5 (+3/-0).

      Ou le portable qui ventile mal (encrassé ou le portable est posé sur une surface en textil).
      ça fait typiquement ça, il chauffe et un moment donner le cpu fige pour éviter des dégâts.

      Il faut analyser les conditions d'utilisation.

    • [^] # Re: PEBKA

      Posté par . Évalué à 1 (+0/-0).

      J'essaie effectivement d'avoir d'autres informations, mais le PC est souvent utilisé dans un bureau, il n'y a rien de spécial à noter. C'est propre, aéré. Mais effectivement, cette partie est la plus difficile à cerner. :/

  • # Logs noyau ?

    Posté par (page perso) . Évalué à 4 (+1/-0). Dernière modification le 18/12/19 à 13:28.

    Déporter les logs noyau via le réseau pour avoir une idée de quelle partie matérielle plante ?

    • [^] # Re: Logs noyau ?

      Posté par . Évalué à 1 (+0/-0).

      J'ai accès à l'ordinateur, il fonctionne et ne provoque aucun bug en ma présence.

  • # Sur onduleur, dans une cage...

    Posté par . Évalué à 5 (+3/-0).

    Peut être placer l'ordinateur sur onduleur, et, peut être que chez cette personne il y a des parasites électromagnétiques importants.

  • # Disque dur

    Posté par . Évalué à 2 (+1/-0).

    J'ai eu un cas similaire une fois.
    Je n'ai jamais reproduit le problème.
    Mais la personne me décrivais des écran bleu Windows.
    J'ai fini par remplacer le disque dur.
    Depuis plus de souci.
    Le disque passait pourtant tout les test smart.

    • [^] # Re: Disque dur

      Posté par . Évalué à 2 (+1/-0). Dernière modification le 18/12/19 à 20:21.

      C'est aussi une possibilité, une sorte de déconnexion du DD, quelle qu'en soit la cause. Une idée pour provoquer le bug ? Une grosse écriture peut-être ?

      • [^] # Re: Disque dur

        Posté par . Évalué à 1 (+0/-0).

        Je tenterais un test étendu. Qui va vérifier tout les secteurs du disque. CA lui fera une grosse charge. Et avec un peut de chance il trouvera des secteurs défectueux. C'est le seul indice que j'avais eu sur l'état du disque : un secteur défectueux. Je n'avais jamais eu le cas ou ce secteur fait planter la machine.

        Ton cas est peut être différent. Mais d'expérience les disques sont souvent la cause des pannes.

        Si C'est un ssd, je n'en ai encore jamais vu en panne.

  • # RAM ?

    Posté par . Évalué à 3 (+1/-0). Dernière modification le 18/12/19 à 23:04.

    Aussi possible que ce soit au niveau de la RAM, soi les DIMMs soi le controleur mémoire du CPU. Mon PC actuel avait des problèmes de freeze lors de fortes utilisation de RAM, augmenter VCCSA a résolu le problème (attention à ne pas pousser au-dessus des 1.25V recommandés par Intel sous peine d'endommager le CPU).

    Pour vérifier, un memtest standard ne suffira pas pour saturer le controleur. Il faut utiliser un autre outil ou faire un script qui ouvre plusieurs instances testant chacune une partie de la RAM.
    Au passage, le memtest libre n'est pas prévu pour la DDR4 et il risque de produire des faux-positifs. Seul le memtest propriétaire convient pour les nouvelles machines.

    • [^] # Re: RAM ?

      Posté par . Évalué à 1 (+0/-0).

      Le memtest libre n'a rien donné, en tout cas.
      J'ai cependant saturé la RAM avec un autre stress-test, mais ça n'a pas planté non plus.

      • [^] # Re: RAM ?

        Posté par . Évalué à 2 (+0/-0).

        C'était quoi ton "autre" stress-test ? (encore une fois, une seule instance de memtest ne stresse rien du tout, ce n'est qu'un test d'intégrité)
        Si c'est de la compression/décompression ou de l'encodage, ça peut utiliser toute la RAM mais le support de stockage ou les cœurs du CPU seront certainement le goulet d'étranglement plutôt que le contrôleur mémoire.

        • [^] # Re: RAM ?

          Posté par . Évalué à 1 (+0/-0).

          Avec "dd", j'ai écrit des tas de petits fichiers pendant 1 heure, jusqu'à swapper, vider, la RAM et recommencer.

          • [^] # Re: RAM ?

            Posté par . Évalué à 2 (+0/-0).

            Si ces fichiers sont écrits séquentiellement, ça ne saturera pas le controleur.
            Aussi, ton test ne vérifie pas l'intégrité de ce qui est écrit, la saturation pourrait ne causer que des erreurs d'écriture provoquant un bug à retardement.

            Si c'est pas déjà fait, lance un chkdsk au cas où il y aurait eu des corruptions passées sur le disque dur.

            • [^] # Re: RAM ?

              Posté par . Évalué à 1 (+0/-0).

              Arf, tu conseilles quoi, du coup ?

              J'ai déjà fait un chkdsk, mais ça n'a rien changé, il n'y avait aucun problème.

              • [^] # Re: RAM ?

                Posté par . Évalué à 3 (+1/-0).

                Comme je disais, Memtest avec plusieurs instances (HCI Memtest pour Windows) mais tu as aussi Prime95 (mprime pour Linux) qui permet de stresser le controleur mémoire en utilisant l'option In-place Large FFT.
                Pour Windows, il y a aussi AIDA64 qui a un bon stresstest global pour la mémoire avec beaucoup de monitoring mais c'est une version d'évaluation gratuite façon WinRar.

                Sinon en FOSS pour Linux, Google a créé StressAppTest souvent disponible dans les distributions. J'ai jamais testé car trop complexe mais ça a l'avantage d'être portable pour d'autres jeux d'instruction. Il y a aussi stress-ng qui est moins complexe mais moins ciblé.

                Mais pour ton problème en général, si c'est un CPU Intel tu pourrais commencer par utiliser leur utilitaire de diagnostic nommé Intel Processor Diagnostic Tool.

                • [^] # Re: RAM ?

                  Posté par . Évalué à 1 (+0/-0). Dernière modification le 20/12/19 à 07:29.

                  AIDA64, c'est effectivement une version d'essai, j'ai essayé sans succès.
                  stress-ng n'a rien donné.
                  Même niveau températures, ça ne grimpait pas.

                  Je vais voir HCI Memtest, merci !

  • # Wifi ?

    Posté par (page perso) . Évalué à 1 (+0/-0).

    J'ai eu un soucis une fois : la carte wifi déconnait régulièrement et figeait tout. Et cette carte n'existait pas toujours si on bootait en linux.

    Ça s'est fini par une amputation (l'utilisateur habituel ayant tendance à activer le wifi à l'aide d'un raccourci clavier non documenté, et paf!). J'ai retiré la carte (pas les doigts de l'utilisateur) : plus de plantages.

    • [^] # Re: Wifi ?

      Posté par . Évalué à 1 (+0/-0).

      Alors, c'est une piste possible ! Ça a déconnecté une fois ou deux pour "rien", je dirais. Mais de là à réussir à provoquer le bug ?

      • [^] # Re: Wifi ?

        Posté par (page perso) . Évalué à 1 (+0/-0).

        Mais de là à réussir à provoquer le bug ?

        Tenter un gros téléchargement ? Visiter un site pas du tout respectueux de la vie privée (qui ouvre(nt) et charge(nt) plein de jscripts et cookies d'un peu partout dans le monde des régies news/pub) ? Les deux, mon Capitaine ?

        • [^] # Re: Wifi ?

          Posté par . Évalué à 2 (+1/-0).

          J'ai tenté jeu en ligne + des gros sites pourris + torrent + DDL, mais ça a l'air d'avoir tenu. Je me suis demandé si une possible chauffe de la carte Wi-Fi ne pouvait pas poser problème…mais a priori, ce n'est pas ça (j'ai déjà eu le cas).

          Je vais mettre le PC au four, pour le stresser comme il se doit.

  • # Commentaire supprimé

    Posté par . Évalué à 1 (+0/-0). Dernière modification le 25/01/20 à 18:23.

    Ce commentaire a été supprimé par l'équipe de modération.

Envoyer un commentaire

Suivre le flux des commentaires

Note : les commentaires appartiennent à ceux qui les ont postés. Nous n'en sommes pas responsables.