Forum Linux.embarqué S.O.S. redémarrages système sans raison apparente

Posté par  . Licence CC By‑SA.
Étiquettes : aucune
0
8
nov.
2013

Bonjour,

dans un précédent poste j'ai exposé un problème de reboot brutal système liux embarqué sur pc104
j'aimerai bien avoir l'avis des experts linux embarqué sur le sujet vu que le probleme est tjrs d'actualité

voila j'utilise une carte PC104 avec un système embarqué linux 2.6.23 le système tourne bien mais de temps en temps le système reboot brutalement sans message d'erreur ni rien et continue a rebooter plusieurs fois pour le relancer je coupe l'alimentation quelques minutes puis je redémarre ca marche une fois sur deux, mais si non le système a 70% du temps il le fait pas.

donc tout de suite j'ai pencher pour l'alim, j'ai mis une plus puissante, mais le problème est le même
la je suis partie pour un filtre secteur mais je suis pas convaincu a 100% que c ca.

et apres un dmesg sur un terminal j'ai un message que je comprend pas

Linux version 2.6.23 (gcc version 3.2.3) #10 Wed Sep 14 12:09:32 CEST 2011
CPU: Vendor unknown, using generic init.
CPU: Your system may be unstable.

BIOS-provided physical RAM map:
BIOS-e820: 0000000000000000 - 000000000009fc00 (usable)
BIOS-e820: 000000000009fc00 - 00000000000a0000 (reserved)
BIOS-e820: 00000000000e4000 - 0000000000100000 (reserved)
BIOS-e820: 0000000000100000 - 0000000010000000 (usable)
BIOS-e820: 00000000ff000000 - 0000000100000000 (reserved)

donc c'est le message Your system may be unstable. est ce que c'est normale ce message?? est-il la cause de mon problème ?? et comment le résoudre??
et une autre question si le système n'a pas assez d'espace memoire pour tourné est-ce que ca expliquerait le problème ??

merci d'avance pour vos réponses que j'attend avec un grand espoir.

  • # des pistes (ou pas)

    Posté par  . Évalué à 3. Dernière modification le 08 novembre 2013 à 10:44.

    c'est le message Your system may be unstable . est ce que c'est normale ce message?? est-il la cause de mon problème ?? et comment le résoudre??

    Je ne penses pas que le message soit bloquant.
    le message dit qu'il ne semble pas reconnaitre ton processeur ( vendor unknown ), du coup il va peut-etre utiliser moins de fonctionnalités ou tenter d'en utiliser certaines sans savoir si elles sont dispos.

    du coup si la fonctionnalité n'est pas dispo, ca peut generer des instabilités.

    et une autre question si le système n'a pas assez d'espace memoire pour tourné est-ce que ca expliquerait le problème ??

    faut peut-etre grapher avec un outil de monitoring l'usage proc/memoire/disque/reseau
    pour voir en effet si ca se remplit avant le plantage.

  • # S.O.S

    Posté par  . Évalué à 1.

    Merci neox pour ton retour, comme d'hab le premier a répondre merci encore une fois.

    > faut peut-etre grapher avec un outil de monitoring l'usage proc/memoire/disque/reseau
    

    pour voir en effet si ca se remplit avant le plantage.>

    cela dis j'ai pas compris ta réponse, pense tu a un outil de diagnostique en particulier??

    • [^] # Re: S.O.S

      Posté par  . Évalué à 3.

      à voir ce qui est dispo sur ton infrastructure.

      Nagios avec son plugin PNP, ou Cacti pourrait permettre de grapher ce que tu veux,
      il faut l'installer sur une machine externe à celle que tu veux surveiller,
      puis faire quelques scripts qui vont se connecter à ton PC instable, et relever des informations
      soit par des scripts SSH, soit par SNMP, IPMI…

      en allant à fond dans les sondes, tu peux aussi avoir un graphe de la temperature des disques durs, de la vitesse de rotation des ventilos…

      sinon pour repondre au post de quelqu'un il faut cliquer sur "repondre" en bas de son poste, plutot que sur "envoyer un commentaire" qui, lui, va repondre au post d'origine.

      • [^] # Re: S.O.S

        Posté par  . Évalué à -1.

        oui merci pour explication des réponse , je l'ai pas vu javoue

      • [^] # Re: S.O.S

        Posté par  . Évalué à 0.

        j'ai l'impression que le système est plus stable qd je suis sous dos
        donc c'est possible que ca soit le soft??

        • [^] # Re: S.O.S

          Posté par  . Évalué à 2.

          c'est possible, que comme dit au demarrage du linux " Cpu unknown, system may be unstable"

          donc faut verifier que ton processeur est bien reconnu,
          au besoin compiler un noyau specialement pour lui
          car il a peut-etre des fonctions non dispo sur le noyau x86 et specifiques à ton proc…

  • # s.o.s

    Posté par  . Évalué à 0.

    pour mes investigations j’utilise une carte PC sur mon bureau avec un clavier et un moniteur
    et ca redémarre sans arrêt je vois que les led du clavier qui s'allument et s'éteignent en boucle sans rien pouvoir afficher a l’écran. ce qui rend la chose plus difficile a diagnostiquer !!!!

    comment résoudre ce pb???

    • [^] # Re: s.o.s

      Posté par  . Évalué à 4.

      un condensateur eclaté sur la carte mere ?

      les condensateurs sont souvent cylindriques avec un haut plat. (parfois avec comme la lettre K marquée dessus)
      si un condensateur est bombé, c'est qu'il a chauffé/explosé
      du coup il ne fait plus son travail => instabilité.

      tension/frequence du processeur ou de la ram ?

      j'ai eu une machine qui refusait de demarrer avec 4x1Go de ram, et qui demarrait tres bien avec les memes barrettes mises en 2x1Go…

      le bios etait reglé sur tension/voltage automatique,
      j'ai lu des tutos d'overclock, j'ai fixé une tension, et j'ai pu demarré avec mes 4x1Go

      • [^] # Re: s.o.s

        Posté par  . Évalué à 1.

        oui je suis d’accord pour l'histoire du condo mais ca le faits sur presque ttes les cartes donc je pense pas que ca soit un pb de condo même après vérification j'ai rien remarqué d'anormale .

        pour la rame j'ai fais un test avec meme test non ca na rien donner.

        et pour une meilleur comprehension je met le lien de la carte.

        http://www.diamondsystems.com/products/helios.

        voila c'est un pc industriel.

        • [^] # Re: s.o.s

          Posté par  . Évalué à 2. Dernière modification le 09 novembre 2013 à 23:41.

          t'etait pas deja passé y 3 ou 4 mois, ca me dit quelque chose ton histoire de plusieurs cartes qui "deconnent" aleatoirement.

          une recheche "linux kernel vortex cpu"
          pourquoi vortex CPU ?
          parce que c'est le CPU qui est indiqué dans la doc technique de tes cartes PC104.

          donc la recherche avec ces mots clés nous envoie entre autre sur la page wikipedia
          http://en.wikipedia.org/wiki/Vortex86
          ou une page de forum ubuntu
          http://ubuntuforums.org/showthread.php?t=935893

          qui explique que la serie Vortex86 serait une vieille techno,
          et ca parle d'emulation FPU car les instructions ne sont pas forcement presente sur le processeur,
          de compatibilité i586 voire i486 pour certains processeurs

          ou pour les processeurs plus recents, d'une option de compilation qui utiliserait une instruction CMOV pas dispo sur les CPU Vortex

          Code intended for i686 may fail due to the lack of a Conditional Move (CMOV) instruction. This is an instruction that combines the effect of a conditional branch and a move instruction. Compilers asked to optimize code for a more advanced CPU (for example the GNU Compiler with its -march=i686 option) generate code that uses CMOV. Linux systems intended for to run on i686 are generally not runnable on Vortex86 because the GNU C Library, when built for i686, uses a CMOV instruction in its assembly language strcmp function, which its dynamic loader (ld.so) uses. Hence, no program that uses shared libraries can even start up.

          il faut donc surement utiliser un noyau compilé pour les anciennes architectures
          et verifier qu'ils incluents l'option d'emulation FPU ou desactiver l'usage de CMOV dans les logiciels (donc les recompiler)

          une piste sur comment recompiler le noyau avec les options specifiques au Vortex86
          pour en faire ensuite un package deb, qui pourrait etre installer sur toutes les cartes en production
          http://robosavvy.com/forum/viewtopic.php?t=6614

          • [^] # Re: s.o.s

            Posté par  . Évalué à 0.

            Bonjour Neox,

            avant tt je m'excuse pour le retard de ce retour
            oui effectivement c’était moi y a quelque mois de ça, je viens de lire ton msg concernant la commande CMOV qui serait pas dispo sur mon processeur, je te remercie pour tes investigations cela dis en principe tout est compilé pour que ca marche sur ce processeur par contre comment je pourrai vérifier ca comme ca je serai fixé.

            par contre j'ai de nouveaux éléments

            1- le premier et qui est a 50% voir plus la cause de ces redémarrage inexpliqué c'est un bouton RESET qui se dilaterai avec la chaleur et qui produit des faut contactes, ce qui explique les redémarrage aléatoires. j'ai shunter ce bouton et ca marche beaucoup mieux.

            mais c'est pas l'unique cause car la carte sur mon bureau redémarre aussi même avec le shunte…!

            2- par cotre contrairement au autre carte la carte sur mon bureau est équipé d'une alimentation genre pc portable de 5V 8A, alors que sur les autres c'est des alimentations ajustables, et j'ai remarqué qu'en les ajustant a 5.4V ca marche mieux car il m'est arriver de résoudre ce problème comme ca sur une de mes carte mais ca l'a refait plus tard mais c’était avant de débusquer ce bouton RESET.

            donc c'est a surveiller si c'est vraiment les deux seul coupable??

            mais j'aimerais bien explorer ta piste Neox donc je vais creuser sur le net comment vérifier ca et je re posterai un résultat

            en attendant Merci encore a vous.

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.