Forum général.cherche-logiciel Problème matériel grave... ram ?

Posté par (page perso) .
Tags : aucun
0
19
mar.
2007
En phase de pré-suicide avancé, je m'en remets à vous en dernier recours avant la pomme au cianure, pour finir en beauté.

[Mavie]
Heureux propriétaire d'une carte mère Asus A8V deluxe, socket 939, avec de la ram samsung, 3 disques durs, un lecteur de CD et une carte video AGP matrox, je rencontrais parfois quelques plantages pas méchants type :
on lance "kino", et poof ça plante (freeze)
On lance "xdtv" et au bout de 2 minutes, la souris bouge plus, mais l'image continue... donc pas grave...

Mais pour le reste, ça marchait quand même pas mal.

ça s'est aggravé méchamment il y a quelques jours (2 semaines) : dès que ça chauffe l'ordi plante. (parfois "segfault" même sur des programmes qui n'y sont a priori pas sensibles ("sleep")).

Accusant d'abord le processeur (cf. http://linuxfr.org/forums/44/21081.html ), j'en ai racheté un, compatible, et les erreurs sont revenues.... immédiatement.

Je suis donc allé chez mon dealer favori, et j'ai sorti le grand jeu :
nouvelle alim, nouvelle carte mère, nouvelle carte graphique (il n'a plus de carte mères AGP en socket 939).

Les problèmes se sont faits plus rares, mais ont continué à me casser les bonbons assez vite, j'ai donc accusé Gentoo, à base de "emerge -e system" puis "emerge -Due world" ; qui passaient parfois (pour system) mais globalement, ça plantait au milieu avec des "general protection fault".

J'ai utilisé ultimate boot CD :
memtest86 pendant 24 heures : rien à signaler.
lucifer donnait 6 erreurs en 1 heure, ce qui m'avait alarmé suffisamment pour acheter la nouvelle carte mère. (je suppose que l'alim était défectueuse et a transmis le cancer). Mais en regardant les erreurs de plus près, j'ai vu des lignes type :
ERREUR : 212.1229129172891 mult 0.00000000 gave 0
ce qui ne m'a pas semblé être une erreur a priori et m'a donc déçu de ce petit soft.


Bref, j'ai craqué, j'ai pris le forfait "hardware" chez mon dealer qui a scanné mon ordi je ne sais trop comment pour me dire que le lecteur de CD faisait des pannes... Ce qui est vrai pusique mon ordi plante objectivement moins depuis que je l'ai changé.

Bref, ré-ré-ré-ré-installant gentoo sur le même bon vieux disque, j'ai fini par craquer et accuser ce dernier matériel non changé, et j'ai racheté un disque aujourd'hui.

[/Mavie]


Au bout de 6 heures de compilations sans erreurs, en plein emerge -Du --newuse world, j'ai eu droit à un "top" : invalid operation (ou truc du genre) suivi de "ps x" Segfault.

J'ai remis le champagne au frais (j'y croyais vraiment) et j'ai remis le Gentoo liveCD dans le lecteur :
au boot :
erreur dans libc.so.6 : could not find mallo" function.


(mallo", là ou je suppose qu'il aurait du chercher malloc).

donc je n'arrive plus à booter sur ce CD, mais je suppose (ça me l'a fait toute le semaine dernière) que si j'attends 2 heures ordi éteint, il va booter comme un coeur. (et planter plus tard).

De l'ancienne machine, il ne reste que :
2 barettes de RAM samsung, que je repasse à memtest86+ (de Ultimate boot CD) dans le doute.
1 lecteur de disquettes.

les cables sont neufs (j'ai pas voulu prendre de risques).

Le pire, c'est que quand mon dealer m'a proposé un disque dur sous windows pour tester, je ne suis pas parvenu à le faire planter (bon, d'accord, je ne connais pas d'équivalent à emerge -Du world sous windows, en terme d'utilisations de ressources.)

Ce qui m'interpelle, c'est que SI c'est la RAM (ce que je testerai demain, en empruntant deux barettes à mon dealer), pourquoi ça plante 6 fois de suite au démarrage, et plus quand c'est froid, et surtout, pourquoi "à chaud" memetest86 ne trouve rien ?! (il vient de finir une passe au moment où j'écris ces lignes, 0 errors)

Questions :
* memtest86 trouve-t'il "toutes" les erreurs de ram ?
* Un lecteur de disquettes deffectueux peut il engendrer de telles erreurs ?
* avez-vous une idée de la cause du problème ?!

Florilège des erreurs obtenues (non notées donc peut être déformées) :
* Spurious ACK in serio0 : some program might want to access hardware directly
* bus error
* losing too many ticks
* Sigsegv
* kernel pannic
* general failure (façon kernel pannic)
* IO error (sur le disque hda, alors que c'est un disque données non monté. (root : /dev/sda1) badblocks -n /dev/{sda,hda} ne donnent AUCUNE erreur).
* Attempt to kill init
* lib".so.6 : file not found (au boot, donc forcément, ça boot pas)
* (ça boot avec plein d'erreurs). login marche, cd /etc/ ls : "fs$ab mtab in!t.d " (avec des caractères cabalistiques à la place de certaines lettres)

bref, tout cela pue le problème de ram, mais memtest86 trouve rien.
  • # Lecteur de D7

    Posté par . Évalué à 2.

    Hello,

    Avant d'asperger ton ordi d'eau bénite :
    Vire ton lecteur de D7, et laisse tourner l'bouzin. C'est quand meme un test tout con qui ne coûte rien.

    Sinon le p'tit cousin de Lao-Tse a dit un jour:
    "Si tu as un problème avec ton pc, ne change pas de pc, mais change plutôt de problème."
    • [^] # Re: Lecteur de D7

      Posté par (page perso) . Évalué à 1.

      En fait, j'avais déjà fait ce test, et ça changeait rien.... Mais bon, sait-on jamais, si plusieurs périphériques plantent à la fois...
  • # test facile, surement proposé dans le precedent post

    Posté par . Évalué à 3.

    carte mere + proc + ram + video

    la ram, une barrette apres l'autre
    attendre et voir si ca plante

    l'autre barrette
    attendre et voir si ca plante

    ajouter le lecteur de CD et partir avec un liveCD voir si ca tient (avec une barette puis l'autre)

    Ajouter les peripheriques les uns apres les autres

    mais vu que tu as tout changé il reste le lecteur de disquette (tu peux le virer ca ne sert plus)

    et les erreurs sur HDA, deconnecte le completement.
    • [^] # Re: test facile, surement proposé dans le precedent post

      Posté par (page perso) . Évalué à 1.

      En fait, j'ai eue l'idée de tester les barettes une par une à l'instant, je suis en train de tester la première, et "Ô magie moderne, ça marche" (enfin, ne sortons pas encore le champagne, ça porte la poisse).
      • [^] # Re: test facile, surement proposé dans le precedent post

        Posté par . Évalué à 1.

        reste à essayer la 2e toute seule
        • [^] # Re: test facile, surement proposé dans le precedent post

          Posté par (page perso) . Évalué à 1.

          J'ai hésité à le faire immédiatement, pour ne pas présumer trop vite que ça marche avec une seule, mais finalement, la curiosité l'a emporté.

          sur tty1 :
          emerge gcc -1
          sur tty2 :
          compil d'enlightenement
          sur tty3 :
          emerge xorg-x11 xine-ui rox
          sur tty4 :
          (as user) : mpg123 (musique)

          Et.... En 3 minutes, ça a planté avec barette B.

          J'ai remis barette A, et poof, ça remarche (avec la meme situation sur les 4 terminaux)

          bref, je viens de racheter :
          1 carte mère
          1 carte video
          1 disque dur
          1 processeur

          .... "pour rien" :-)
          (enfin, si, on va supposer que j'avais 4 problèmes dûs à une alim défectueuse qui a tout grillé y compris une barette de RAM, sinon, je vais vraiment finir comme Turing).

          En tous cas, c'est cool, parce que là, après 3 minutes, ça n'a toujours pas planté, pourtant, j'ai un load assez honorable !

          Merci John Doe, merci à vous tous qui m'avez supporté dans cette période difficile.
          • [^] # Re: test facile, surement proposé dans le precedent post

            Posté par . Évalué à 1.

            plus qu'a revendre les pieces que tu as en trop...

            la carte graphique ce ne serait pas une Nvidia avec 2 sorties (vga/dvi-i) ?

            ca pourrait m'interesser
            • [^] # Re: test facile, surement proposé dans le precedent post

              Posté par (page perso) . Évalué à 1.

              Bah, en fait, je suis emmerdé par cette solution (ma fiancée, juriste, me l'avait proposée).

              Mon dealer a été TRÈS sympa et de bon conseil. Il m'a facturé que 20 euros de main d'oeuvre et aurait pu saler vachement plus... j'ai quand meme passé "une semaine" à le faire chier...

              DONC

              lui refourguer une carte mère montée/démontée et tout le brouzouf, c'est dur... et méchant (surtout qu'il a pas le droit de refuser, et on va être à la limite du "revendable en l'état".

              l'emmerde, c'est vraiment que c'est du tout ou rien...

              bref, je revendrai ma matrox à 3 sorties (double DVI dont une séparable en 2 VGA). On m'en propose 5 euros chez un occasionneur (qu'il crève ! J'en ai donné 30 fois ça il y a 1 an !!).

              je vais revendre tout mon vieux matos "en l'état" et me réjouir de mon nouvel ordi tout beau (et racheter une **** de barette de RAM)
              • [^] # Re: test facile, surement proposé dans le precedent post

                Posté par . Évalué à 3.

                conclusion memtest ne trouve pas toutes les erreurs possibles :(
                Au moins on sait s'il trouve des erreurs qu'il y a vraiment des problèmes sur les barettes, mais s'il ne trouve rien on n'est pas certain à 100% qu'elles sont bonnes. J'ai même vu des barettes tourner plutôt convenablement avec une tonne d'erreurs détectées, et d'autres barettes rendre la machine très instable avec une seule erreur. J'ai vu également une machine (sous windows) accepter une barrette instable qui avait déjà des erreurs détectées avec memtest, tourner sans problème pendant 1 semaine, et au bout d'une semaine planter sur chaque programme lancé.

                Only wimps use tape backup: real men just upload their important stuff on megaupload, and let the rest of the world ~~mirror~~ link to it

  • # Nouveau Bug !!!

    Posté par (page perso) . Évalué à 1.

    Bon, cette fois, j'ai préparré ma pomme, je cherche encore le poison à étaler dessus... Et j'attends aussi d'avoir inventé une machine pour rentrer dans la légende et qu'une célèbre marque m'imite plus tard...

    D'ici là, j'ai un bug rigolo.

    Je lance X, blackbox
    Je lance "linuxdcpp" à qui je fais calculer quelques hashs (300+ Go)
    et un petit "emerge gimp".

    ça rame, mais bon....

    J'étais en train de lire plus loin (sur papier, un truc qui a été inventé il y a longtemps) et ça bossait depuis en gros 30 minutes (oui, 512 Mo de RAM, ça rame), et j'ai eue l'idée saugrenue de demander à audacious de charger ma playlist. (7000+ mp3/ogg)

    Et là, au bout de 14 secondes, poof écran noir.

    Je ne panique pas, j'attends (en fait, je cherche quoi faire) et j'ai droit à mon BIOS

    Une erreur similaire est apparue il y a 3 heures, quand je déplaçais mes mp3 pendant une compil et audacious tournait encore. (de disque à disque).

    Bien sûr, AUCUN log ne parle de cette erreur, on pourrait presque croire à une panne de courant (au sens "ça coupe, pas d'erreur, et quand tu reviens ça boot calmement").

    Vous avez déjà eu des reboot intempestifs, vous ?!
    (comprendre "comment je règle ce petit problème si peu génant")
    • [^] # Re: Nouveau Bug !!!

      Posté par . Évalué à 1.

      au final je vais poser une question bete...

      ca t'arrive souvent de lancer 25 compilations
      3 montages audio/video
      et en meme temps de transferer 50Go de données entre 2 disques ?

      pcq si le but c'est de faire un serveur pour terminaux graphiques, il faut peut-etre simplement dimensionner la machine comme il faut.
      • [^] # Re: Nouveau Bug !!!

        Posté par (page perso) . Évalué à 1.

        Question logique :-)

        La réponse est évidemment non.... Quoique...

        J'ai enlightenment Beta, et je mets souvent à jour... Quand je le fais, je n'arrête pas forcément mes transfers.... Et je profite parfois du lag pour lancer un emerge -Du world ; ce qui rame.

        De plus, je suis entre autre passé à Linux parce que Windows plante quand on lance 5 IE (à l'époque où je l'ai quitté) ; Linux, il rame seulement...

        Quand le système est à court de rame, il reboot ?! Je pensais qu'il killait les applis une par une... (et surtout, il pourrait au moins écrire dans /var/log/message un truc pour s'excuser des éventuels désagréments :p )

        Bref, un Athlon64 3500+ avec 512 (sic) de RAM, ça doit quand même pouvoir gérer une compilation et un transfer de fichier, non ?
        (surtout que je suis sous fluxbox, pour alléger)
        • [^] # Re: Nouveau Bug !!!

          Posté par . Évalué à 1.


          enlightenment Beta, et je mets souvent à jour... [...]Et je profite parfois du lag pour lancer un emerge -Du world ;


          ne serait-ce pas redondant ?
          et le faire en meme temps ne risquerait-il pas de creer des "conflits" sur les entrées/sorties et sur les objets de compilations...


          enfin je dis ca je dis rien, mais quand je fais des mises à jours je me concentre sur cette mise à jour (ce qui ne m'empche pas de faire des transferts ou de surfer le web en attendant)

          mais si je fais une mise à jour du navigateur, j'evite de m'en servir.
          etc...
          • [^] # Re: Nouveau Bug !!!

            Posté par (page perso) . Évalué à 1.

            c'est à dire redondant ?

            bah, je MaJ enlightenment via un script, dans /opt/e17, donc "séparé". (et oui, il peut planter... pas grave, quand il plante, ça ferme même pas X, normalement... il te propose de le relancer)

            Je vois pas en quoi ces crash "system" seraient lié à du *user*land (même pas root).

            (et en plus, enlightenment compile pas bien chez moi ces temps-ci, donc je l'utilise même plus... j'attends patiemment :p )

            Mes derniers "crash-reboot" sont imho liés à du Nvidia-bug.... Ou alors ma seconde barette est aussi cramée.... (tiens, j'avise une barette dans mon placard, si je la testais ?)

Suivre le flux des commentaires

Note : les commentaires appartiennent à ceux qui les ont postés. Nous n'en sommes pas responsables.