Faire un don ! | | style | statistiques | contactez-nous | plan | lettre d'information

general.cherche-logiciel : Problème matériel grave... ram ?

Posté par mansuetus (page perso, ) le 19 mars 2007
En phase de pré-suicide avancé, je m'en remets à vous en dernier recours avant la pomme au cianure, pour finir en beauté.



[Mavie]

Heureux propriétaire d'une carte mère Asus A8V deluxe, socket 939, avec de la ram samsung, 3 disques durs, un lecteur de CD et une carte video AGP matrox, je rencontrais parfois quelques plantages pas méchants type :

on lance "kino", et poof ça plante (freeze)

On lance "xdtv" et au bout de 2 minutes, la souris bouge plus, mais l'image continue... donc pas grave...



Mais pour le reste, ça marchait quand même pas mal.



ça s'est aggravé méchamment il y a quelques jours (2 semaines) : dès que ça chauffe l'ordi plante. (parfois "segfault" même sur des programmes qui n'y sont a priori pas sensibles ("sleep")).



Accusant d'abord le processeur (cf. http://linuxfr.org/forums/44/21081.html ), j'en ai racheté un, compatible, et les erreurs sont revenues.... immédiatement.



Je suis donc allé chez mon dealer favori, et j'ai sorti le grand jeu :

nouvelle alim, nouvelle carte mère, nouvelle carte graphique (il n'a plus de carte mères AGP en socket 939).



Les problèmes se sont faits plus rares, mais ont continué à me casser les bonbons assez vite, j'ai donc accusé Gentoo, à base de "emerge -e system" puis "emerge -Due world" ; qui passaient parfois (pour system) mais globalement, ça plantait au milieu avec des "general protection fault".



J'ai utilisé ultimate boot CD :

memtest86 pendant 24 heures : rien à signaler.

lucifer donnait 6 erreurs en 1 heure, ce qui m'avait alarmé suffisamment pour acheter la nouvelle carte mère. (je suppose que l'alim était défectueuse et a transmis le cancer). Mais en regardant les erreurs de plus près, j'ai vu des lignes type :

ERREUR : 212.1229129172891 mult 0.00000000 gave 0

ce qui ne m'a pas semblé être une erreur a priori et m'a donc déçu de ce petit soft.





Bref, j'ai craqué, j'ai pris le forfait "hardware" chez mon dealer qui a scanné mon ordi je ne sais trop comment pour me dire que le lecteur de CD faisait des pannes... Ce qui est vrai pusique mon ordi plante objectivement moins depuis que je l'ai changé.



Bref, ré-ré-ré-ré-installant gentoo sur le même bon vieux disque, j'ai fini par craquer et accuser ce dernier matériel non changé, et j'ai racheté un disque aujourd'hui.



[/Mavie]




Au bout de 6 heures de compilations sans erreurs, en plein emerge -Du --newuse world, j'ai eu droit à un "top" : invalid operation (ou truc du genre) suivi de "ps x" Segfault.



J'ai remis le champagne au frais (j'y croyais vraiment) et j'ai remis le Gentoo liveCD dans le lecteur :

au boot :

erreur dans libc.so.6 : could not find mallo" function.




(mallo", là ou je suppose qu'il aurait du chercher malloc).



donc je n'arrive plus à booter sur ce CD, mais je suppose (ça me l'a fait toute le semaine dernière) que si j'attends 2 heures ordi éteint, il va booter comme un coeur. (et planter plus tard).



De l'ancienne machine, il ne reste que :

2 barettes de RAM samsung, que je repasse à memtest86+ (de Ultimate boot CD) dans le doute.

1 lecteur de disquettes.



les cables sont neufs (j'ai pas voulu prendre de risques).



Le pire, c'est que quand mon dealer m'a proposé un disque dur sous windows pour tester, je ne suis pas parvenu à le faire planter (bon, d'accord, je ne connais pas d'équivalent à emerge -Du world sous windows, en terme d'utilisations de ressources.)



Ce qui m'interpelle, c'est que SI c'est la RAM (ce que je testerai demain, en empruntant deux barettes à mon dealer), pourquoi ça plante 6 fois de suite au démarrage, et plus quand c'est froid, et surtout, pourquoi "à chaud" memetest86 ne trouve rien ?! (il vient de finir une passe au moment où j'écris ces lignes, 0 errors)



Questions :

* memtest86 trouve-t'il "toutes" les erreurs de ram ?

* Un lecteur de disquettes deffectueux peut il engendrer de telles erreurs ?

* avez-vous une idée de la cause du problème ?!



Florilège des erreurs obtenues (non notées donc peut être déformées) :

* Spurious ACK in serio0 : some program might want to access hardware directly

* bus error

* losing too many ticks

* Sigsegv

* kernel pannic

* general failure (façon kernel pannic)

* IO error (sur le disque hda, alors que c'est un disque données non monté. (root : /dev/sda1) badblocks -n /dev/{sda,hda} ne donnent AUCUNE erreur).

* Attempt to kill init

* lib".so.6 : file not found (au boot, donc forcément, ça boot pas)

* (ça boot avec plein d'erreurs). login marche, cd /etc/ ls : "fs$ab mtab in!t.d " (avec des caractères cabalistiques à la place de certaines lettres)



bref, tout cela pue le problème de ram, mais memtest86 trouve rien.

> Lire le message (14 commentaires, moyenne: 1,4).  

Vous avez demandé le commentaire #814531.

Nouveau Bug !!!

Posté par mansuetus (page perso, ) le 20/03/2007 à 15:18. (lien). Évalué à 1.

Bon, cette fois, j'ai préparré ma pomme, je cherche encore le poison à étaler dessus... Et j'attends aussi d'avoir inventé une machine pour rentrer dans la légende et qu'une célèbre marque m'imite plus tard...

D'ici là, j'ai un bug rigolo.

Je lance X, blackbox
Je lance "linuxdcpp" à qui je fais calculer quelques hashs (300+ Go)
et un petit "emerge gimp".

ça rame, mais bon....

J'étais en train de lire plus loin (sur papier, un truc qui a été inventé il y a longtemps) et ça bossait depuis en gros 30 minutes (oui, 512 Mo de RAM, ça rame), et j'ai eue l'idée saugrenue de demander à audacious de charger ma playlist. (7000+ mp3/ogg)

Et là, au bout de 14 secondes, poof écran noir.

Je ne panique pas, j'attends (en fait, je cherche quoi faire) et j'ai droit à mon BIOS

Une erreur similaire est apparue il y a 3 heures, quand je déplaçais mes mp3 pendant une compil et audacious tournait encore. (de disque à disque).

Bien sûr, AUCUN log ne parle de cette erreur, on pourrait presque croire à une panne de courant (au sens "ça coupe, pas d'erreur, et quand tu reviens ça boot calmement").

Vous avez déjà eu des reboot intempestifs, vous ?!
(comprendre "comment je règle ce petit problème si peu génant")

--
mansuetus @ spontex . org
  • [^]Re: Nouveau Bug !!!

    Posté par NeoX () le 20/03/2007 à 20:47. (lien). Évalué à 1.

    au final je vais poser une question bete...

    ca t'arrive souvent de lancer 25 compilations
    3 montages audio/video
    et en meme temps de transferer 50Go de données entre 2 disques ?

    pcq si le but c'est de faire un serveur pour terminaux graphiques, il faut peut-etre simplement dimensionner la machine comme il faut.

    --
    Apprendre par les autres, c'est bien.
    Apprendre par soi-meme (RTFM, man, et notre ami google) c'est mieux
    • [^]Re: Nouveau Bug !!!

      Posté par mansuetus (page perso, ) le 20/03/2007 à 21:55. (lien). Évalué à 1.

      Question logique :-)

      La réponse est évidemment non.... Quoique...

      J'ai enlightenment Beta, et je mets souvent à jour... Quand je le fais, je n'arrête pas forcément mes transfers.... Et je profite parfois du lag pour lancer un emerge -Du world ; ce qui rame.

      De plus, je suis entre autre passé à Linux parce que Windows plante quand on lance 5 IE (à l'époque où je l'ai quitté) ; Linux, il rame seulement...

      Quand le système est à court de rame, il reboot ?! Je pensais qu'il killait les applis une par une... (et surtout, il pourrait au moins écrire dans /var/log/message un truc pour s'excuser des éventuels désagréments :p )

      Bref, un Athlon64 3500+ avec 512 (sic) de RAM, ça doit quand même pouvoir gérer une compilation et un transfer de fichier, non ?
      (surtout que je suis sous fluxbox, pour alléger)

      --
      mansuetus @ spontex . org
      • [^]Re: Nouveau Bug !!!

        Posté par NeoX () le 21/03/2007 à 06:22. (lien). Évalué à 1.


        enlightenment Beta, et je mets souvent à jour... [...]Et je profite parfois du lag pour lancer un emerge -Du world ;


        ne serait-ce pas redondant ?
        et le faire en meme temps ne risquerait-il pas de creer des "conflits" sur les entrées/sorties et sur les objets de compilations...


        enfin je dis ca je dis rien, mais quand je fais des mises à jours je me concentre sur cette mise à jour (ce qui ne m'empche pas de faire des transferts ou de surfer le web en attendant)

        mais si je fais une mise à jour du navigateur, j'evite de m'en servir.
        etc...

        --
        Apprendre par les autres, c'est bien.
        Apprendre par soi-meme (RTFM, man, et notre ami google) c'est mieux
        • [^]Re: Nouveau Bug !!!

          Posté par mansuetus (page perso, ) le 21/03/2007 à 09:52. (lien). Évalué à 1.

          c'est à dire redondant ?

          bah, je MaJ enlightenment via un script, dans /opt/e17, donc "séparé". (et oui, il peut planter... pas grave, quand il plante, ça ferme même pas X, normalement... il te propose de le relancer)

          Je vois pas en quoi ces crash "system" seraient lié à du *user*land (même pas root).

          (et en plus, enlightenment compile pas bien chez moi ces temps-ci, donc je l'utilise même plus... j'attends patiemment :p )

          Mes derniers "crash-reboot" sont imho liés à du Nvidia-bug.... Ou alors ma seconde barette est aussi cramée.... (tiens, j'avise une barette dans mon placard, si je la testais ?)

          --
          mansuetus @ spontex . org