Panne du week-end

Posté par (page perso) . Modéré par Florent Zara.
Tags : aucun
27
24
mai
2010
LinuxFr.org
Le site LinuxFr.org et les services associés étaient en panne ce week-end. Le serveur qui les héberge a fait un kernel panic samedi matin (il semblerait que ce soit un problème lié au RAID).

Le serveur a pu être redémarré grâce à une intervention du NOC de la fondation Free. Nous les remercions pour s'être déplacé un week-end et plus généralement, pour l'hébergement que la fondation Free nous fournit depuis plusieurs années.
  • # bande de geeks!

    Posté par . Évalué à 10.

    le blackout fut déroutant mais salutaire: il a fait beau ce weekend
  • # Heureusement, y'avait le skyblog

    Posté par (page perso) . Évalué à 10.

    Sans ça, je crois qu'on aurait pas tenu le choc.

    http://linuxfr.skyrock.com/
  • # Heureusement, y'avait twitter

    Posté par (page perso) . Évalué à 4.

    Sans ça, je crois qu'on aurait pas tenu le choc.

    http://twitter.com/#search?q=linuxfr
  • # Ouf

    Posté par . Évalué à 10.

    Ouf, c'est revenu, j'ai eu peur d'avoir à travailler cette semaine.
  • # Le syndrome SNCF

    Posté par (page perso) . Évalué à 5.

    Il ne fallait pas mouler sur la SNCF, c'est sa vengeance, sa malédiction ! Depuis le temps qu'on crachait sur ce site boiteux codé en java (bon c'est la même chose), ça allait forcément nous retomber dessus !

    Bon, on a eu notre quota de représailles, reprenons : le site de la SNCF sapuh.

    Commentaire sous licence LPRAB - http://sam.zoy.org/lprab/

  • # Coïncidence troublante

    Posté par . Évalué à 2.

    Vous avez la même machine que voyages-sncf.com ?
  • # C'était donc ça...

    Posté par . Évalué à 10.

    Pendant un moment j'ai cru que le site avait migré vers la nouvelle version en RoR et qu'il n'avait pas résisté au premier pic de charge...
    • [^] # Re: C'était donc ça...

      Posté par . Évalué à 9.

      Ils préféront prétendre que c'est une panne hardware ou un crash du système plutôt que de le reconnaitre.
  • # le hasard

    Posté par . Évalué à 4.

    mais lol!!! voilà que je bidouille mon firefox (about:config) et pan!!! plus de linuxfr.... j'ai passé tout le weekend à tenter de réparer XD

    bon ben je vais noyer ma folie dan la faro du coup Oo
    • [^] # Re: le hasard

      Posté par (page perso) . Évalué à 2.

      >bon ben je vais noyer ma folie dan la faro du coup Oo
      on dit le faro
      • [^] # Re: le hasard

        Posté par . Évalué à 1.

        je parlais de la bierre, je savais pas qu'il fallait dire "le" .

        c'est valable pour toutes les bierres ?

        (c'est un peux hs mais ça m'interpelle du coup)
        • [^] # Re: le hasard

          Posté par (page perso) . Évalué à 2.

          Non, ça dépend de la bière: on dit un Orval mais une Rochefort

          « Rappelez-vous toujours que si la Gestapo avait les moyens de vous faire parler, les politiciens ont, eux, les moyens de vous faire taire. » Coluche

          • [^] # Re: le hasard

            Posté par (page perso) . Évalué à 2.

            la chimay bleue c'est pas mal non plus ;-)
            • [^] # Re: le hasard

              Posté par (page perso) . Évalué à 3.

              La Westvleteren est quand même bien meilleure

              « Rappelez-vous toujours que si la Gestapo avait les moyens de vous faire parler, les politiciens ont, eux, les moyens de vous faire taire. » Coluche

    • [^] # Re: le hasard

      Posté par . Évalué à 6.

      Une bonne occasion de citer :

      http://downforeveryoneorjustme.com/

      :)
  • # ...

    Posté par . Évalué à 10.

    Suis je le seul a trouver fou qu'il faille une personne pour rebooter le serveur ?

    Il existe tellement de solution pour faire de l'admin a distance :
    - le top : interrupteur pilotable + console série a distance
    - un watchdog (hardware ou software) qui reboot le serveur une fois qu'il est planté (plus éventuellement une detection du reboot sur watchdog dans le bootloader qui redémare dans un mode "sans echec" (disque read only, ...) pour que l'admin puisse trouver la cause du plantage
    - la méthode bourine : configurer le kernel pour rebooter en cas de panic


    Apres s'il faut remplacer des pièces disque dur qui lache ok.
    • [^] # Re: ...

      Posté par (page perso) . Évalué à 2.

      Il y a aussi un watchdog dans le noyau, le cas échéant le noyau reboote la machine.

      Système - Réseau - Sécurité Open Source

    • [^] # Re: ...

      Posté par (page perso) . Évalué à 2.

      C'est vrai que de nos jours, je n'installe plus jamais un serveurs sans :

      - accès à distance type ILO/BMC ou un kvm ip, ou dans le pire des cas ipmi
      - une réglette apc manageable

      et effectivement il faut configurer les watchdog matériel, et autre reboot après crash.

      Parce que mine de rien devoir se bouger dans un DC pour faire juste un pauvre reboot c'est pas hyper productif.
  • # Changer d'OS

    Posté par (page perso) . Évalué à -1.

    Vous n'auriez pas rencontré ce genre de problèmes si vous étiez sous Windows Seven. C'est pour quand le changement?

Suivre le flux des commentaires

Note : les commentaires appartiennent à ceux qui les ont postés. Nous n'en sommes pas responsables.