Incident du 26 août 2025 ayant touché les serveurs de production et de développement

Posté par  (site web personnel) . Édité par BAud et Jona. Modéré par Julien Jorge. Licence CC By‑SA.
Étiquettes :
15
27
août
2025
LinuxFr.org

Il y a exactement deux mois, un incident était survenu suite à un redémarrage brutal du serveur hébergeant les conteneurs de production et de développement ayant entraîné une attribution inattendue d’adresses IP. Et des réponses techniques 502 Bad Gateway pour notre lectorat.

Ce 26 août, vers 15:22, un message peu engageant est arrivé par pneumatique sur nos téléscripteurs (via Signal pour être précis) : « Tiens c’est bizarre j’ai perdu accès au site. Et au serveur oups. » L’après-midi et la soirée furent longues.

Incident du 26 juin 2025 ayant touché les serveurs de production et de développement

Posté par  (site web personnel) . Édité par Florent Zara, palm123 et bobble bubble. Modéré par Florent Zara. Licence CC By‑SA.
Étiquettes :
38
27
juin
2025
LinuxFr.org

Ayant simultanément ressenti un trouble dans la force, vos administrateurs des serveurs LinuxFr.org ont noté un souci sur le site hier matin. Et d'autres personnes de l'équipe ont aussi signalé le problème (supervision efficace et réactive par le lectorat).

Le serveur hébergeant les conteneurs de production et de développement a redémarré (hors de toute opération planifiée) à 06h15 Paris le 26 juin 2025, et contrairement aux redémarrages habituels pour les mises à jour, cela a entraîné un changement des adresses IP internes des conteneurs de production et de développement, après redémarrage (06h18). Tous les services avaient bien redémarré, mais les accès aux sites web n'étaient plus possibles : le serveur web frontal ne pouvait plus joindre les adresses prévues, aboutissant à des réponses techniques 502 Bad Gateway.

La correction sur les adresses IP a été faite à 08h08 pour la production et 08h16 pour le développement.

Les deux autres serveurs hébergés au même endroit n'ont pas été affectés.

Journal Les conséquences réseaux d'un partage sur LinuxFR

Posté par  . Licence CC By‑SA.
20
9
juil.
2018

Introduction

Le précédent article de votre humble serviteur, intitulé "utiliser android de façon plus sécurisée" (lien), fut riche en requêtes réseau jusqu'à plus soif.
Comme l'ouvrage originale fut linké autant dans la partie forum, que journal et dépêche de LinuxFR: on peut en profiter pour tenter de visualiser un échantillon éphémère des mouvements réseaux engendré par ces links.
Nous n'allons certes pas découvrir la réponse à la grande question, mais découvrir que de simple liens peuvent (…)

Post‐mortem de l’incident du 3 juin 2018

Posté par  (site web personnel, Mastodon) . Édité par Davy Defaud, ZeroHeure et Florent Zara. Modéré par Pierre Jarillon. Licence CC By‑SA.
50
5
juin
2018
LinuxFr.org

Beaucoup d’entre‐vous s’en sont rendus compte, le certificat X.509 utilisé par LinuxFr.org a expiré ce 3 juin 2018. Retour sur cet incident et sur le renouvellement de ce certificat dans la seconde partie de cette dépêche.

Forum Linux.debian/ubuntu enquête post-mortem sur un serveur

Posté par  (site web personnel, Mastodon) .
Étiquettes :
3
23
mar.
2010
Bonjour,

J'ai un problème récurrent sur un de mes serveurs. De temps en temps, il monte terriblement en charge (très très rapidement) et semble surtout saturer au niveau des I/O du disque dur.

Cela fait planter le kernel, ce qui n'est pas gloups.

Le problème, c'est que je ne trouve rien de parlant dans les logs et que je n'ai aucune idée de ce qui provoque ce problème.


Comment faites-vous pour savoir, après un crash, ce qui a été la (…)