Alors je peux donner des détails (aprés tout, c'est censé être le DC ou je suis responsable).
Le site de gnome est hébergé sur un cluster openshift, dans un DC à Raleigh (à Morrisville, pour être précis). Hier, il y a eu une mise à jour de firmware des switchs réseaux. C'était prévu, programmé, 1h d'intervention. C'est normalement une mise à jour de routine.
Spoiler, la mise à jour s'est mal passé. L'infra de Ceph (le projet) a eu des soucis (je n'ai pas vu le détail, un souci du coté des réglages de leurs serveurs). Et le cluster Openshift de GNOME a eu des soucis réseaux, et après plusieurs heures de debug, les ingés pensent que soit le firmware des SFP sur les serveurs de gnome ont un souci avec le nouveau firmware coté switch, soit les câbles ont un souci. En pratique, le LACP tombe par lui même, et c'est la même config que sur le cluster ceph (en tant que logiciel pour stockage d'image pour le cluster openshift de gnome) dans la même baie donc la panne hardware est probable.
Visiblement, c'est revenu, mais il y a intervention prévue aujourd'hui sur site pour changer le hardware.
# résumé
Posté par Psychofox (Mastodon) . Évalué à 5.
Le site était cassé, avec une page de configuration de wordpress initiale.
[^] # Re: résumé
Posté par Misc (site web personnel) . Évalué à 10.
Alors je peux donner des détails (aprés tout, c'est censé être le DC ou je suis responsable).
Le site de gnome est hébergé sur un cluster openshift, dans un DC à Raleigh (à Morrisville, pour être précis). Hier, il y a eu une mise à jour de firmware des switchs réseaux. C'était prévu, programmé, 1h d'intervention. C'est normalement une mise à jour de routine.
Spoiler, la mise à jour s'est mal passé. L'infra de Ceph (le projet) a eu des soucis (je n'ai pas vu le détail, un souci du coté des réglages de leurs serveurs). Et le cluster Openshift de GNOME a eu des soucis réseaux, et après plusieurs heures de debug, les ingés pensent que soit le firmware des SFP sur les serveurs de gnome ont un souci avec le nouveau firmware coté switch, soit les câbles ont un souci. En pratique, le LACP tombe par lui même, et c'est la même config que sur le cluster ceph (en tant que logiciel pour stockage d'image pour le cluster openshift de gnome) dans la même baie donc la panne hardware est probable.
Visiblement, c'est revenu, mais il y a intervention prévue aujourd'hui sur site pour changer le hardware.
Suivre le flux des commentaires
Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.