RZ Störung 05.10.2022 - 08:45 Uhr

RZ Störung 05.10.2022 - 08:45 Uhr

06.10.2022 UpDate - Fehlerbeschreibung

 

Problem 1

Bauarbeiten auf der Teststrecke auf der A5 zwischen Darmstadt und Frankfurt haben  physisch eine Datenverbindung zwischen dem Rechenzentrum in Darmstadt und dem Verteilerknoten (DE-CIX) gekappt. Die automatische Umschaltung auf eine geplante Alternativ-Strecke hat reibungsfrei gegriffen und ist in Betrieb gegangen.

 

Problem 2 (Folgeproblem)

Router anderer Netzbetreiber haben auf die Routenänderung fehlerhaft reagiert. Im Falle einer Routenänderung kommunizieren Router untereinander ihre Zuständigkeiten (Master / Slave). Hier konnte eine Fehlfunktion festgestellt werden (https://twitter.com/qrator_radar/status/1577748939805278209?s=61&t=UmS6hKfRjYmgvP-y7srgkA) die zur Überlastung und somit praktischen Ausfall auch der alternativen Routen geführt haben.

 

Die vertraglich für EXPO-IP GmbH arbeitenden Netz- und Rechenzentrumsbetreiber konnten das Problem über weitere alternative Routen und Konfigurationen vorab beheben.


05.10.2022
Aufgrund von Bauarbeiten auf der Autobahnstrecke A5 wurde im Rechenzentrum eine Kabelverbindung zerstört. Der Betreiber bemüht sich die Störung so schnell wie möglich zu beheben.

UpDate 10:25 Uhr: Das RZ muss einen Notfallplan starten. Im schlimmsten Falle wird die Behebung der Störung noch bis zu 2 Stunden in Anspruch nehmen. Man bemüht sich die Systeme schnelle wieder ans Netz zu nehmen - dies ist aber nicht gewährleistet.

UpDate 11:50 Uhr: Der Notfallplan hat gegriffen. Alle Systeme sind wieder am Netz. Die Störung ist behoben und alle Systeme sind stabil erreichbar.