Fehlertolerant heißt nicht unfehlbar

Iceberg-Raid-System versagte aus bisher ungeklärten Gründen

31.05.1996

Der Defekt trat am 10. Mai 1996 an dem Raid-6-System im neuen Rechenzentrum der Meldestelle in Chelsea, Massachusetts, auf. Erste Fehlermeldungen gab das Gerät, das erst wenige Wochen zuvor angeschafft worden war, um das schlechte Antwortverhalten eines zuvor allein installierten "Iceberg"-Arrays mit einer Kapazität von 270 GB zu verbessern, bereits einen Tag vorher am 9. Mai aus. Diese konnten durch den Austausch einiger Boards behoben werden, bis dann am Folgetag das System endgültig zusammenbrach.

Bedienstete des Rechenzentrums, das um einen Amdahl-Mainframe herum aufgebaut ist, waren nach einiger Zeit in der Lage, das gesamte Datenvolumen von 450 GB auf das noch funk- tionsfähige Iceberg-System zu übertragen, so daß zumindest eine beschränkte Anzahl von Mitarbeitern bei deutlich reduzierter Systemleistung wieder auf die Daten zugreifen konnte.

Laut Storagetek einmaliger Vorfall

Am 12. Mai flog Storagetek eine Ersatzeinheit ein und nahm das defekte System zur Analyse mit zum Hauptsitz des Unternehmens in Louisville, Colorado, so daß nach zwei Tagen der Normalzustand wiederhergestellt und das System bereit für die im Schnitt 750 000 täglich anfallenden Transaktionen war.

Nach Aussagen von Joe Beal, Leiter des Kundendienstes von Storagetek, war dies der erste derartige Vorfall bei einer Gesamtzahl von 1700 vergleichbaren Installationen. Außerdem seien, was von Mitarbeitern des Rechenzentrums bestätigt wurde, trotz des Systemversagens keinerlei Datenverluste eingetreten. Beal sagte ferner: "Wir haben noch nie zuvor diesen Fehler gesehen, bei dem wir nicht in der Lage waren, vor Ort den Controller wieder in Gang zu bekommen."

Der Vorfall hat der Reputation von Behörde und Hersteller geschadet. So äußerte sich beispielsweise John McArthur, Research Director von International Data Corp. (IDC) in Framingham, Massachusetts, zu dem Vorfall wie folgt: "Storagetek hatte Glück, daß der Ausfall in der Registrierstelle und an einem Freitag geschah. Wäre dies in einer Finanzinstitution während des Jahreabschlusses passiert, hätten die Auswirkungen verheerend sein können, nicht nur ärgerlich."