Web

 

Defekter EMC-Speicher legt Strato lahm

04.04.2001
Bei Strato ging mal wieder gar nichts. In der Woche nach der CeBIT waren die von dem Anbieter gehosteten Web-Seiten tagelang nicht verfügbar. Als Grund für die Panne nennen Strato und KPN Qwest als Betreiber des Rechenzentrums ein defektes "Symmetrix"-System von EMC.

CW-Bericht von Martin Bayer

MÜNCHEN (COMPUTERWOCHE) - Bei Strato ging mal wieder gar nichts. In der Woche nach der CeBIT waren die vom Berliner Serviceanbieter gehosteten Web-Seiten tagelang nicht verfügbar. Als Grund für die Panne nennen Strato und KPN Qwest als Betreiber des Rechenzentrums ein defektes "Symmetrix"-System von EMC. Die Schuld für den Ausfall des Speichers schieben sich die Beteiligten gegenseitig in die Schuhe.

Das Desaster im Karlsruher Rechenzentrum von KPN Qwest begann am 27. März um zirka 14.30 Uhr. Kurz darauf informierte Mario Hermann, Mitarbeiter im Strato-Forum, die Kunden, dass es "Unregelmäßigkeiten bei den Kundenpräsenzen" gebe. Die Techniker würden bereits an der Fehlerbehebung arbeiten. Bis dahin deutete alles auf einen kleineren Bug hin. Noch ahnte kein Kunde, dass die Web-Präsenzen tagelang ausfallen würden.

In den folgenden Stunden versuchten die Strato-Verantwortlichen, die Kunden immer wieder zu vertrösten. Spätestens am nächsten Morgen sollte das gesamte Angebot wieder verfügbar sein. Nachdem auch dieses Versprechen nicht eingelöst werden konnte, veröffentlichte die Strato AG am Vormittag des 28. März eine erste Stellungnahme. Demnach sei es am Tag zuvor zu einer Netzüberspannung gekommen, die zu einem "abrupten Shutdown der Speichereinheit geführt hat". Um die Datenkonsistenz sicherzustellen, sei ein Scan der Festplatten notwendig geworden. Ein Verlust von Daten sei jedoch auszuschließen. Am Mittwoch Nachmittag sollte das Angebot wieder vollständig online sein.

Malte Rademacher, Marketing-Leiter von EMC Deutschland, bestätigte in einer ersten Stellungnahme das Stromproblem. So habe ein System-Board des Symmetrix-Systems eine Überspannung festgestellt und sich daraufhin hart abgeschaltet. Dies sei notwendig gewesen, um den Datenbestand nicht zu gefährden. Aus Konsistenzgründen mussten in der Folge die File-Systeme überprüft werden, was eine gewisse Zeit dauere. Laut Rademacher sollten die Internet-Präsenzen nach etwa acht Stunden wieder verfügbar sein.

Strato-Kunden klagen über schlechte Informationspolitik

Doch damit täuschte sich der EMC-Manager. Auch am folgenden Tag war trotz der sich wiederholenden Strato-Beteuerungen, "dass sich die Unterbrechung der Dienste jetzt einem vollständigen und zufriedenstellenden Ende nähert", ein Großteil des Angebots immer noch nicht erreichbar. In verschiedenen Strato-Foren im Internet häuften sich unterdessen die Beschwerden. Die Hauptvorwürfe der meisten Kunden richteten sich gegen die Informationspolitik des Serviceanbieters. In vielen Kommentaren bezichtigten aufgebrachte User die Strato AG offen der Lüge. Verfügbarkeitsversprechen seien erstunken und erlogen.

Andere Kunden warfen dem Dienstleister Zensur im Strato-eigenen Forum vor. So würden Beiträge von den zuständigen Foren-Scouts sinnverändernd editiert, gesperrt oder gar gelöscht. Davon betroffen seien nicht nur beleidigende oder geschäftsschädigende Aussagen von Kunden, sondern es würden auch unangenehme Supportanfragen kommentarlos gelöscht. Ein Kunde, der Strato per Mail mitteilte, er werde das Unternehmen zur Verantwortung ziehen, erhielt von Strato-Mitarbeiter Cornelius Bartke die Antwort: "Mit Bezug auf das oben Zitierte aus Ihrer Mail wünsche ich Ihnen gutes Gelingen." Sören Heinze, Pressesprecher bei Strato, stachelte die Wut der Kunden mit der Bemerkung weiter an: "In den Foren gibt es viele, die einfach ihren Geltungsdrang ausleben, wenn sie nicht sogar direkten Konkurrenten nahe stehen".

Die technischen Störungen bekam Strato auch in den folgenden Tagen nicht in den Griff. Immer wieder beschwerten sich Kunden, ihre Web-Seiten seien kurzzeitig verfügbar und würden dann ohne ersichtlichen Grund wieder verschwinden. Die Ursachen für die langwierigen Schwierigkeiten blieben weiter im Dunkel. Neben Spekulationen über Hacker- und Virenangriffe sowie eine mögliche Sabotage im Karlsruher Rechenzentrum schien die Erklärung mit Stromproblemen noch am plausibelsten.

Strato schiebt EMC die Schuld in die Schuhe

Obwohl auch die offizielle Strato-Seite diese Version verbreitete, brachte überraschend Sigram Schindler, Vorstand des Strato-Mutterkonzerns Teles AG, eine neue Variante ins Spiel. Es gebe keine Hinweise auf ein externes Stromproblem. Eine Nachfrage beim lokalen Stromversorger habe ergeben, dass es am Unglückstag keine Spannungsspitzen aufgetreten seien. Der Schaden sei vielmehr durch das EMC-System selbst entstanden. "Nach Augenzeugenberichten waren einerseits elektronische Baugruppen in dem EMC-Subsystem verkokelt und haben andererseits die Tools zur Überprüfung der Integrität der auf ihnen gespeicherten Dateisysteme versagt", heißt es in einer offiziellen Verlautbarung der Teles AG. Der File-System-Check habe den Technikern vorgegaukelt, es sei alles in Ordnung, obwohl die Daten in Wirklichkeit korrumpiert waren. Deshalb seien Web-Seiten, die ins Netz gestellt wurden, auch schnell wieder verschwunden.

EMC-Manager Rademacher will sich die Schuld an der Strato-Katastrophe allerdings nicht so ohne weiteres zuschieben lassen. Die Einschätzung Schindlers bezeichnet er als reine Spekulation. EMC bleibe nach wie vor bei einem externen Stromproblem als Ursache. Auf die Frage nach Sicherheitsvorkehrungen in den Symmetrix-Systemen äußert Rademacher: "In Extremsituationen ist es möglich, dass die Notabschaltung vorgenommen wird, um weiteren Schaden zu verhindern." Wie eine solche Extremsituation aussehen könnte, vermag der Marketing-Manager allerdings nicht zu sagen.

Den Schwarzen Peter für die Ausfälle reicht EMC an Strato und KPN Qwest zurück. So habe es keinerlei Backup oder Spiegelung der Daten gegeben, mit deren Hilfe ein Recovery hätte gefahren werden können. Deshalb mussten die EMC-Techniker auf die Schnelle ein Tool schreiben, mit dessen Hilfe die Files logisch rekonstruiert werden konnten, erklärt Rademacher die Verzögerungen.

EMC-Image angekratzt

Bei Insidern stoßen die Erklärungsversuche von EMC auf Misstrauen. So sei es sehr unwahrscheinlich, dass in einem Rechenzentrum mit eigener Trafostation und USV-Anlagen eine Überspannung bis zu den Speicheranlagen durchdringe. Auch stelle sich die Frage, warum nur das Symmetrix-System durch den Stromstoss beschädigt worden sei und nicht die Sun-Server, die im gleichen Rechenzentrum stehen.

Der Ruf der EMC-Speicher bekommt mit der Strato-Panne weitere Kratzer. Ende letzten Jahres verursachte im Rechenzentrum der Lufthansa ebenfalls ein Symmetrix-Gerät einen Schwelbrand. Nach Angaben von Ulrich Sporeder, dem Leiter der Produktion im RZ, sei dadurch kein größerer Schaden entstanden. Rademacher erklärt den Unfall mit menschlichem Versagen. Ein EMC-Techniker habe bei einem Upgrade eine Festplatte falsch angeschlossen, so dass es zu einem Kurzschluss gekommen sei.

Im Fall Strato beginnen jetzt die Aufräumarbeiten und Schuldzuweisungen. Schindler erklärt, man werde neue Verträge mit KPN Qwest ausarbeiten, in denen eine Konventionalstrafe in zweistelliger Millionenhöhe festgeschrieben werden soll. Außerdem werde man darauf drängen, eine Datenspiegelung an einem geografisch anderen Ort anzulegen.

Bei KPN Qwest will man sich zu den Vorgängen trotz mehrmaliger Anfrage nicht äußern. Ein Pressesprecher verweist auf die Presseerklärungen der Strato AG und erklärt, man wolle erst das Ergebnis einer noch nicht näher definierten Untersuchungskommission abwarten. Ob jedoch Wirtschaftsprüfer von KPMG, die in die engere Auswahl gezogen werden, die technischen Hintergründe des Ausfalls klären können, darf man bezweifeln. Auch die Tatsache, dass EMC beschädigte Teile bereits ausgebaut und an sein Untersuchungslabor im irischen Cork geschickt hat, dürfte eine unabhängige Klärung der Vorfälle nicht gerade fördern. Es sei Strategie von EMC, Probleme bei Kunden schnell in Eigenregie zu deckeln, bevor etwas an die Öffentlichkeit dringe, erklärt ein Speicherexperte, der nicht genannt werden möchte.

Datenverluste bei 7000 Strato-Kunden

Wie die Strato-Kunden entschädigt werden sollen, steht noch nicht fest. Klar ist jedoch, dass angesichts der eingeräumten Datenverluste bei etwa 7000 Kunden eine Lawine von Schadenersatzforderungen auf Strato zurollen wird. Schindler hofft jedoch, kleinere Schäden unbürokratisch und außergerichtlich klären zu können. Auf einem Fragebogen im Internet sollen die Kunden ihre Ansprüche formulieren. Ob sich die Kleinkunden mit Schindlers "Ich glaube, wir können da 100 Mark rausrücken.", zufrieden geben, ist allerdings zweifelhaft. Die meisten werden wahrscheinlich ihre Drohungen wahr machen und zu einem anderen Anbieter wechseln. Umfangreichere Forderungen von Großkunden will Schindler auf KPN Qwest abwälzen.

Angesichts des mangelhaften Krisen-Managements hat die Teles AG erste personelle Konsequenzen gezogen. So wurde Sören Heinze als Leiter der Public-Relations-Abteilung abberufen. Die Frage, ob er als Bauernopfer für die aufgebrachten Kunden herhalten musste, wollte der ehemalige Pressemann nicht kommentieren.