SAN-Implementation bei der WestLB

Schneller Speicher für Börsenhändler

15.06.2001
Datenmengen wachsen schnell, Anwender stellen immer höhere Anforderungen an die Verfügbarkeit, lange Ausfallzeiten sind bei kritischen Geschäftsprozessen nicht akzeptabel. Um die Betriebssicherheit zu verbessern und den Speicher im Netz zu konsolidieren, hat die WestLB ein Storage-Area-Network installiert. Von CW-Mitarbeiter Jan Schulze

Einer Studie der University of California zufolge wird die Datenmenge, welche die Menschheit in den nächsten drei Jahren erzeugt, größer sein als die der vergangenen 40000 Jahre zusammen. Die Verwaltung, Sicherung und Aufbewahrung dieser Daten gehört zu den zentralen Herausforderungen, denen sich IT-Verantwortliche stellen müssen. Je mehr Daten eine Organisation produziert, desto schwieriger sind sie in den Griff zu bekommen. Gleichzeitig steigt die geschäftliche Relevanz der gespeicherten Informationen: Die meisten Geschäftsprozesse basieren inzwischen auf einer funktionierenden IT-Infrastruktur. Die IT-Abteilungen der Unternehmen müssen insbesondere geschäftskritische Daten und Applikationen mit hoher Verfügbarkeit bereitstellen. Die Anforderungen der Anwender in diesem Bereich sind enorm gestiegen. Ein hohes Maß an Betriebsbereitschaft bedeutet auch, dass die IT-Abteilungen für Wartung und Administration bei zunehmenden Datenvolumina immer weniger Zeit haben.

Dezentrale Client-Server-Strukturen haben vielerorts zu einer Form der Administration geführt, die - ein wenig ironisch - "Turnschuh-EDV" genannt wird: Die IT-Mitarbeiter legen bei verteilten Servern oft weite Wege zurück. Zum Beispiel müssen die Bänder für das Backup manuell an jedem einzelnen Server gewechselt werden.

So auch bei der Westdeutschen Landesbank Girozentrale (WestLB) in Düsseldorf. Durch das jahrelange Wachstum der IT entstand ein heterogenes Umfeld aus Mainframes und Client-Server-Systemen. Die überwiegend auf Unix und Windows NT basierende Infrastruktur wird durch den IT-Dienstleister "WestLB Systems" betrieben, eine Tocher der WestLB.

Zwei Probleme wurden immer dringlicher: Zum einen haben sich die dezentralen File-Server im Unternehmen ständig vermehrt, zum anderen wachsen die Datenbestände exponentiell an. Laut Christian Kortenbreer von System Management Trading der WestLB Systems ließ sich die Menge der Server kaum noch dezentral sichern: "Wir haben File-Server mit 150 GB und mehr Daten - und davon mehrere." Um die Sicherungsbänder an den Servern zu wechseln, war manuelles Eingreifen notwendig.

Geschäftsprozesse absichern

Besonders für die "WestLB Panmure" stellte sich diese Lösung als unbefriedigend heraus. Innerhalb der Bank befasst sich dieser Handelsbereich mit dem Aktien-Primär- und Sekundärmarktgeschäft. Längere Ausfallzeiten der IT in diesem Bereich sind nicht akzeptabel, da sie mit hohen finanziellen Verlusten verbunden sein können.

Die Wiederherstellung der Daten nach einem Totalausfall hätte über LAN und dezentrale Datensicherung zu viel Zeit in Anspruch genommen. Eine kurze Restore-Dauer ist für die Absicherung der Geschäftsprozesse zwingend: Sollten die File-Server in diesem kritischen Bereich ausfallen, könnten die Aktienhändler nur noch eingeschränkt arbeiten. Teamverzeichnisse, Bewertungstabellen und andere wichtige Unterlagen sind auf diesen Servern gespeichert. Auch die Profile der individuell zusammengestellten Screens, über die jeder Händler die für ihn wichtigen Informationen angezeigt bekommt, liegen im Netz. Bei einem Server-Ausfall müssten die Anwender die notwendigen Informationen, zum Beispiel eine Übersicht von Aktienkursen, manuell zusammenstellen. Je schneller deshalb die gesicherten Daten wieder zur Verfügung stehen, desto besser.

Noch teurer käme die Bank ein Ausfall derjenigen Server zu stehen, auf denen die Handelsapplikationen laufen. In diesem Fall wäre ein sinnvoller Geschäftsbetrieb überhaupt nicht mehr möglich.

Kleine Zeitfenster

Auch die Zeit für die Datensicherung wird immer knapper. Durch die ausgedehnten Handelszeiten an den Börsen arbeiten die Händler im Schichtbetrieb. Mit Vor- und Nachbereitung des Tagesgeschäfts ist die Abteilung rund 14 Stunden am Tag besetzt. Die zirka 330 Mitarbeiter von WestLB Panmure generieren in dieser Zeit 3 GB neue Daten, die gesichert werden müssen. Bei einer Vollsicherung fallen 100 bis 150 GB an. Nach Handelsschluss um 20 Uhr werden verschiedene Datenbank-Jobs ausgeführt und die Endverarbeitung der Daten angestoßen. So bleibt nur ein kleines Backup-Zeitfenster.

Zur Lösung dieser Probleme wurde bei der Bank über neue Speichertechnologien nachgedacht und die Entscheidung getroffen, ein Storage-Area-Network (SAN) zu implementieren. Die Initiative zur Pilotinstallation ging von der WestLB Panmure aus, die das System in der Anfangsphase auch weitestgehend exklusiv nutzte. Anlass war die Neuorganisation der IT, so Stefan Haschke, Leiter des Application Infrastructure Supports der WestLB Panmure in Düsseldorf: "Wir hatten ein Projekt initiiert, um die damals aus mehreren Domänen bestehende Infrastruktur zu einer Ressource-Domäne zusammenzuführen. Dadurch stieg die Zahl der Clients innerhalb der WestLB Panmure von anfangs 200 auf rund 400 bis 500 an." Die Konsollidierung der Domäne war wegen des raschen Wachstums dieses Geschäftsbereiches notwenig geworden.

In diesem Rahmen machten sich die IT-Verantwortlichen auch Gedanken über eine geeignete Speicher-Strategie, welche die Geschäftsprozesse abstützen kann. Aufwändige und zeitintensive Turnschuh-EDV sollte durch einen konsolidierten Sekundärspeicher (Speicher zur Datensicherung und Archivierung) ersetzt werden. Den IT-Verantwortlichen war klar, dass normale Bandlaufwerke oder kleine Wechslersysteme im neuen Netz der WestLB Panmure nicht mehr ausreichen würden. Für diese Aufgaben bot sich die Installation eines Storage-Area-Network an. SANs sind schnell, ermöglichen den zeitgleichen Zugriff durch mehrere Nutzer und sind durch ihre Skalierbarkeit einfach erweiterbar, wenn die vorhandene Speicherkapazität eines Tages nicht mehr ausreicht.

Durch das in einem SAN eingesetzte Fibre-Channel-Netz kann auch die Notfallabsicherung der Speichersysteme, etwa bei einem Brand oder Erdbeben, besser realisiert werden. Die Fibre-Channel-Technologie erlaubt es, problemlos einzelne Geräte über eine Entfernung von bis zu zehn Kilometern zu verbinden. So kann der Sekundärspeicher in einem anderen Gebäude als die zu sichernden Server aufgestellt werden. Auch ist es möglich, redundante und gespiegelte Speichereinheiten räumlich zu trennen, die sich gegenseitig Backup geben. Das Risiko eines Datenverlustes im Katastrophenfall lässt sich dadurch auf ein Minimum reduzieren.

Ein weiteres, aber laut Haschke eher zweitrangiges Argument bei der Neukonzeption des Massenspeichers waren für WestLB Panmure die potenziellen Einsparungen. Da ein zentraler Speicher weniger Adminstrationsaufwand erfordert als ein dezentraler, geht der Support-Manager von niedrigeren Wartungskosten aus.

Zur Realisierung des SAN-Pilotprojektes fand ein enger Dialog zwischen WestLB Panmure und WestLB Systems statt. In der Konzeptphase hielten Anwender und Dienstleister alle zwei Wochen Projekt-Meetings ab, um die Anforderungen zu definieren. Dabei mussten die Verantwortlichen auch die künftig benötigte Speicherkapazität kalkulieren. Dazu wurde der konkrete Speicherzuwachs über einen bestimmten Zeitraum ermittelt und dann interpoliert. Auch die Erfahrungswerte der IT-Administratoren flossen in die Kalkulation ein.

Noch kaum Standards

Bei dem Projekt kam der WestLB Systems zugute, dass sie bereits über eine Glasfaserverkabelung verfügte. Diese wurde genutzt, um die verschiedenen Etagen und Switches miteinander zu verbinden. Diese Verkabelung konnte bei der SAN-Implementation für das neue Fibre-Channel-Netz eingesetzt werden.

Die SAN-Technologie ist bislang nur wenig standardisiert und das Zusammenspiel von Komponenten verschiedener Hersteller schwierig. Die Verfügbarkeit des notwendigen Know-hows war deshalb laut Kortenbreer ein Problem: "SAN ist immer noch ein ziemlich neues Thema. Es werden zwar immer mehr Firmen SAN-Solution-Provider, aber wie viele Mitarbeiter haben die wirklich? Manchmal zwei, manchmal drei oder vier."

Da die WestLB Systems mit dieser Technologie Neuland betrat, holte sich das Projektteam weitere Partner ins Boot. Als Integrator wurde die Arxes AG ausgewählt, die wiederum auf das Know-how von TIM Storage Solutions zurückgriff. TIM ist spezialisiert darauf, Systemhäuser bei der Speicherintegration zu unterstützen.

In gemeinsamen Workshops wurde das neue Speichernetz geplant. Wegen der heterogenen IT-Struktur mit Unix- und Windows-NT-Servern konnte die WestLB nicht auf ein herstellerspezifisches SAN-System zurückgreifen. Stattdessen mussten die Verantwortlichen eine individuelle Lösung konzipieren. Um die geschäftskritischen Prozesse im Trading-Bereich während der Einführung nicht zu gefährden, wurde diese SAN-Lösung vorab im Labor durch TIM zertifiziert. Die Möglichkeit zur Laborzertifizierung war laut Kortenbreer ein entscheidener Punkt bei der Auswahl der Integratoren. Das reibungslose Zusammenspiel aller Komponenten untereinander sowie die Kompatibilität zu den vorhandenen Strukturen sollte sichergestellt sein.

Weiterer Ausbau

Kinderkrankheiten bei der Einführung ließen sich trotzdem nicht ganz vermeiden: "Das System ist nicht vom ersten Tag an so zum Fliegen gekommen, wie wir uns das gewünscht hätten. Es gab einige Hardwareausfälle, die dann teilweise zu Behinderungen im Backup-Prozess geführt haben", erinnert sich Haschke. Es dauerte rund vier Wochen, bis das SAN stabil lief. Probleme bei der Umsetzung des Projektes bereiteten vor allem die Treiberversionen der NT-Server. Diese mussten zum Treiberstand der Switches und den anderen Komponenten passen.

Seit ein paar Monaten ist die Implementation des Sekundärspeichers abgeschlossen. Als nächsten Schritt plant die WestLB Systems, die SAN-Strategie auf den primären Speicher auszuweiten und allen Kunden anzubieten. Der Primärspeicher ist der zugriffsintensive Speicher, auf dem Daten im Netz bereitgestellt und verarbeitet werden. Hiermit sollen die Geschäftsprozesse weiter abgesichert werden.

Bei den zurzeit eingesetzten Mitteln dauert das vollständige Wiederherstellen aller Daten des Geschäftsbereiches zwölf bis 15 Stunden, so Haschke, was hart an der Grenze des Akzeptablen sei. Durch den Primärspeicher im SAN lässt sich diese Zeit weiter verkürzen: "Ideal wäre weniger als eine Stunde. Dies soll laut WestLB Systems mit einem gespiegelten Primärspeicher realisiert werden können", erläutert Haschke das Ziel.

Banken unterliegen strengen Vorschriften, wie lange sie Daten aufbewahren müssen. Dabei hängt die Lagerpflicht von der Art der Daten ab. Bis zu zehn Jahre liegen die Bänder in Tresorräumen. Da mit der jetzigen Speicherstruktur die verschiedenen Datenarten nicht trennbar sind, muss jede wichtige und jede unwichtige Information über den maximalen Zeitraum aufbewahrt werden, was unnötige Kosten verursacht. Durch den geplanten neuen Primärspeicher könnte eventuell auch diese Problem gelöst werden, so Haschke.

Zurzeit werden die verschiedenen Möglichkeiten für den nächsten Schritt in der Speicherstrategie geprüft. Da mittlerweile zunehmend auch andere Geschäftsbereiche der Bank das SAN benutzen, favorisiert nicht mehr nur Panmure den weiteren Ausbau der Struktur - aus finanzieller und strategischer Sicht. Derzeit prüft die WestLB Systems auch die Einsatzmöglichkeit alternativer Speichertechnologien. Der neue Primärspeicher soll im Laufe dieses Jahres eingeführt werden.

Trotz der hohen Investitionskosten für die Umsetzung des Pilotprojektes stellt sich die Frage nach dem Return on Investment für die WestLB Panmure erst in zweiter Linie. Entscheidend ist, wie viel Aufwand man durch das zentrale System vermeiden kann und ob die anfallende Datenmenge mit dem alten System überhaupt noch sinnvoll verwaltbar gewesen wäre. Hier sind sich Haschke und Kortenbreer einig: Ab einer gewissen Größe komme die Dezentralisierung wesentlich teurer zu stehen als die Zentralisierung.

Problempunkt Wartungsvertrag

Wie hoch das gesamte Investitionsvolumen ausfällt, steht noch nicht fest. Die Hardware ist im Besitz der WestLB Systems. Dieser obliegt auch die Wartung des Netzes. WestLB Panmure kauft die Services, etwa das Backup, beim Dienstleister. Das Verrechnungsmodell sieht einen Pauschalpreis pro GB vor.

Obwohl die Mitarbeiter der WestLB Systems mittlerweile durch Schulungen und die Lösung konkreter Probleme bei der Einführung eigenes SAN-Know-how aufgebaut haben, soll ein Wartungsvertrag mit Arxes abgeschlossen werden. Bei einem Systemausfall möchte die WestLB Systems nur einen einzigen Ansprechpartner haben, der zum "Problem-Owner" wird. Dieser Projektpunkt wurde unterschätzt, so Kortenbreer. "Das sind wir zu spät angegangen. Es war eine relativ schwere Geburt für die Anbieter, unsere Anforderungen in einem Wartungsvertrag umzusetzen." Dafür seien zwei Gründe entscheidend gewesen: Zum einen fehle es noch an den notwendigen Strukturen, zum anderen müssten mehrere Unternehmen die Wartungsanforderungen abdecken, da Komponenten verschiedener Hersteller integriert wurden. Doch auch ohne einen Wartungsvertrag wurden alle Probleme bei der Installation von den beteiligten Unternehmen gelöst.

Da die Datenmengen auch in anderen Bereichen ständig steigen, geht Kortenbreer davon aus, dass diese Technologie in absehbarer Zeit dem gesamten Konzern zur Verfügung gestellt wird. "An E-Mails zum Beispiel werden immer mehr und größere Attachments angehängt." Die Zeitfenster werden allgemein immer enger. Nicht nur bei der WestLB.

Storage-Area-Network

Ein Storage-Area-Network (SAN) ist ein Hochgeschwindigkeitsspeichernetz, das den Massenspeicher logisch mit den Servern verbindet. Dieses Netz basiert auf Fibre-Channel-Technologie (FC), einer Vernetzungstechnik durch Glasfaserkabel. Durch den Einsatz eines SANs wird der Datenverkehr zwischen Clients und Servern sowie zwischen Servern und Speicher entkoppelt. Das Client-Server-Netz (LAN) ist dadurch weit gehend von den Speicherjobs, zum Beispiel Backup, Restore oder der Indizierung einer Datenbank entlastet, die ansonsten einen großen Teil der verfügbaren Bandbreite belegen würden. Der Datendurchsatz des FC-Netzes beträgt bis zu 100 MB pro Sekunde und pro Kanal.

Abb: Zentraler Speicher

SANs ermöglichen die zentrale Administration des Speichers und entlasten das LAN. (Quelle: CW)