Die Zukunft der Rechenzentren/Energieversorger setzte auf Wolfpack: Kein Wolf im Schafspelz

Mit Clustering die Server vor dem Kollaps schützen

12.12.1997

Nicht weniger als vier Milliarden Dollar gehen alleine US-amerikanischen Unternehmen aufgrund von Server-Ausfällen jährlich durch die Lappen - Tendenz steigend. Kollabierende Server wirken sich, ganz abgesehen vom Produktivitätsverlust interner Mitarbeiter, um so gravierender aus, wenn ihretwegen geplante Geschäfte mit Kunden nicht zum Abschluß kommen - vom drohenden Ansehens- und Vertrauensverlust zu schweigen.

Im Zeitalter des Electronic Commerce verlangen IT-Abteilungen zunehmend nach verfügbaren und vor allem zuverlässigen Servern. Kein Wunder also, daß sowohl Hard- als auch Softwarehersteller an auf Client-Server ausgerichteten Möglichkeiten tüfteln, um die Zuverlässigkeit und Verfügbarkeit moderner IT-Topologien zu erhöhen. Unter Verfügbarkeit verstehen die Hersteller dabei vor allem eines: Das prozentuale Verhältnis zwischen Gesamtbetriebsdauer und der Zeit, in der ein beliebiges System tatsächlich arbeitet. Eine Verfügbarkeit von 99 Prozent bedeutet dabei beispielsweise, daß ein System 80 Stunden pro Jahr seinen Dienst verweigert - summa summarum ein bis zwei Stunden pro Woche.

Anwender sollen vom Ausfall nichts bemerken

Diese Zahlen stimmen nachdenklich, zumal nur selten die Hardware Ursache des Dilemmas ist. Einer Fallstudie von Tandem zufolge sinkt die Zahl der Systemausfälle durch Hardwaredefekte sehr stark, während mittlerweile rund zwei Drittel aller DV-Katastrophen durch fehlerhafte Software und falsche Bedienung verursacht werden. Ziel aller Anbieter ist es deshalb seit einiger Zeit, einen Server-Ausfall durch Ersatzressourcen so gut zu überbrücken, daß der Anwender davon nichts - oder zumindest sowenig wie möglich - mitbekommt und weiterarbeiten kann. Unter diesem Motto steht die Clustering-Technologie.

Dabei setzt sich ein Cluster aus mehreren unabhängigen Einzelsystemen zusammen und stellt sich logisch wie ein einziger Server dar. Fällt ein Server aus, übernehmen andere Systeme die Tätigkeiten des Hauptrechners. Diese theoretische Konzeption erfordert allerdings eine spezielle Clustering-Software. Mit "Microsoft Cluster Server", ehemals "Wolfpack", das als Application Programming Interface (API) über das Betriebssystem gestülpt wird, bietet etwa die Gates-Company eine Alternative. Die einzelnen Server überwachen sich dabei gegenseitig, um im Falle eines Falles einspringen zu können. Nach rund 20 bis 40 Sekunden - so der Idealfall - übernimmt der Neben-Server die Aufgaben des Hauptsystems.

"Wir haben nach einer akzeptablen Sicherheit gesucht und sind so auf das Thema Clustering aufmerksam geworden", lassen Marion Krinke, zuständig für die Anwendungsbetreuung, und Jürgen Gebauer, Netzadministrator bei der Oder-Spree-Energieversorgung AG, die Anfang des Jahres begonnene Einführung der Clustering-Technologie Revue passieren. Nach intensiver Bewertung der auf dem Markt erhältlichen Produkte haben sich die IT-Experten aus Frankfurt (Oder) für "Microsofts Cluster Server" (Wolfpack) als Clustering-Basis für ihre zwei Prioris-ZX-6000-PCs von Digital entschieden. Als Plattenspeicher stehen den DV-Profis Raid-5-Systeme mit einer Gesamtkapazität von 18 GB zur Verfügung.

Die geschäftskritischen Faktoren Zeit beziehungsweise Verfügbarkeit des Servers standen - wie in allen Clustering-Projekten - auch bei den Energieversorgern an oberster Stelle der Prioritätenliste: "Wir betreiben mit unserem Archivierungssystem eine zeitkritische Anwendung. Wenn uns der Server wegbricht, dann können die Kundensachbearbeiter weder in der Post recherchieren noch sie bearbeiten", erläutert Krinke, weshalb man bereits die amerikanische Betaversion der Microsoft-Software unter die Lupe nahm.

Das Augenmerk des DV-Teams der Oder-Spree-Energieversorgung gilt dabei zwei separat agierenden Maschinen. Während der Haupt-Server die übliche Arbeit mit den angeschlossenen Clients verrichtet, "fragt der Neben-Server ständig nach, ob die Hauptmaschine noch im Einsatz ist." Fällt der Haupt-Server aus, übernimmt der zweite Rechner automatisch die Funktion des Hauptsystems, inklusive dessen Plattenstapel sowie den Anwendungen.

Von 20 bis 40 Sekunden maximaler Ausfallzeit - wie es Microsoft mit seinem Cluster Server schon propagiert hat - kann laut Gebauer jedoch noch keine Rede sein: "Im Moment beträgt die Zeit, bis der andere Rechner die Anwendung übernehmen kann, etwa drei Minuten", lautet das etwas ernüchternde Resümee Gebauers . Dennoch sei man nach einem Server-Fiasko in der Lage, die diversen Dienste von Win- dows NT 4.0 erneut hochzufahren und sämtliche Anwendungen ohne große Mühen wieder zum Laufen zu bringen. Diese Prozedur bleibe für den Endanwender am Front-end mehr oder weniger unbemerkt. Lediglich eine neue Anmeldung an der Anwendung sei, so die Erfahrung der DV-Expertin, unter Umständen nötig.

Dieses Manko hänge jedoch nicht mit dem Cluster-Server selbst zusammen, sondern vielmehr mit den einzelnen, auf den Front-ends installierten Applikationen: "Leider gibt es noch nicht allzu viele Cluster-fähige Anwendungen", moniert Krinke. Derartige Applikationen sind nämlich in der Lage, sich nach einem Absturz des Servers im Rahmen des sogenannten "Retry-Prinzips" ohne besonderes Zutun des Anwenders eigenständig wieder anzumelden. Krinkes Kritik: "Die Programme, die wir bis dato im Einsatz haben, sind leider noch nicht Cluster-fähig." Selbst Microsofts Bürosuite "Office" besitze derartige Fähigkeiten nicht.

Demzufolge behilft sich die Energieversorgungs AG derzeit mit Fail-Over-Scripts. Diese dienen dazu, Anwender via Nachricht auf den nicht mehr intakten Server aufmerksam zu machen, um anschließend ein erneutes Einloggen des Users zuzulassen. Den Traum, in Zukunft eventuell ohne jegliche Ausfallzeiten arbeiten zu können, haben die DV-Spezialisten jedoch nicht ganz ad acta gelegt. "Null Ausfallzeit erreicht man, wenn Cluster-fähige Software eingesetzt wird", weiß Krinke.

Die Entscheidung für Microsofts Lösung fiel der Oder-Spree-Energieversorgung nicht allzu schwer. Zwar habe sich zunächst Digitals Pendant auf dem Prüfstand befunden, "aber das Produkt hatte den Nachteil, daß neben den Servern auch jeder Client eine spezielle Software benötigt hätte", begründet Gebauer das K.o.-Kriterium. Darüber hinaus sei es unabdingbar gewesen, jedes Update auch auf den einzelnen im Unternehmen befindlichen Clients nachzuvollziehen. Microsofts Lösung hingegen biete den Vorteil, derartige Betreuung ausschließlich Server-seitig zu benötigen.

Dennoch ist auch bei den Energieversorgern aus Frankfurt (Oder) trotz allgemeiner Zufriedenheit nicht alles Gold was glänzt: "Verbesserungswürdig ist in erster Linie die Anwendungssoftware", lautet die Forderung von Krinke. Dringend nötig seien zusätzliche Cluster-fähige Applikationen, um Microsofts Cluster Server mit allen Schikanen einsetzen zu können. Ferner ließe sich durch interne Optimierung des Netzes sowie der Cluster-Software die Ausfallzeit von derzeit drei Minuten auf maximal 30 Sekunden reduzieren.

Von der gänzlichen Befreiung von jeglichen Ausfallzeiten träumt man bei der OSE AG nicht nur, denn: Das im Einsatz befindliche Archivierungssystem "Hyperarchiv" von ACS, Hamburg, wird derzeit auf eine neue Version umgestellt, die im Mai 98 im Zusammenhang mit MS Exchange und dem MS SQL-Server Clusterfähig laufen soll. Doch werden schon jetzt freigegebene Teile des Archivs über das Zusatzprodukt Web Link von der ISP-NET GmbH, das mit dem MS Internet Information Server kommuniziert, für Internet-Anwendungen zur Verfügung gestellt. ACS-Projektleiter Hansjörg Peters erläutert: "Aus einer Kombination von Failover-Prozeduren mit dem ins NT-Betriebssystem integrieren MS IIS kann schon jetzt eine höhere Ausfallsicherheit mittels Clustering erreicht werden. Leider fehlen uns im Moment noch entsprechende Hardware-Produkte, wie zum Beispiel CD- Jukeboxen, die das hardwareseitig unterstützen."

Programme rund um die Uhr einsatzfähig

Von einem ist die Mannschaft der Energieversorger - Client-Problematik hin oder her - überzeugt: Der Clustering-Technologie auf PC-Basis gehört die Zukunft. Im Zeichen des Internet und der internen Kommunikation über Intranets sind ausfallsichere Clustering-Systeme auch nach Meinung von Jürgen Gebauer, Administrator für Server und Netze im Unternehmen, zunehmend von Bedeutung: "Diese Fähigkeit wird immer wichtiger."

Vorstellbar sei auch ein noch ausfallsichereres Netz mit mehr als zwei Servern, die sich die Lasten der einzelnen Systeme teilen. So könnte man es sich beispielsweise leisten, mehrere Anwendungen wie etwa SQL-Datenbank-Server und Exchange in einem einzigen Cluster zur Verfügung zu stellen. Dies gewährleiste nicht nur, daß Programme nahezu rund um die Uhr einsatzfähig seien, sondern reduziere zudem die erforderlichen Hardwareressourcen immens.

Für Gebauer jedenfalls steht fest: Die Cluster-fähige DV löst mehr und mehr klassische RZ-Umgebungen ab, in denen bis dato die Ausfallsicherheit als schlagkräftigstes Argument gegen Client-Server-basierte Topologien zählte. "Besonders wenn man es mit Kunden zu tun hat, kann man es sich heutzutage nicht mehr leisten, daß auch nur ein System ausfällt." Gebauer: "Clustering gehört die Zukunft".

Angeklickt

Zeit ist Geld - das heiligste aller marktwirtschaftlichen Gebote galt zumindest in PC-orientierten DV-Kreisen nur recht selten. Server-Ausfälle, Programmabstürze und die damit verbundenen Produktivitätsverluste besaßen in IT-Umgebungen bis dato den Status "unvermeidbare Nebenerscheinung". Dies soll sich in Zukunft ändern: Unter dem Stichwort "Clustering-Technologie" versuchen Hardwerker und Softwarehersteller Hand in Hand, das wichtigste aller positiven RZ-Argumente, die Verfügbarkeit, zu entkräften. Auch für die Oder-Spree-Energieversorgung AG aus Frankfurt an der Oder lautete deshalb die Devise: Clustering-Technologie, jetzt oder nie.

*Stefanie Schneider ist freie Journalistin in Isen.