Klippen auf dem Weg zum Cluster

03.09.2003
Von 
Ludger Schmitz war freiberuflicher IT-Journalist in Kelheim. Er ist spezialisiert auf Open Source und neue Open-Initiativen.

Und schließlich sollten Anwender die Ausfallsicherheit im Auge behalten. Die permanente maximale Auslastung eines Clusters ist kein erstrebenswertes Ziel. Allein Hitzeprobleme erhöhen die Wahrscheinlichkeit eines Defekts. Alle Einzelelemente des Rechnerverbundes haben erfahrungsgemäß eine durchschnittliche Funktionsfähigkeit (Main-time between failure, Mbtf) von 30.000 bis 60.000 Stunden. Doch ein Tag mit extremen Außentemperaturen und eine schlechte Klimatisierung lassen die CPUs in den engen Racks weit vor dem Durchschnittswert überhitzen und ausfallen. Noch häufiger kommt vor, dass Peripheriemodule, beispielsweise Netzwerkkarten, ihren Dienst versagen und damit einen Rechnerknoten lahm legen.

Die naheliegende Sorge um die Verfügbarkeit der Anwendungen sollte allerdings auch nicht dazu verleiten, ein Cluster zu großzügig auszulegen. Orientierungsgrößen sind die durchschnittliche und die Spitzenauslastung der bisher genutzten Server. Ein Cluster bietet schließlich den Vorteil, sich sehr schnell nach Bedarf ausbauen zu lassen. Wie lange gegebenenfalls eine eingeschränkte Leistung ökonomisch akzeptabel ist, muss jeder Anwender selbst kalkulieren. Im Prinzip lässt sich danach zwischen zwei Cluster-Typen differenzieren.

Einer teile des anderen Last

In einem "Active/passive-Cluster" sind grundsätzlich alle Komponenten zweifach ausgelegt. Es gibt ein Primärsystem und ein Backup, das einspringt, wenn das erste System ausfällt. Dann muss das redundante Teil in der Lage sein, augenblicklich alle Aufgaben eines Rechnerknotens zu übernehmen und Transaktionen weiterzuführen oder neu zu starten. Derlei ist eigentlich nur in wenigen Business-Anwendungen erforderlich, nämlich dort, wo Redundanz die Systemverfügbarkeit hoch halten muss, beispielsweise bei Banken. Doch dann unterscheiden sich Cluster unter betriebswirtschaftlichen Aspekten vordergründig nicht mehr von anderen redundanten oder fehlertoleranten Servern.

Daher verbreiten sich heute in Unternehmen vor allem "Active/active-Cluster". In ihnen ist jede Rechnerkomponente jederzeit aktiv. Beim Ausfall eines Netzknotens übernimmt ein anderer seine Aufgaben. Mit Hilfe des System-Managements lässt sich vermeiden, dass die Umleitung von Tasks zu Flaschenhälsen führt.