Failover kompletter Data Center

Ratgeber - Rechenzentrum mit Metrocluster absichern

25.01.2013 von Heiko Wüst
Feuer, Erdbeben, Überschwemmung oder kompletter Stromausfall - seltene Ereignisse, aber sie können ein Rechenzentrum außer Betrieb setzen. Wer Hochverfügbarkeit seiner IT-Systeme benötigt, sollte auf Metrocluster setzen. Beim Ausfall eines Data Centers wird auf ein zweites umgeschaltet.

Redundanz ist der Schlüssel zu Hochverfügbarkeit, das gilt auch für den Extremfall, in dem man ein ganzes Rechenzentrum vor Stromausfällen und Katastrophen schützt. Ein Metrocluster ist im Grunde genommen ein auf zwei oder mehr Standorte auseinander gezogenes lokales Cluster, bei dem ein lokal gespiegelter Speicher zum Einsatz kommt. Ein Metrocluster kann so gestaltet werden, dass kein einziger "Point of Failure" bestehen bleibt, und mit der Prämisse, dass ein einzelner Hardwareausfall noch kein Umschalten zwischen den Sites notwendig macht.

Abgesichert: Schematischer Aufbau eines Metroclusters über zwei Orte hinweg.
Foto: Nexenta

Der größte Vorteil eines Metroclusters besteht darin, bei einem Problem automatisch, ohne Eingreifen eines Administrators, auf die Alternative umzuschalten. Beim Einsatz von asynchroner Replikation müsste ein Mensch entscheiden, wann und ob umgeschaltet wird. Dies würde wiederum einen vorher definierten Notfallplan bedingen. Eine Automatisierung dieses Prozesses kann dagegen eine durchgängige Uptime für Applikationen garantieren.

Pro Standort besteht das Konzept aus einem Storage Layer, der jeweils lokal hochverfügbar ausgelegt ist - das heißt jeweils ein Cluster mit zwei Nodes. Dieser Cluster stellt den Festplattenspeicher für die Service Nodes zur Verfügung. Die Service Nodes spiegeln jeweils ihre Daten zwischen den beiden Standorten und alle vier Nodes gehören zu einem standortübergreifenden 4-Node-Cluster. Ein voll Metrocluster bietet zahlreiche Vorteile:

Um einen Metrocluster aufzubauen, sollten zwei Bedingungen erfüllt sein:

Triple: Mit ZFS sind sogar Metrocluster über drei Standorte hinweg möglich.
Foto: Nexenta

In den USA, wo Standorte oft tausende von Kilometern voneinander entfernt sind, besteht aus diesem Grund in den meisten Fällen überhaupt keine technische Möglichkeit, ein Metrocluster einzusetzen und das Konzept ist dort daher kaum bekannt. Die Idee eines Metroclusters orientiert sich an europäischen Gegebenheiten, wo Unternehmen oft mehrere Niederlassungen und Rechenzentren haben, die nur wenige Kilometer voneinander entfernt sind. Hier können viele Unternehmen mit relativ geringen Investitionen die Verfügbarkeit ihres Clusters auf ein sehr hohes Niveau heben.

Szenarien von Systemausfällen

Ein Cluster hat zahlreiche Schwachstellen. Ziel eines Metroclusters ist, für jeden Schwachpunkt automatische Rückfall-Lösungen bereitzustellen, um eine Auswirkung auf Applikationen zu vermeiden oder diese zumindest stark einzuschränken.

Im Folgenden werden sieben Ausfallszenarios und ihre Folgen am Beispiel eines Metroclusters aufbauend auf ZFS-Technologie dargestellt.

Vermeidung undefinierter Zustände

Um bei einem einfachen Ausfall der Verbindungen zwischen den Rechenzentren nicht zu undefinierten Zuständen (Split Brain) zu gelangen, wird ein ZFS-Metrocluster wie folgt implementiert:

Metrocluster bieten viele Vorteile

Hochverfügbare Rechenzentren sind heute das Rückgrat zahlreicher Unternehmen und sie investieren hohe Summen in ihre Geschäftstätigkeit. Für alle Unternehmen, die ohnehin zwei Standorte innerhalb von 50 Kilometer Umkreis besitzen oder die Ressourcen in einem von Dienstleistern betriebenen Rechenzentrum in Anspruch nehmen können, ist ein Metrocluster eine geeignete Methode, ihre Systeme unter allen Umständen zugänglich und aktiv zu halten. (cvi)

Dieser Artikel basiert auf einem Beitrag der CW-Schwesterpublikation TecChannel.