Failover kompletter Data Center

Ratgeber - Rechenzentrum mit Metrocluster absichern

25.01.2013
Von Heiko Wüst

Vermeidung undefinierter Zustände

Um bei einem einfachen Ausfall der Verbindungen zwischen den Rechenzentren nicht zu undefinierten Zuständen (Split Brain) zu gelangen, wird ein ZFS-Metrocluster wie folgt implementiert:

  • Bei undefinierten Zuständen wird nicht auf Verdacht ein automatisches Umschalten zwischen den Sites ausgeführt. Services bleiben zuerst dort, wo sie bisher liefen, online. Ein manuelles Eingreifen des Administrators ist mit einem Mausklick natürlich möglich.

  • Volume Service Locking sorgt dafür, dass bei einem einfachen Netzwerkausfall zwischen den Sites dieser auch nur als Netzwerkausfall erkannt wird.

  • Ein Cloud Beacon Repeater sorgt dafür, dass die beiden Standorte gegenseitig den "Herzschlag" des anderen hören und über dessen Zustand informiert sind.

  • End-to-End-Prüfsummen über den gesamten Datenbestand hinweg sorgen dafür, dass fehlerhafte Daten automatisch gefunden und mittels der Parität repariert werden können.

  • Das Copy-on-write-Verfahren sorgt dafür, dass beim Schreiben neue Daten nicht den alten Daten-Block überschreiben. Stattdessen wird ein neuer Block zugewiesen und die Metadaten als Referenz des Originals ändern sich, um auf den neuen Block zu verweisen. Auf diese Weise sind Daten in ZFS stets konsistent.