Ratgeber

Disaster-Recovery-Verfahren

31.08.2007
Von 
Dipl. Inform. Johann Baumeister blickt auf über 25 Jahre Erfahrung im Bereich Softwareentwicklung sowie Rollout und Management von Softwaresystemen zurück und ist als Autor für zahlreiche IT-Publikationen tätig. Sie erreichen ihn unter jb@JB4IT.de

Clustering

Das Clustering von Systemen hat den großen Vorteil, dass es für Performance-Gewinn bei gleichzeitig höherer Verfügbarkeit sorgt und nahezu beliebig skalierbar ist. Der Nachteil: Nicht alle Applikationen sind Cluster-fähig. Für den rein lesenden Zugriff wie etwa bei Web-Auskunftssystemen ist das kein Problem, wohl aber für Anwendungen, die häufig Daten ändern. Neben der hier aufgeführten Cluster-Definition, bei der alle Server im Cluster immer aktiv sind und sich die Last teilen, gibt es auch andere, eher den Failover-Lösungen zuzuordnende Konzepte. Dabei steht ein Zweitsystem passiv bereit, das das primäre System überwacht und im Fehlerfall dessen Rolle übernimmt.

Zu den neuesten Entwicklungen gehört das Clustering von Host und Gastsystemen bei der Server-Virtualisierung. Beim "Guest Clustering" bilden sämtliche Gäste einer virtuellen Umgebung einen Rechnerverbund. Vorgeschaltete Balancer verteilen dann die Last auf die Gäste. Die grundsätzlichen Anforderungen bei geclusterten Systemen gelten auch hier.

Imaging

Eine andere Variante zum Absichern von Prozessen ist das Imaging. Hierbei wird die gesamte Festplatte oder Partition eines Rechners kopiert. Das Imaging operiert nicht auf Datei-, sondern auf Sektorebene und arbeitet daher konkurrenzlos schnell. Es eignet sich vor allem dann, wenn von einem Rechnersystem eine Kopie erzeugt beziehungsweise diese im Fehlerfall schnell wiederhergestellt werden muss ("Bare Metal Restore"). Nachteilig ist allerdings, dass beim Imaging die Rücksicherung meist nur auf nahezu identische Hardware erfolgen darf.

Wie erwähnt, wurde beim Imaging ursprünglich stets das gesamte System kopiert. Mittlerweile gibt es aber auch inkrementelle Verfahren, bei denen - ähnlich wie bei den Backup-Konzepten - zuerst das gesamte System und danach nur noch die Änderung gesichert werden.

Disaster-Recovery: Konzepte im Vergleich

Sicherung der Daten

Sicherung der Applikation

Sicherung des Standorts

Wiederanlauf / RTO

Kosten

Raid-Plattensysteme

ja

ja

nein

kein Ausfall, wenn durch RAID abgefedert

gering

Periodische Sicherung auf Band

ja

ja

nur, wenn Bänder verlagert werden

langsam

gering

Periodische Sicherung auf Platte

ja

ja

nur über Speichersysteme

langsam

gering bis mittel

Kontinuierliche Sicherung auf Platte

ja

nein

nur über Speichersysteme

mittel

gering bis mittel

Speichersysteme (NAS, SAN)

Sicherung durch integrierte Mirroring-Funktionen

möglich mittels Virtualisierung

ja, über Netzstrecke

schnell

hoch

Imaging von Systemen

bedingt möglich

ja

nur, wenn Images verlagert werden

langsam bis mittel

gering

Applikations-Cluster

nein

ja

ja, über Netzstrecke

schnell für Applikationen

mittel

Standby-Failover-Systeme

ja

ja

ja, über IP-Strecken

schnell

mittel

Virtualisierung

Sicherung durch integrierte Mirroring-Funktionen

möglich durch Failover

ja, über IP-Strecken

schnell für Applikationen

mittel

Ausfall-Rechenzentrum

ja

ja

ja

schnell

extrem hoch

Das Imaging wird vor allem zur Server-Sicherung eingesetzt. Zur Sicherung von Daten eignet es sich nur, wenn sich diese kaum ändern. Zudem lässt sich angesichts der dabei verwendeten, meist relativ großen Intervalle keine zeitnahe Sicherung (wie beim CDP) realisieren. Zur Sicherung von Applikationen und Standort mag Imaging jedoch hilfreich sein.

Das Gros der genannten Konzepte geht implizit von einem DAS (Direct Attached Storage) aus. SAN (Storage Area Network) und NAS (Network Attached Storage) bedürfen anderer Sicherungsverfahren. Sie werden primär eingesetzt, um Speichersysteme zu konsolidieren.

Da SAN/NAS Rechner vom Speicher trennen, ermöglichen sie einen schnellen Restore. Gleichzeitig bieten die Hersteller in der Regel eigene Vorrichtungen zur Sicherung der Daten, dem Mirroring, an. Dabei werden die Daten eins zu eins auf einen zweiten Pool im SAN übertragen. Diese Replikation kann synchron oder asynchron erfolgen.

Durch synchrone Replikation lässt sich höchstmögliche Aktualität bei gleichzeitiger Performance-Einbuße erreichen. Umgekehrt steigt bei der asynchronen Replikation die Performance auf Kosten der Datenaktualität. Eine Eigenheit der asynchronen Replikation ist ihre räumliche Unabhängigkeit: Während synchrone Verfahren meist über SAN-Netze abgewickelt werden und folglich deren Hardware-Chakteristika unterliegen, ist die asynchrone Replikation von der verwendeten Basistechnik unabhängig.

Die Sicherung der Inhalte im SAN erreicht damit beste RPO- und RTO- Werte in Bezug auf die Daten. Um hingegen Prozesse zu sichern, sind Clustering oder Failover notwendig. Der gravierendste Nachteil des SAN sind die Kosten - zumindest, wenn es sich um Fibre-Channel-SANs handelt. Hinzu kommt eine weitere Verwaltungsschicht, die zusätzliche Administration und Know-how erfordert. Mit iSCSI entkrampft sich die Kostensituation, da jeder Server ohnehin mit einem Netz-Interface ausgestattet und ferner kein dediziertes Fibre-Channel-Know-how notwendig ist. iSCSI erlaubt Speicherdatentransfers über Netze wie TCP/IP.

Bei den beschriebenen Konzepten stehen meist entweder die Daten oder die Applikationen im Fokus - kaum aber beides. Daher werden für die Absicherung im Ernstfall meist mehrere Konzepte benötigt. Um sowohl Daten als auch Applikationen gegen Ausfälle abzusichern, werden andere Verfahren eingesetzt.