Datensicherung

Am Ende steht die kontrollierte Löschung

24.07.2008
Von Ulrike Riess

Backup-Medien

Früher bestimmte das Band die Welt der Backup-Medien, wurde aber durch die hohe Funktionalität und den steten Preisverfall mehr und mehr von Festplattensystemen verdrängt. Derzeit ist Backup-to-Disk die wohl gebräuchlichste Art, Daten zu sichern. Dabei kommen in transkations-intensiven Umgebungen meistens FC- (Fiber Channel) oder SAS-Laufwerke (Serial Attached SCSI) zum Einsatz. Die Mehrheit der Anwender entscheidet sich für günstige SATA-Laufwerke (Serial ATA) mit großer Kapazität. Der große Vorteil von Festplatten liegt aber nicht nur im Preis, sondern in schnellen Wiederherstellungszeiten sowie guten Sicherheitsmerkmalen. Auf einer HDD (Hard Disc Drive= Festplatte) lassen sich Daten mit unterschiedlichen RAID-Leveln schützen (siehe Kasten). Ebenso machen einfache Datenmigrationen und simple Systemkonsolidierungen die Disk-Systeme für den Backup-Bereich attraktiv.

Festplatten-Arrays dienen im Backup auch als Puffer für die dahinter liegende Archivierung, zum Beispiel auf Band. Entweder setzt der Administrator ein Backup-to-Disk-to-Tape ein oder verwendet eine dedizierte Virtual Tape Library. Bei Backup-to-Disk-to-Tape schaltet der IT-Manager eine Bandlösung hinter das verwendete Disksystem. Eine Virtual Tape Library (VTL) hingegen simuliert eine Bandbibliothek und deren Funktionalitäten und ermöglicht so eine leichtere Migration auf reale Bandmedien. Vorteil dieser Sicherungsart ist, dass keine weitere Software notwendig ist und die Backup-Zeiten unerheblich sind. Auch langsame Rechner lassen sich so sichern. Daten werden zunächst auf einer VTL zwischengelagert und dann in einem gleichmäßigen Stream auf Bänder geschrieben.

Im Zuge der Green-IT-Diskussion sind Festplattensysteme und ihre Energiekosten ins Zentrum des Interesses gerückt. Systeme, die nur zu bestimmten Zeiten der Datensicherung Verwendung finden, können hier mit der MAID-Technologie oder einem spin-down der Drives (siehe Kasten) Engergie und Kosten sparen. Allerdings verfügen nicht alle erhältlichen Produkte über diese Funktion.

MAID

Ein Massive Array of Idle Disks (MAID) ist ein Disk-Array, in dem einzelne Festplatten abgeschaltet werden, wenn diese nicht benötigt werden. Dies hat den Vorteil, dass der Energieverbrauch (und somit auch die Wärmeabgabe) erheblich sinkt. Typische Einsatzbereiche sind Anwendungen, die Daten auf einen begrenzten Bereich schreiben und danach nur selten lesen.

In kleineren Umgebungen kommen zudem noch immer Bänder oder optische Formate als Backup-Medien zum Einsatz. Dazu gehören zum Beispiel das Digital Audio Tape (DAT), Linear Tape Open (LTO) oder Advanced Intelligent Tape (AIT) bei den Bändern. Zu den optischen Speichermedien gehören CDs und DVDs. Hier werden vor allem Blu-ray und das magneto-optische Format Ultra Density Optical (UDO) Marktanteile gewinnen. Auch hier hat die Automatisierung Einzug gehalten, die vereinfachte Sicherungsprozesse garantiert. Verfügbar sind sowohl Softwarelösungen als auch Automaten wie Autoloader, Bandbibliotheken oder Jukeboxen.

RAID

RAID steht für Redundant Array of Inexpensive beziehungsweise Independent Disks. Das Disk-Array arbeitet im Verbund wie ein einziges großes Laufwerk. Der Begriff RAID drückt aus, dass bei Ausfall einer Platte keine zweite in ihrer Funktion beschränkt ist. Werden Daten auf ein Platten-Array geschrieben, wird gleichzeitig ein Fehlercode erzeugt und ebenfalls auf dem RAID abgelegt. Beschädigte Daten lassen sich mittels Fehlercode wiederherstellen. Es gibt die RAID-Level 0 bis 7 und Kombinationen aus einzelnen Schutzklassen sowie einige Untergruppen wie 1E. Die wichtigsten und am häufigsten verwendeten RAID-Level sind folgende:

RAID-0

Die Daten werden im so genannten Striping-Verfahren in aufeinander folgenden Blöcken gleichmäßig über die vorhandenen Platten verteilt. Das bedeutet hohe Performance aber kein Schutz.

RAID-1

Spiegelung (Mirroring, Duplexing) von zwei oder mehreren Festplatten. Das heißt, dass der komplette Inhalt einer Harddisk auf ein anderes Laufwerk überspielt wird.

RAID-10

Kombination der beiden RAID-Level 0 und 1. Zuerst werden die Platten im Striping-Verfahren aneinandergehängt und dann gespiegelt. Das gewährleistet Datenschutz und hohe Performance.

RAID-3

Mindestens drei Festplatten müssen im Einsatz sein. Die Daten werden in einzelne Bytes aufgeteilt und abwechselnd auf den vorhandenen Laufwerken verteilt. Zusätzlich wird ein Prüf-Byte generiert und auf einer zusätzlichen »Parity-Disk« gespeichert. Mit einem Rechenalgorithmus (XOR-Verknüpfung) ist es möglich, beim Ausfall einer Disk die fehlenden Daten zusammen mit der Prüfsumme zu rekonstruieren.

RAID-5

Dieser Level verteilt die Originaldaten wie auch den Fehlercode gleichmäßig über alle vorhandenen Laufwerke (mindestens drei). Auf diese Weise lassen sich die Schreibzugriffe über sämtliche Platten verteilen und es ist möglich, nicht nur Lese-, sondern auch Schreiboperationen überlappen zu lassen. Die Parität wird durch eine Exklusiv-Oder-Verknüpfung realisiert. Ein Laufwerk innerhalb des RAIDs darf vollständig ausfallen, ohne dass Daten verloren gehen.

RAID-6

RAID 6 funktioniert nach einem ähnlichen Prinzip wie RAID 5, kompensiert aber den Ausfall von bis zu zwei Laufwerken. Vereinfacht ausgedrückt, wird RAID-5 um eine Parity-Platte ergänzt.

RAIDn

Dabei handelt es sich um einen Algorithmus, der eine höhere Ausfallsicherheit von Festplatten-Arrays garantiert als bisherige RAID-Lösungen. Herkömmliche RAIDs kompensieren den Ausfall eines Harddisk-Drives. Bei RAIDn kann der Anwender die Anzahl der Laufwerke, die ausfallen können, frei definieren. Beim Einsatz von beispielsweise zehn Platten erlaubt RAIDn, die Daten von beliebig ausfallenden Laufwerken mit nur drei Reserveplatten vollständig zu rekonstruieren. Bei gleichem Hardware-Einsatz stehen gegenüber RAID 5+1 sieben anstatt vier nutzbarer Disks zur Verfügung.