Einsatz und Nutzen

Ratgeber - Virtual Tape Library

31.03.2013 von Beate Herzog
Traditionelle Bandbibliotheken werden zunehmend von Virtual Tape Libraries verdrängt. Diese VTLs beschleunigen die Sicherungsverfahren, befreien von den üblichen Problemen mit Bandlaufwerken und -bibliotheken und sorgen im Desaster-Fall für eine schnellere Wiederherstellung des Datenbestands.
Tandberg DPS1200 VTL
Foto: Tandberg

Die Ausgangslage der meisten datenverarbeitenden Betriebe im Speicher- und Backup-Bereich hat sich in den vergangenen Jahren zwar leicht zum Positiven gewandelt, ist allerdings immer noch nicht rosig: Unstrukturierte Daten, also E-Mails oder Dateien, nehmen nur noch in derselben Geschwindigkeit zu wie strukturierte Daten (Datenbanken). Herkömmliche Speichermechanismen arbeiten in diesen Umgebungen eher ineffizient, die Speicherkette von Festplatte auf Backup und schließlich ins Archiv erfordert spezielle Sicherungsfenster, und die eingesetzten Medien werden bei Weitem nicht optimal genutzt. Fast jedes Unternehmen geht derzeit von einer Zunahme von 60 bis 80 Prozent des belegten Speicherplatzes aus - pro Jahr. Hier heißt es, sich zwar neuer, aber bereits bewährter Technologien im Backup-Bereich zu bedienen.

Drei Hauptprobleme lösen

Analysen bestätigen seit Jahren wiederholt, dass hauptsächlich drei Schwachstellen im Speicherkonzept der Unternehmen anzutreffen sind:

Allerdings fallen bei schnellerer und zuverlässigerer Technik die Hardwarepreise immer noch kontinuierlich. Dies beflügelt natürlich die Gedanken der IT-Verantwortlichen und des Controllings, da gerade die Speicherkosten einen großen Teil des IT-Budgets aufzehren. Um die gesamten Ausgaben im Sinne der Total Cost of Ownership (TCO) zu senken, muss gerade der Speicherbereich einen besonderen Beitrag leisten.

Virtualisierte Bandlaufwerke

Viele Hersteller haben in den vergangenen Jahren Virtual Tape Libraries herausgebracht, um den Anwendern Wege aus ihren Speichernöten aufzuzeigen, darunter EMC, NetApp, Oracle und Quantum. Gemeinsam ist den verschiedenen Angeboten die Vorstellung von Speichervirtualisierung, wie sie die SNIA bereits vor Jahren formuliert hat: "Unter Virtualisierung ist die Integration eines oder mehrerer Backend-Services mit bestimmten Frontend-Funktionalitäten zu verstehen. Virtualisierung versteckt typischerweise einiges von der Backend-Komplexität vor dem Anwender - dieser greift auf einen gemeinsamen Ressourcen-Pool zu, ohne im Einzelnen wissen zu müssen, welches Storage-Device für welchen Service zuständig ist."

Übertragen auf die aktuelle Speicherkette im Unternehmen bedeutet dies, dass eine neue virtualisierte Storage-Architektur dabei helfen kann, Zeit, Aufwand und damit Kosten einzusparen. Um sich von den altbekannten Nachteilen der "klassischen" Sicherung auf Band zu befreien, werden heute zunehmend reine Disk-to-Disk-Umgebungen angeboten. Diese bieten einige Vorteile gegenüber den herkömmlichen Bandlösungen:

Schnelle Festplatten, kombiniert mit bekannter Bandfunktionalität

Der Umstieg auf eine Virtual Tape Library (VTL) muss beim heutigen Stand der Technik also nicht mehr als die Integration beider Speicherwelten verstanden werden. Dank der Zuverlässigkeit aktueller Festplatten, die sich zusätzlich eben noch mit RAID und weiteren Redundanzen absichern lassen, wird das Band als Medium immer weiter aus dem Backup- in den Archivbereich verbannt. Heute gilt landläufig der Grundsatz: "Einen Katastrophenfall muss man erst dann ausrufen, wenn man von Band zurücksichern muss". Eigentlich ist das Prinzip ganz einfach: In der bisherigen Speicherhierarchie wird die Bandebene für das Backup durch ein entsprechendes Plattensystem ersetzt. Das heißt, die Bandbibliothek wird der IT-Infrastruktur nur vorgetäuscht.

Im Prinzip ist eine VTL also ein ins Netzwerk integriertes Array, das die Funktionen herkömmlicher Bandbibliotheken emuliert. Mithilfe einer speziellen Software werden Bandlaufwerke und Tapes vorgegeben, die so wie in einer klassischen Library-Umgebung Daten sichern und mittels einer Robotik einlagern und verschieben. Der Software-Layer greift dabei auf die bekannten Operationen wie zum Beispiel Move Media, Rewind, Load oder Unload Media zurück - ohne dass dies innerhalb der physikalischen Ebene geschieht. Die VTL besitzt als virtuelle Elemente Funktionalitäten wie Roboterarm, Bandlaufwerke oder Kassetten-Container. Die Daten, die auf die VTL gesichert werden, enthalten die üblichen Header-Informationen zur eindeutigen Identifizierung der Datencontainer (Bänder und Kassetten). Und wenn die Backup-Software eines Servers die VTL durchsucht und inventarisiert, sendet die virtuelle Bibliothek ebenfalls Log-Daten und Barcode-Labels zurück.

Bandfunktion mit Disk-Performance

Indem der Anwender ein Platten-Array zwischen Applikationen, Backup-Server und physikalischer Tape-Library positioniert, lassen sich die hohe Zugriffsgeschwindigkeit und die Zuverlässigkeit von RAID-Systemen nutzen, ohne dass die vorhandenen Abläufe oder die Backup-Software geändert werden müssten. Über Replikationsmechanismen im VTL-System können die virtuellen Bänder samt Inhalt auf eine weitere VTL gespiegelt werden.

Um den Zugriff auf die tatsächliche Bandbibliothek als letzte Instanz des Datenzyklus zum Auslagern ins Archiv zu ermöglichen, nutzt die VTL die Export- und Cloning-Funktionen der jeweiligen Backup-Software. Das bedeutet, dass sich die Bänder in der physischen Bibliothek auch unabhängig von der VTL wieder lesen lassen. Zusätzlich werden Barcodes auf allen Stufen der Backup-Hierarchie unterstützt.

Eine besonders hohe Leistung entsteht in der Backup-Architektur mit einer VTL, wenn das Array die auf Festplatte gespeicherten Backup-Images in bestimmten Zeitintervallen direkt auf das Archivsystem überträgt. Hierdurch entfällt das deutlich langsamere Kopieren auf Band durch den Backup-Server. Außerdem entlastet die VTL diesen Rechner und reduziert den Datenverkehr im gesamten Netzwerk.

Deduplizierung und Kompression zur weiteren Optimierung

Um die Nutzung des physikalischen Speicherplatzes weiter zu verbessern, haben die meisten Hersteller virtueller Bandsysteme in den vergangenen Jahren Deduplizierung und Kompression eingeführt. Mithilfe der Deduplizierung werden gleiche Datenabschnitte innerhalb verschiedener Sicherungssätze gesucht. Wird ein gleicher Datenabschnitt mehrfach abgelegt, ersetzt das System alle weiteren Kopien durch kürzere Verweise auf das erste Original. Die dadurch erzielte Reduzierung des physikalisch belegten Speicherplatzes ist abhängig von den Datensätzen sehr groß - Hersteller geben bis zu 90 Prozent weniger benötigten Speicher an. Das bedeutet, dass sich im Idealfall bis zu neunmal mehr Sicherungen auf der Bibliothek ablegen lassen als ohne Deduplizierung. Allerdings sichert der Anwender in den meisten Fällen inkrementell, also sowieso nur die gegenüber dem letzten Backup geänderten Daten. Damit dürfte sich die reell zu erzielende Deduplizierungsleistung im Produktiveinsatz auf unter 50 Prozent einpendeln.

Der Einsatz einer solchen Software kann entweder auf bereits gespeicherte Daten erfolgen oder aber im Datenstrom, bevor überhaupt auf Platte geschrieben wird. Die erste Option hat den Vorteil, dass die Deduplizierung keinen Einfluss auf die Geschwindigkeit der Sicherung hat, allerdings wird dieser durch den zunächst vollständig benötigten Speicherplatz erkauft. Die zweite Option sichert bereits nur noch die tatsächlich geänderte Datenmenge, allerdings wird hierzu eine wesentlich höhere Prozessorleistung benötigt. Deduplizierung kann auch das Einsammeln von Backups aus entfernten Niederlassungen beschleunigen, indem die zu transportierende Datenmenge wesentlich reduziert und die erforderliche Bandbreite reduziert werden.

Manche Hersteller bieten neben der Deduplizierung auch die "klassische" Kompression für ihre Systeme an. Hierbei werden unterschiedlich lange gleichartige Abschnitte innerhalb von Datensätzen gesucht und durch kürzere Platzhalter ersetzt. Dieses Verfahren ist nicht neu, wurde es doch bereits vor Jahrzehnten für den Bandbetrieb eingeführt. Alle Hersteller geben als durchschnittliche Kompressionsrate 2:1 an, auf einem 100 GByte großen Datenabschnitt lassen sich damit also 200 GByte Informationen ablegen. Komprimierung "kostet" allerdings wesentlich mehr Prozessorleistung als Deduplizierung.

Der Anwender sollte beide Methoden und deren Wirkungsgrade für seine spezifischen Daten testen. Oft ist es sogar sinnvoll, zunächst zu deduplizieren und die dann noch vorhandenen Daten zu komprimieren, um den physikalischen Speicherplatz bestmöglich zu nutzen.

VTL soll Datensicherung handlicher machen

Platte und Band erfüllen ihre Funktionen nun bereits seit fast 60 Jahren. Aus großen Apparaturen, die umständlich zu bedienen waren, sind mittlerweile Speichergeräte entstanden, die häufig nicht größer sind als ein Kühlschrank. Trotz aller inzwischen ausgefeilten Backup- und Restore-Technologien wird das Speichern von Daten jedoch in vielen Unternehmen immer noch stiefmütterlich behandelt. Dem Backup - das selbst ja nicht produktiv ist, sondern "nur" Zeit und Geld kostet - wird zu wenig Aufmerksamkeit geschenkt, Fehler und Versäumnisse sind an der Tagesordnung, Bänder sind unauffindbar oder beschädigt und lassen sich daher nicht mehr für eine Rücksicherung verwenden.

Mit einer VTL wird die Kunst der Datensicherung um ein weiteres Stück handlicher - und auf Dauer billiger. Allerdings verbleiben wichtige Daten länger im Nearstore-Bereich und sind dadurch anfälliger für Netzattacken oder Diebstahl. Datenverschlüsselung vor der Sicherung auf einer VTL könnte für einen größeren Schutz vor unberechtigten Zugriffen sorgen.

Die Anwender einer VTL sollten sich bereits im Vorfeld darüber informieren, welche Bandformate und welche Kassetten unterstützt werden. Weitere Fragen sind:

Auf jeden Fall sollte eine ausführliche Pilotphase bei der Einführung einer VTL selbstverständlich sein. Die Hersteller versprechen sehr viel, IT-Manager sollten sich schon aus diesem Grund nur auf getestete Systeme einlassen und prüfen, wie es um den Reifegrad und die Marktakzeptanz der VTL steht. Und schließlich: Wie sieht es mit der Produktplanung und mit künftigen Verbesserungen der VTL aus? Wie ernsthaft unterstützt der Hersteller seine VTL, welchen Support bietet er an? Wie steht es um die Referenzinstallationen?

Sind all diese Fragen abgeklärt und besteht die VTL die Pilotphase im Unternehmen, so wird aus dem Virtualisierungstrend schnell eine ernsthafte Alternative zu bestehenden Storage-Szenarien.

Vorteile und Nachteile einer VTL / Anbieter

Vorteile

+ deutlich höhere Geschwindigkeit

+ unkomplizierte Eingliederung in bestehende Bandinfrastruktur

+ mehrere Sicherungsprozesse parallel auf alle Medien

+ Minimierung oder Abschaffung von Backup-Fenstern

+ logischer beziehungsweise physikalischer Schutz der Medien (RAID)

+ Deduplizierung und/oder Kompression

+ wesentlich schnellere Rücksicherung

Nachteile

- keine Auslagerungsmöglichkeit virtueller Bänder

- gemeinsames Management von VTL und nachgelagertem Bandarchiv nötig

- Plattensysteme verbrauchen auch im Leerlauf Energie

Zu den Anbietern von VTL-Lösungen zählen unter anderem:

(cvi)

Dieser Artikel basiert auf einem Beitrag der CW-Schwesterpublikation TecChannel.