Speicher-Management/Vorhandene Roboter lassen sich einbinden

Virtuelle Archivsysteme entlasten überfüllte Bandarchive

14.01.2000
von Helmut Stiegler* Das ständig wachsende Datenvolumen stellt für die Archivierung immer höhere Anforderungen an Speicherkapazitäten und Transferraten. Zwar bieten die neuen Speichermedien und -geräte die geforderten Leistungen, aber das geht oft nicht ohne Anpassungen in den Anwendungen, um sie nutzen zu können. Eine elegante Lösung bieten virtuelle Archivsysteme, wobei sich die heutzutage eingesetzten Magnetband-Roboter integrieren lassen. Für mittlere bis große Rechenzentren ist die virtuelle Speicherwelt mittlerweile ein fester Bestandteil. Inzwischen kommt die vierte Generation auf den Markt.

Automatische Archivsysteme haben in vielen Rechenzentren eine eigenständige Bedeutung bekommen. Der wachsende Umfang der zu archivierenden Informationen erzwingt von den Unternehmen den Einsatz neuester Speichertechnologien, um das Datenaufkommen schnell und wirtschaftlich in den Griff zu bekommen. Die Bandkassette bleibt dafür weiterhin das kostengünstigste Medium. Ihre steigende Kapazität wird von existierenden Anwendungen jedoch immer weniger ausgeschöpft.

Untersuchungen in verschiedenen Rechenzentren haben gezeigt, dass 55 Prozent aller Kassetten weniger als 200 MB und nur sieben Prozent mehr als 800 MB Daten gespeichert haben. Die effektiven Transferraten liegen bei 81 Prozent unter 1 MB/s und nur bei drei Prozent höher als 3 MB/s. Diese ineffiziente Nutzung führt zu Engpässen in den Archivsystemen. Das ungenutzte Potenzial wird sich außerdem mit der fortschreitenden Entwicklung der Speichertechnologie noch erhöhen. Kassetten mit Kapazitäten von unkomprimiert 100 GB und Transferraten von 15 MB/s gibt es schon heute auf dem Markt. Experten prognostizieren, dass sich die Leistungsfähigkeit von Medien und Laufwerken alle 18 bis 24 Monate verdoppeln wird.

Eine Lösung, die wachsenden Speicheranforderungen zu bewältigen, bieten virtuelle Archivsysteme. Die Anwendungen benutzen statt physikalischer Kassetten so genannte virtuelle Volumes und kommunizieren anstatt mit realen mit virtuellen Laufwerken. Für die Anwendungen haben diese virtuellen Einheiten alle Eigenschaften bisheriger Volumes und Laufwerke. Virtuelle Volumes werden als Speicherbereiche auf internen Raid-Platten bereitgestellt. Nach bestimmten Algorithmen werden mehrere Volumes hintereinander auf einer physikalischen Kassette gespeichert. Dabei nutzen die Systeme die volle Speicherkapazität der Kassetten wie auch die hohen Transferraten der modernen Laufwerke. Die Größen der aktuellen virtuellen Archive schwanken zwischen 100000 und 500000 virtuellen Volumes und zwischen 32 und 200 virtuellen Laufwerken. Demgegenüber enthalten reale Archive maximal 10000 bis 40000 Kassetten und zwischen sechs und 16 Laufwerken.

Ein virtuelles Archivsystem sollte die Leistung der Host-Peripherie nicht einschränken. Außerdem sollte es sich wie ein reales Archivsystem von mehreren Hosts und möglichst auch von verschiedenen Systemplattformen gemeinsam benutzen lassen. Dabei sollte es natürlich auch mindestens die gleiche, wenn nicht eine höhere Zuverlässigkeit und Ausfallsicherheit wie reale Archivsysteme mitbringen.

In der Vergangenheit kamen die Lösungsansätze der Hersteller diesen Anforderungen schrittweise näher:

-Anfänglich waren virtuelle Archivsysteme weitgehend über den Host realisiert: Der Host-Betrieb wurde dabei jedoch belastet und der Lastausgleich zwischen verschiedenen Hosts behindert.

-Im nächsten Schritt entkoppelten die Hersteller den Datentransfer zwischen den Raid-Platten des Archivsystems und den Laufwerken des Roboters vom Host.

-Schließlich wurden die virtuellen Archivsysteme als funktionale Ergänzung realer Archivsysteme realisiert: Funktionen und Auswahl der verwendbaren Bandgeräte sind jedoch eingeschränkt.

Die vierte Generation geht neue Wege und bringt laut den Herstellern einen weiteren Qualitätssprung. Die vom Host unabhängige Realisierung bietet Lastausgleich zwischen mehreren Hosts. Ferner ist ein Betrieb sogar ohne Roboter möglich. Der Austausch eines Roboters oder von Laufwerktypen ist prinzipiell möglich, ohne dass ein Host davon Kenntnis nehmen muss.

Die Leistungen der bisher verfügbaren virtuellen Archivsysteme sind ähnlich und wachsen bei allen Systemen. Dies betrifft Transferraten, die Anzahl parallel nutzbarer virtueller Geräte und deren Steuerungsmöglichkeiten.

Neben aktuellen Leistungsdaten sind für die Bewertung eines virtuellen Archivsystems Aspekte zu beachten, die von der Architektur bestimmt werden und den weiteren Ausbau, die Zukunftssicherheit und Qualitätswünsche betreffen: Darunter fallen

-mögliche Betriebsengpässe,

-Skalierbarkeit,

-vorhandene Single-Point-of-Failure,

-Rückwirkungen aus internen Reorganisationsläufen sowie die

-Komplexität der Steuerung.

Da bei der Zwischenspeicherung die Daten mehrfach kopiert werden müssen, stellt der dazu nötige Datenverkehr über den internen Bus der CPU einen potenziellen Engpass dar. Dieser lässt sich auch durch den Einsatz von Multiprozessormaschinen nicht beheben. Nur bei unabhängig agierenden aktiven Komponenten in einem Cluster wird dieser Engpass vermieden. Da dieses Modell nach dem Prinzip einer "Switched Fabric" aufgebaut ist, ist die Leistung durch Einfügen neuer Standardkomponenten fast beliebig steigerbar. Daher werden höhere Datenraten erzielt (bis 140 MB/s) und unabhängig von der Lastsituation auch garantiert (mindestens 40 MB/s). Umgekehrt ermöglicht der modulare Aufbau auch sehr kleine Konfigurationen und erlaubt so einen passgenauen Einstieg in die neue Technologie.

Fallen einzelne Komponenten des Systems aus, muss sich der Betrieb ohne Datenverlust durch redundante Systembestandteile fortsetzen lassen. Im Extremfall ist eine vollständige Doppelkonfiguration von virtuellen Archivsystemen notwendig. Produkte wie "Centric Stor" von Fujitsu-Siemens können auf die Bedürfnisse des Anwenders hin konfiguriert werden. Viele Komponenten sind standardmäßig mehrfach ausgelegt, andere lassen sich bei Bedarf entsprechend einrichten. Der standardmäßige Teleservice-Anschluss ermöglicht Administratoren eine schnelle Reaktion bei Störungen.

Um einen hohen Nutzungsgrad der Kassetten zu sichern, muss das virtuelle Archivsystem die Belegung von Kassetten, die nur noch teilweise mit aktuellen Daten belegt sind, permanent neu organisieren. Bei manchen Archivsystemen werden hierfür paarweise reale Laufwerke reserviert und eine Kopie direkt von Band zu Band gezogen. Das soll verhindern, dass die Transfers für die Reorganisation den Host behindern. Bei anderen Produkten kann auf eine solche Sonderlösung verzichtet werden, da die Reorganisation über unabhängige Datenwege und Komponenten funktioniert und somit den Host nicht beeinträchtigt.

Ein weiteres Kriterium für den praktischen Einsatz ist die Administrierbarkeit des virtuellen Archivsystems. Hier besteht ein Konflikt zwischen universeller Anpassungsfähigkeit aller Algorithmen und der Beherrschbarkeit durch den Anwender.

Die Erweiterung der Speicherhierarchie um ein virtuelles Archivsystem bietet somit Lösungen für die aktuellen Probleme wie zum Beispiel Mangel an Stellplätzen, freien Volumes, an parallel betreibbaren Laufwerken und zu langen Reorganisationsläufen. Bereits vorhandene Kassettenroboter können meist ganz oder teilweise in ein virtuelles Archiv integriert werden. So ist die Erweiterung gleichzeitig eine Investition zur Zukunftssicherung, denn Anpassungen an die technologische Weiterentwicklung fallen an.

Angeklickt

Das klassische Speichermedium für die großvolumige Datensicherung bleibt die Bandkassette. Doch in vielen automatischen Archivierungssystemen wird der Speicherplatz wenig effizient ausgenutzt. Virtuelle Archivsysteme in Form von dafür freigehaltenen Speicherbereichen auf Raid-Platten sollen das Problem beheben. Der Vorteil: die Kombination von hoher Speicherkapazität der Bänder und der hohen Transferraten bei den Raid-Systemen.

*Dr. Helmut Stiegler ist Principal Consultant der STI-Consulting GmbH mit dem persönlichen Schwerpunkten Systemarchitekturen, Sicherheit und Projekt-Management.