Storage Tiering - in Schichten zum optimalen Speicher

05.12.2012
Mit Automated Tiered Storage (ATS) können Unternehmen Daten je nach Nutzungs grad auf dem passenden Speichermedium ablegen und so ihre IT optimieren.

Lange Zeit war in Unternehmen die Vorstellung verbreitet, dass Speicherplatz nichts kostet. Gefördert wurde dieses Denken durch die Preisentwicklung bei Massenspeichern wie Festplatten, Bandlaufwerken und neuerdings Solid State Drives (SSD): Die Kapazitäten der Speichermedien stiegen, die Preise gingen nach unten.

Doch die rapide wachsenden Datenmengen in den Rechenzentren haben dazu geführt, dass Storage mittlerweile ein erheblicher Kostenfaktor ist. Nach Schätzungen des Marktforschungsinstituts IDC steigt das Datenvolumen in einem Rechenzentrum um 60 Prozent pro Jahr. Ein Data Center mit Storage-Systemen, auf denen heute 100 TB Daten lagern, muss laut dieser Rechnung im Jahr 2022 Speicherkapazitäten von 11 Petabyte vorhalten.

Allerdings werden nicht alle Daten im selben Maße genutzt. Nach Untersuchungen von EMC beträgt die Wahrscheinlichkeit, dass Nutzer auf Daten zugreifen, die älter als 90 Tage sind, nur zehn Prozent. Bei Informationsbeständen, die ein halbes Jahres alt sind (180 Tage), sinkt der Wert auf ein Prozent, und nach einem Jahr schrumpft er auf 0,01 Prozent. Daher bietet es sich an, ein Schichtenmodell (Storage Tiering) zu verwenden, also häufig verwendete Daten auf schnellen, dafür kostspieligeren Speichermedien wie SAS-Platten und Solid State Drives vorzuhalten, weniger häufig nachgefragte Informationen dagegen auf preisgünstige SATA-Festplatten, Virtual Tape Libraries (VTL) und Bandbibliotheken auszulagern.

Die Wurzeln

Storage Tiering ist kein brandneues Konzept. Die Grundlagen sind bereits seit mehreren Jahrzehnten bekannt und stammen aus der Mainframe-Welt. Sie wurden in Form des Hierarchical-Storage-Managements (HSM), Information-Lifecycle-Managements (ILM) sowie von Automated Tiered Storage in den vergangenen 20 Jahren verfeinert.

Der Grundgedanke blieb derselbe: "Hot Data", also solche, die schnell bereitgestellt werden müssen, geschäftskritisch sind und auf welche die Anwender häufig zugreifen, werden auf schnellen Speichermedien wie SAS-RAID-Konfigurationen oder Flash-Speichern vorgehalten. Weniger wichtige Informationen ("Cold Data") lagern dagegen auf preisgünstigeren Medien wie SATA-Festplatten-Arrays oder Archivierungsmedien.

Üblich sind drei Ebenen (Tiers):

- Tier 1 ("Performance Tier"): Schnelle SAS- und Fibre-Channel-RAID-Arrays oder Flash-Speicher (SSDs, Flash-basierende Cache-Speicher in Storage-Systemen oder Servern) für etwa fünf Prozent der Datenbestände,

- Tier 2 ("Capacity Tier"): SAS-Festplatten und SATA-RAIDs mit hoher Kapazität für rund 35 Prozent der Informationen und

- Tier 3 ("Archiving Tier"): Preisgünstige SATA-Platten für etwa 60 Prozent der Daten, dazu Bandlaufwerke und optische Speichermedien für die Archivierung.

Dieses Modell ist jedoch nach Ansicht eini ger Fachleute überholt. Sie empfehlen eine feingliedrigere Struktur, die vier bis fünf Ebenen vorsieht. Die amerikanische Beratungsgesellschaft Horison Information Strategies, die sich auf den Bereich Storage konzentriert hat, favorisiert beispielsweise vier Ebenen (siehe Tabelle "Vorschlag eines ..."). Zu den drei gewohnten Tiers 1 bis 3 kommt ein Tier 0 hinzu. Seine Merkmale:

- Er ist für extrem hohe Anforderungen in Bezug auf die I/O-Leistung (Input/Output) mit mehreren Millionen I/O per Second (IOPS) ausgelegt. Sie sind etwa zum Online Transaction Processing (OLTP) erforderlich.

- Die Verfügbarkeit der Daten und Systeme erreicht nahezu 100 Prozent ("Five Nines", also 99,999 Prozent).

- Die Zugriffszeiten sind extrem kurz. Bei anspruchsvollen Applikationen liegen sie im Milli- oder Nanosekunden-Bereich.

- Verarbeitet werden vornehmlich geschäftskritische Informationen, die unmittelbaren Einfluss auf Unternehmenserfolg und Umsatz haben.

- Zum Einsatz kommen Hochleistungs-Storage-Komponenten wie Solid State Drives oder Systeme mit kombiniertem Festplatten- und Flash-Speicher.

Automated Tiered Storage

Mit Hilfe von Automated Tiered Storage lassen sich Daten automatisch auf dem Speichersystem beziehungsweise Storage-Medium platzieren, das für den betreffenden Datenbestand das optimale Preis-Leistungs-Verhältnis bietet. Dies gilt für die Verfügbarkeit, Zugriffszeiten und den Preis pro GB. ATS fasst unterschiedliche Speicherressourcen zu virtualisierten Storage-Pools zusammen, zwischen denen Daten hin- und herbewegt werden.

Wo ein Daten-"Stück" (Junk oder Block) idealerweise gelagert wird, ermitteln ATS-Lösungen anhand von Metadaten, welche die Nutzungsintensität und Bedeutung dieser Daten widerspiegeln. Eine zentrale Funktion von aktuellen ATS-Systemen ist die Fähigkeit, keine kompletten Volumes zu verwalten, sondern Sub-LUNs, also kleine, oft nur mehrere MB große Datenbereiche innerhalb der Volumes von Speichermedien. Damit ist es möglich, Daten innerhalb kürzester Zeit von einem Tier auf einen anderen zu transferieren.

ATS benötigt Planungs-Know-how

Studien und Erfahrungsberichte von Anwendern zeigen, dass sich mit Hilfe von ATS die Kosten um 15 bis 30 Prozent senken lassen. Dies bezieht sich auf die Anschaffung und den Betrieb der Speicher systeme wie Enterprise-SSDs, SAS- und Fibre-Channel-Platten-Arrays und SATA-RAID-Konfigurationen. Weitere Einsparungen sind möglich, wenn ergänzende Techniken wie Thin Provisioning zum Einsatz kommen, also das "Überbuchen" von physikalischem Speicherplatz. Zudem reduziert ATS im Vergleich zum Hierarchical-Storage-Management den Verwaltungsaufwand, weil sich Prozesse automatisieren lassen. Dies schlägt sich in Einsparungen von etwa zehn bis 20 Prozent nieder.

Weitere Vorteile von Automated Tiered Storage sind nach Angaben der Hersteller entsprechender Systeme das geringere Risiko, dass Service-Level-Agreements nicht eingehalten werden, die höhere Verfügbarkeit von Daten sowie kürzere Backup- und Restore-Zeiten. Allerdings erfordert eine ATS-Konfiguration wegen der höheren Komplexität ein fundiertes Know-how bei Planung und Betrieb.

ATS für Mittelständler

Dediziert für mittelständische Anwender ausgelegt ist die Version 15 der Management-Software "Eternus SF" von Fujitsu. Sie wird zusammen mit den "Eternus-DX"-Speichersystemen ausgeliefert und unterstützt ATS respektive Automated Storage Tiering (AST). Dieselbe Zielgruppe spricht Dell mit dem "Compellent Automated Tiered Storage" an. Die integrierte "Data-Progression"-Technik kann Daten in Fragmente (Junks) von 512 KB bis 4 MB aufteilen und auf unterschiedliche, virtualisierte Storage-Ressourcen speichern.

EMC, laut IDC Marktführer bei festplattenbasierenden Storage-Systemen, spricht den Mittelstand mit der "VNX"-Reihe in Verbindung mit den Softwarelösungen "Fast VP" (Fully Automated Storage Tiering for Virtual Pools) und "Fast Cache" an. Letztere verwendet Enterprise-Flash-Laufwerke, die vorhandenen Cache auf bis zu zwei Terabyte erweitern. Die Lösung überwacht eingehende I/O-Vorgänge auf deren Zugriffshäufigkeit und kopiert automatisch häufig verwendete Daten aus den Backend-Laufwerken in den Cache.

Hitachi wiederum führt "VSP" mit "Dynamic Tiering" ins Feld. Pro Volume lassen sich drei Tiers einrichten und mit SSDs, Fibre-Channel- beziehungsweise SAS-Laufwerken sowie SATA-Festplatten bestücken. Dynamic Tiering kann Daten blöcke von 42 MB bewegen.

IBMs "Easy-Tier"-Software unterstützt zwei Ebenen - eine mit SSDs, die andere mit unterschiedlichen Festplattentypen. Ebenso wie Hitachi nutzt Easy Tier eine "Heat Map", um zwischen wichtigen, besonders gefragten Daten und weniger bedeutenden Informationen zu differenzieren.

Bei Hewlett-Packards "3PAR-F"-Systemen in Verbindung mit "Adaptive Optimization" lassen sich Daten-Chunklets von 256 MB auf unterschiedliche Tiers verteilen. Mit Adaptive Optimization kann der Administrator festlegen, ob das automatische Storage Tiering eher eine hohe Leistung oder niedrige Kosten berücksichtigen soll.

Eine Sonderstellung in Bezug auf Automated Tiered Storage nimmt Netapp mit den "FAS"-Systemen der Reihen 2000 und 3000 ein. Der Hersteller setzt bei "Virtual Storage Tiering" Flash-basierende PCIe-Cache-Module. Mit Hilfe der Cache-Speicherung lassen sich Random-Lese- und -Schreibvorgängen durch die automatisierte Verwendung von SSD-Laufwerken beschleunigen. (hi)

Vorschlag eines vierstufigen Storage-Modells

Ebene (Tier)

Tier 0

Tier 1

Tier 2

Tier 3

Datenbestand

1 bis 3 Prozent

12 bis 20 Prozent

20 bis 25 Prozent

43 bis 60 Prozent

Speichertechnik

SSD

Fibre Channel, Hochleistungs-Disk-Arrays

Fibre Channel, Disk Arrays der mittleren Leistungsstufe

Tape Libraries

Klassifizierung

Hohe I/O-Werte, kurze Antwortzeiten gefordert

Unternehmenskritisch, umsatzrelevante Anwendungen

Wichtige bis sensible Daten, wichtige Anwendungen

Archivdaten, wichtig für Erfüllung von Compliance-Vorgaben

TB pro Administrator

Wenige TB

30 TB

30-100 TB

Bis zu mehrere Petabyte

Verfügbarkeit

99,999 Prozent

99,999 Prozent

99,99 Prozent

99,0 bis 99,9 Prozent

Akzeptable Ausfallzeit

Keine

Keine

Unter fünf Stunden/Jahr

Unter ein Tag/Jahr

I/O-Performance

Mehr als 1 Million IOPS

200.000 bis 300.000 IOPS

100.000 bis 200.000 IOPS

Mäßige bis niedrige Anforderungen an I/O

Recovery Point Objective des Backups

Unter 4 Stunden

Unter 4 Stunden

Unter 12 Stunden

1 Tag oder länger

Preis/GB

Sehr hoch

Hoch

Mittel

Niedrig

Quelle: Horison Information Strategies

Checkliste 1: Bedarfsanalyse

Das Marktforschungs- und Beratungsunternehmen IDC hat Tipps für Anwender zusammengestellt, die eine ATS-Lösung implementieren möchten. Im ersten Schritt sollte der Anwender seinen Bedarf präzisieren:

Welche Anwendungen und Daten sind unternehmenskritisch?

- Ist im Unternehmen eine Mischung von unternehmenskritischen und nicht kritischen Daten vorhanden?

- Welche Anforderungen in Bezug auf Leistung und Verfügbarkeit haben die Anwendungen und die dazugehörigen Daten?

- Wie oft werden welche Datenbestände genutzt beziehungsweise geändert?

Welche Storage-Kapazitäten sind vorhanden?

- Welche Storage-Systeme und Systemarten (NAS, SAN) sind bereits im Einsatz?

- Werden die Speicherressourcen zentral vorgehalten, oder ist eine dezentrale Infrastruktur vorhanden, etwa mit Storage-Systemen in Außenstellen?

- Wie aufwendig ist es, die Storage-Infrastruktur und die Datenbestände zu reorganisieren? Und wie würde sich ein solcher Prozess auf die Geschäftstätigkeit auswirken?

Welches Budget und welche personellen Ressourcen sind vorhanden?

- Gibt es Storage-Fachleute im Unternehmen?

- Wenn ja, haben sie die Ressourcen, also das Geld und die Zeit, um die Storage-Infra struktur umzubauen?

- Lässt sich die Einführung von Storage Tiering aus dem laufenden IT-Budget finanzieren, oder müssen zusätzliche Mittel bereitgestellt werden?

Checkliste 2: Anbietersuche

Im zweiten Schritt geht es laut IDC darum, den "richtigen" Anbieter der Automated-Storage-Tiering-Lösung zu finden. Dabei helfen folgende Fragen:

- Wie ist es um den Ruf und die finanzielle Situation des Anbieters bestellt?

- Hat der Anbieter Erfahrung mit Unternehmen aus derselben Branche, in der Ihre Firma tätig ist? Kann er Referenzen vorweisen?

- Verfügt das Unternehmen über Erfahrung auf Gebieten, die mit ATS eng verbunden sind, etwa Virtualisierung und Konsolidierung von IT-Infrastrukturen?

- Unterstützen die Produkte des Anbieters Standards, oder sind es proprietäre Lösungen?

- Lassen sich die Lösungen in heterogenen Umgebungen einsetzen, sprich zusammen mit Speichersystemen und Storage-Software anderer Anbieter?

- Bietet der Anbieter Unterstützung beim Ausarbeiten von Kosten-Nutzen-Analysen?

Checkliste 3: Die richtige ATS-Lösung

Zum Abschluss noch einige Punkte, auf die Interessenten laut IDC bei der Evaluierung einer ATS-Lösung achten sollten:

Ist in die Lösung Virtualisierung integriert?

- Müssen Daten in konventionellen Platten-Arrays gespeichert werden, oder hat der Anwender größeren Spielraum bezüglich des Speicherorts von Daten?

- Lassen sich Daten auf Storage-Ressourcen mit unterschiedlichen RAID-Niveaus verschieben?

- Können Administratoren das gesamte Array virtualisieren oder Teile des Arrays als individuelle Speicher-Pools konfigurieren?

Wie ist es um die Granularität der Datenmengen bestellt?

- Wie viele MB umfasst die minimale Page Size, also die kleinste Datenmenge, die zwischen Tiers bewegt werden kann?

- Ist die Lösung echtzeitfähig?

- Werden Informationen in Echtzeit ermittelt und bereitgestellt, oder muss dazu eine externe Software genutzt werden?

- Erfasst die ATS-Lösung Daten wie den Zeitpunkt der Erstellung von Daten, den Speicherort von Datenblöcken, wann und wie häufig auf Informationen zugegriffen wird oder diese verändert werden?

Welche Automatisierungsfunktionen stehen bereit?

- Gibt es Profile auf Basis von Regeln (Policies), mit deren Hilfe sich das Verschieben von Daten automatisieren lässt?

- Findet die Datenmigration nach einem Zeitschema im Hintergrund statt? Hat der Nutzer die Möglichkeit, diesen Prozess bei Bedarf auch von Hand zu initiieren?

- Lassen sich Änderungen an Policies und RAID-Systemkonfigura tionen vornehmen, ohne dass der laufende Betrieb unterbrochen werden muss?

Gibt es die Möglichkeit, Snapshots zu erstellen?

- Arbeitet die Lösung mit Storage-Management-Produkten anderer Hersteller zusammen?

- Lassen sich Storage-Systeme anderer Anbieter integrieren, und zwar physische wie virtualisierte Ressourcen?

- Muss dazu der Betrieb unterbrochen werden?

- Stellt die ATS-Lösung Daten für weitergehende Verwaltungs- und Optimierungsaufgaben bereit, etwa über die Nutzung von Daten und über die Auslastung von Platten-Arrays? Dies ist wichtig, um beispielsweise Thin-Provisioning-Konzepte umzusetzen.

- Ferner ist zu untersuchen, wie das ATS-System erweitert werden kann.