Thin Provisioning, Tiering, Deduplizierung

Storage-Technologien sinnvoll einsetzen

20.05.2013
Von Beate Herzog

Storage Tiering

Storage-Geräte, die mehr als nur eine Festplattentechnologie nutzen, lassen sich mittels Storage Tierung effizienter auslasten. In der Regel verbauen Hersteller heute SATA-Laufwerke für großvolumige Daten, FC- oder SAS-Laufwerke für mittlere Leistungsanforderungen und SSD-Laufwerke für Daten mit höchster I/O-Belastung.

Während der Nutzer bis vor wenigen Jahren seine Daten und die hierfür benötigte Leistungsklasse (Tier) selbst bewerten und die Informationen hierhin manuell verschieben musste, bieten viele Hersteller heute automatisches Storage Tiering an. Hierbei analysieren die Betriebssysteme der Arrays ständig die durch die Daten verursachten I/O-Raten und verschieben die Informationen auf Basis vorgegebener Algorithmen zwischen den Speicherklassen in bestimmten Abständen. Damit ist immer gewährleistet, dass die Daten automatisch in der jeweils benötigten und damit auch betriebswirtschaftlich gerechtfertigten Speicherklasse liegen. Die meisten Hersteller arbeiten derzeit mit drei oder vier Speicherklassen.

Wurden früher ganze logische Laufwerke und deren Leistungsverhalten betrachtet, zerlegen die Hersteller diese heute in kleinere Abschnitte (Chunks), die beliebig im Backend verteilt werden können. Dadurch liegen nur die tatsächlich leistungshungrigen Daten auf den schnellen SSD-, FC- oder SAS-Laufwerken, während der größte, allerdings nicht oder nur gering genutzte Teil auf SATA-Platten gehalten wird. Je kleiner die Abschnitte sind, desto feiner lassen sich die Daten im Backend verteilen. Je kürzer die Zeitabstände der Bewertung sind, desto besser passt sich das System an die aktuellen Gegebenheiten an.

Allerdings muss auch beachtet werden, dass das Array umso mehr belastet wird, je mehr Funktionalitäten es in kürzerer Zeit ausführt. Darüber hinaus sollte das System über eine manuelle Einstellmöglichkeit für Laufwerke und Algorithmen und einen Scheduler verfügen. Die Daten für ein Backup oder für einen Warehouse-Load sollten sich schon in einer entsprechenden Speicherklasse befinden, wenn der entsprechende Job losläuft, und nicht erst reaktiv dorthin gebracht werden müssen. Das kostet nur Zeit und Backend-Leistung.