Thin Provisioning, Tiering, Deduplizierung

Storage-Technologien sinnvoll einsetzen

20.05.2013
Von Beate Herzog

Deduplikation und Kompression

Zwei weitere Verfahren zur effizienteren Nutzung des vorhandenen physikalischen Speicherplatzes sind die Deduplikation und die Kompression. Bei der Deduplikation betrachtet das Betriebssystem des Arrays alle gespeicherten Daten und untersucht diese auf sich wiederholende Abschnitte. Die erste gespeicherte Version eines Abschnittes bleibt erhalten, während alle sich wiederholenden Abschnitte durch einen Verweis auf die erste Version ersetzt werden. Hierdurch lassen sich je nach Art der Daten nach Herstellerangaben zwischen 50 und 90 Prozent des genutzten Speichers zurückgewinnen.

Vor allem im Backup-Umfeld lassen sich hiermit große Volumengewinne erzeugen. Deduplikation wird entweder bereits während des Schreibens der Daten auf das Array oder aber erst nach deren vollständiger Speicherung durchgeführt. Während die erste Option wesentlich weniger physikalischen Speicherplatz, aber höhere Prozessorleistung direkt am Speicherkanal benötigt, speichert die zweite die Daten zunächst unbehandelt ab und benötigt dazu wesentlich mehr physikalischen Speicher. Auf der anderen Seite sind die Prozessorlast und die Belastung am Datenkanal selbst wesentlich geringer.

Die Kompression arbeitet ähnlich wie die Deduplikation, allerdings sucht sie nach den am häufigsten vorkommenden Zeichensequenzen innerhalb einzelner Dateien und ersetzt die am häufigsten gefundenen Abfolgen durch die kürzest möglichen Repräsentanzen sowie weniger häufig gefundene durch längere Repräsentanzen. Damit verkleinert das Array einzelne Dateien und verringert damit deren Platzbedarf auf den Festplatten. Hersteller geben hierfür je nach Umfeld zwischen 25 und 75 Prozent Ersparnis an.