Angetestet

Deduplizierung spart Speicherplatz

22.08.2007
Von Christoph Lange
Durch die Beseitigung redundanter Daten soll sich das Volumen der gesicherten Daten drastisch reduzieren. Im COMPUTERWOCHE-Test musste die Virtual Tape Library "DXi5500" von Quantum zeigen, was sie kann.

Angesichts der ungebremst steigenden Datenmengen benötigen Unternehmen immer schnellere Backup- und Restore-Lösungen, um die Sicherung der Geschäftsdaten innerhalb des Backup-Zeitfensters zu bewerkstelligen. Abhilfe versprechen Virtual Tape Libraries (VTL), die sich wie eine Bandbibliothek verhalten, die Daten aber auf schnelle Festplatten sichern.

Deduplizierung sorgt dafür, dass identische Datenblöcke nur einmal gesichert werden.
Deduplizierung sorgt dafür, dass identische Datenblöcke nur einmal gesichert werden.

Allerdings sind die Kosten pro MB bei Disk-Systemen nach wie vor höher als bei Tape Libraries. Und je mehr Versionen einer Datei vorgehalten werden müssen, umso mehr Speicherplatz benötigen die Backup-Daten. Eine gängige Faustregel lautet, dass das Datenvolumen auf den Backup-Systemen im Lauf der Zeit etwa die zehnfache Menge der zu sichernden Primärdaten erreicht.

So wurde getestet

Für den COMPUTERWOCHE-Test der DXi5500 von Quantum wurde ein Fibre-Channel-Netz aufgebaut, das die virtuelle Bandbibliothek mit zwei Windows-2003-Test-Servern verband, die als Backup-Server dienten. Ein 4-Gbit/s-FC-Switch "Silkworm 200E" von Brocade stellte die SAN-Anbindungen her. Die Windows-Server waren mit je einem 4-Gbit/s Dual-Port Host-Bus-Adapter des Typs "QLA 2462" von Qlogic bestückt. Als Backup-Software wurde auf dem ersten Server EMC "Legato Networker 7.3" installiert. Die Datensicherungen vom zweiten Server auf die DXi5500 erfolgten mit Hilfe von Symantec "Backup Exec 11d".

Deutliche Datenreduktion

Deshalb bieten immer mehr Hersteller ihre VTL-Lösungen mit einer integrierten oder nachgelagerten Deduplizierung an. Die Beseitigung von Redundanzen in den gesicherten Daten soll das Gesamtvolumen drastisch reduzieren. Einige Anbieter geben an, dass sich die Datenmenge um den Faktor 50 bis 100 verringern lässt. In der Praxis dürften allerdings eher Werte zwischen 10 und 20 realistisch sein. Die im COMPUTERWOCHE-Test erzielten Reduktionsraten deuten in eine ähnliche Richtung: Sie stiegen kontinuierlich an, von anfänglich 3,9 auf über 7,5. In Datenmengen ausgedrückt bedeutet eine Reduzierung um den Faktor 3,9, dass 53 GB Primärdaten nach der Sicherung und Deduplizierung auf dem Backup-System lediglich 14 GB Speicherplatz belegen. Bei einem Minimierungsfaktor von 7,5 schrumpft der Speicherbedarf auf nur noch 7 GB. Am Ende des COMPUTERWOCHE-Tests waren auf der virtuellen Bandbibliothek 765 GB Daten gespeichert, die vor der Sicherung und Deduplizierung ein Datenvolumen von 5,7 TB ausmachten. Bei einer längeren Testphase wäre die Optimierungsrate vermutlich noch weiter gestiegen, da sich der Einsparungseffekt der Deduplizierung im Zeit-verlauf immer stärker auswirkt.

Aufgrund des deutlich geringeren Platzbedarfs können Unternehmen mit einer Deduplizierungslösung mehr Versionen der gesicherten Dateien über einen längeren Zeitraum auf dem VTL-System vorhalten. Dadurch lassen sich im Ernstfall wesentlich mehr Dateien direkt vom schnellen Backup-to-Disk-System wiederherstellen. Die Deduplizierung eröffnet auch neue Möglichkeiten für Desaster-Recovery-Lösungen, weil wesentlich weniger Daten als bisher zum zweiten Standort repliziert werden müssen. Durch die starke Reduzierung der zu übertragenden Daten lassen sich nun über WAN-Verbindungen deutlich größere Datenvolumen replizieren.