Chunks statt Redundanz

Deduplizierung ist rechtskonform und spart Geld

23.11.2010
Von 
Thomas Pelkmann ist freier Journalist in München.

Hohe Reduktionsraten sprechen für Deduplizierung

Genau hier liegt der Business Case von Datendeduplizierung, wenngleich verlässliche Zahlen über das Sparpotenzial nur schwer zu ermitteln sind. So spricht EMC davon, dass sich durch die nicht-redundante Ablage von Daten bis zu 98 Prozent Speicherplatz einsparen ließe. Backup- und Restore-Vorgänge würden sich zudem um bis zu 90 Prozent beschleunigen lassen. Data Domain, seit 2009 Mitglied der EMC-Familie, rechnet mit einem um Faktoren zwischen 10 und 30 reduzierten Speicherbedarf. Im günstigsten Falle bedeutet das, dass für die Datenablage statt einer 30-GByte-Platte auch ein Stick mit einem GByte reichen würde.

In der Praxis schwanken die Reduktionsraten von Anbieter zu Anbieter und hängen auch von der konkreten Infrastruktur vor Ort ab. Insofern lassen sich darüber keine verbindlichen, dafür aber exemplarische Aussagen treffen. So berichtet das Versicherungsunternehmen Signal Iduna davon, dass sich durch Deduplizierung der gesicherte Datenbestand von 283 Terabyte "problemlos" auf ganze 16 Terabyte zusammenfassen ließ. Das entspricht einer Reduktion um den Faktor 17.

Bei der Berechnung der Wirtschaftlichkeit spielt auch die Frage eine Rolle, ob die Deduplizierungs-Algorithmen "at the source" (an der Quelle) oder "at the target" (am Ziel) eingesetzt werden. Die erste Methode fordert an Desktop oder Server höhere Prozessorleistung, schont aber die Bandbreiten im Netzwerk. Da nur neue oder geänderte Daten an die Speichermedien geschickt werden, lassen sich tägliche Backups sehr viel schneller erledigen. Bei der zweiten Methode wird erst unmittelbar vor der Speicherung der Daten dedupliziert, was mit einem erheblich höheren Bedarf an Bandbreite für die Übertragung der vollständigen und redundanten Daten einher geht, dafür aber die Prozessoren schont. Die Ziel-Version passt in der Regel besser zur Storage-Hardware und bietet zudem eine größere Unabhängigkeit von Übertragungsprotokollen.

Besonders Unternehmen, die ihre gesamte Desktop-IT virtualisieren möchten, können mit Deduplizierungsverfahren massiv sparen. So muss man nicht für jeden einzelnen PC einer mitunter mehrere tausend Geräte umfassenden Infrastruktur virtuelle Maschinen vorhalten. Stattdessen lässt sich in einer deduplizierten Umgebung ein Großteil der für die einzelnen Images nötigen Datenmenge einsparen.

Schließlich gibt es mittelbare Spareffekte durch Deduplizierung, die Unternehmen bei ihren Wirtschaftlichkeitsrechnungen berücksichtigen sollten. Dazu heißt es in einem Whitepaper von IDC : "Die Deduplizierung ermöglicht Ressourceneffizienz und Kosteneinsparungen durch die Verringerung des Energiebedarfs, der Kühlungs- und Stellflächenanforderungen im Rechenzentrum sowie der Speicherkapazität, Netzwerkbandbreite und der Personaleffizienz."