Daten-Deduplizierung

Backup-Kosten um den Faktor Zehn senken

17.08.2010
Von 
Thomas Pelkmann ist freier Journalist in München.

Daten-Deduplizierung - zwei Verfahren

Bei der Deduplizierung gibt es zwei wesentliche Verfahren: "at source", also an der Quelle, und "at target", also am Ziel. Bei der ersten Variante werden Duplikate bereits an der Quelle erkannt und nur solche Blöcke ans Backup geschickt, die sich von den bereits gespeicherten unterscheiden. Das Source-Verfahren schont die Bandbreite im Netzwerk, während die Quell-Version besser zur Storage-Hardware passt und zudem eine größere Unabhängigkeit von Übertragungsprotokollen bietet.

Interessant ist die Daten-Deduplizierung nicht nur für das Backup von Unternehmensdaten. Auch bei der Virtualisierung spielt das Verfahren eine wichtige Rolle. Eine IT-Infrastruktur verwaltet zwischen mehreren hundert bis Tausende von Desktop-PCs, die bis auf die individuellen Benutzereinstellungen über eine identische Ausstattung mit Betriebssystem und Anwendungen verfügen. Wenn diese Systeme über virtuelle Images verwaltet werden, lässt sich durch Daten-Deduplizierung spielend ein Großteil dieser für die Images anfallenden Datenmengen reduzieren.

Insofern ist die Deduplizierung auch ein interessantes Thema für Outsourcing-Dienstleister und Cloud-Anbieter: Je mehr externe Daten im Rechenzentrum verwaltet und gesichert werden müssen, desto wichtiger ist es auch hier, Speicherplatz und die damit verbundenen Kosten reduzieren zu können.