Ratgeber

Datensicherung im virtuellen Umfeld

22.12.2010
Von 
Dipl. Inform. Johann Baumeister blickt auf über 25 Jahre Erfahrung im Bereich Softwareentwicklung sowie Rollout und Management von Softwaresystemen zurück und ist als Autor für zahlreiche IT-Publikationen tätig. Sie erreichen ihn unter jb@JB4IT.de

Datenreduktion durch Deduplizierung

Um die Menge der zu sichernden Daten zu reduzieren, werden die Techniken der Deduplizierung eingesetzt. Hierbei wird versucht, doppelte Inhalte nur einmal zu sichern. Die weiteren Verweise auf die Daten werden durch Platzhalter abgebildet. Die Deduplikation unterscheidet prinzipiell zwei Verfahren, das Single-Instancing und eine blockbasierte Variante.

Schrumpfkur: Der SQL Server 2008 erlaubt die Kompression der Daten direkt in der Datenbank und reduziert somit das Backup-Volumen.
Schrumpfkur: Der SQL Server 2008 erlaubt die Kompression der Daten direkt in der Datenbank und reduziert somit das Backup-Volumen.

Beim Single-Instancing wird eine Datei immer als Einheit betrachtet. Es eignet sich daher vor allem für identische Mail-Anhänge oder mehrfach verwendete Dokumente im Dateisystem. Wird eine Daten aber nur geringfügig verändert, so stellt diese für das Single-Instancing ein separate Instanz dar, und die Veränderung führt zu einer zweiten Ablage der kompletten Datei. Diesen Nachteil will man durch die blockbasierte Variante der Deduplikation vermeiden. Hierbei betrachtet man nicht Dateien, sondern Datenblöcke. Deren Größe variiert nach Hersteller, in der Regel werden diese aber immer weitaus kleiner sein als die der Dateien.