Speichernetze/Speichernetze auch über weite Entfernung koppeln

Von SAN-Inseln zu Distance Storage

25.07.2003
Storage Area Networks (SANs) bilden die Basis für kostengünstiges Management von Speicherdaten. Nur logisch erscheint im Anschluss daran der Gedanke, die Vorteile von Speichernetzen standortübergreifend zu nutzen und Speicherressourcen über Entfernungen zu verbinden.Von Seyfettin Öztürk*

Vernetzte Speicher boomen: Laut IDC haben sie inzwischen Systeme, die direkt an einen Server angeschlossen werden, überholt. Einen großen Anteil am Markt haben dabei SANs. Sie sind die Antwort auf veränderte Business-Modelle und vernetzte Geschäftsprozesse, die Speicherdaten explosionsartig wachsen ließen. Laut IDC stiegen sie seit dem Jahr 2000 um jährlich etwa 40 Prozent. Speichernetze ermöglichen, Ressourcen zu konsolidieren und Speicheroperationen wie Data Backups ohne einen Server auszuführen. Das spart CPU- und LAN-Kapazitäten.

Wer bislang getrennte SANs verknüpft, kann Rechenzentren leichter umziehen, Server-Upgrades vereinfachen sowie Wartungen oder Backups effizienter betreiben. Immer wichtiger wird die Frage nach Disaster Recovery und Business Continuity. Besonders hohe Sicherheit bieten hier Verbindungen über geografisch weite Distanzen, denn je weiter Rechenzentren voneinander entfernt sind, desto niedriger sind die Risiken, dass im Ernstfall gleichzeitig beide betroffen sind. Doch bisher ließen sich SANs mit einem angemessenen Datendurchsatz nur bis zu 100 Kilometern Entfernung vernetzen. Jetzt helfen neue Lösungen, diese Beschränkungen zu überwinden, und treiben damit die Idee der Speichernetze weiter voran - in Richtung Distance Storage.

SAN-Kopplung durch Protokolle beschränkt

Die gängigsten Protokolle (Fibre Channel, Escon, Ficon) machen Distance Storage nur in engem Rahmen möglich, weil der Datendurchsatz nach etwa 100 Kilometern rapide abnimmt. Das hängt mit den technischen Besonderheiten der Protokolle zusammen. Distance-Storage-Lösungen sind grundsätzlich entweder transparent oder basieren auf Flow Control. Beim transparenten Ansatz wird die Flow-Control-Domäne beim Übergang zur Transportleitung des Netzbetreibers nicht getrennt. Er ist deshalb nur für Entfernungen unter 100 Kilometern geeignet. Transparente Lösungsvarianten sind etwa Link Extenders, Storage over Wavelength Divison Multiplexing (SoWDM) sowie Storage over Synchronous Digital Hierarchy (SoSDH).

Link Extenders und SoWDM setzen ein Dark Fiber voraus, ein Glasfaserkabel, das für eine bestimmte Zeit von einem Netzbetreiber gemietet wird. Daran schließt das Unternehmen eigene Link Extenders oder WDM-Systeme an, die mit den Speichersystemen verbunden werden - ein teurer Aufbau. Noch aktueller ist derzeit SoSDH, da SDH-Leitungen fast überall verfügbar sind und eine kostengünstigere Alternative zum Mieten von Glasfasern bieten. Doch SoSDH erfordert noch längere Verarbeitungszeiten als SoWDM, was den Datendurchsatz entscheidend hemmt.

Flow Control statt transparent

Aktuelle Distance-Storage-Lösungen setzen daher auf Flow-Control-basierende Systeme. Sie konvertieren Speichersignale in ein für WAN geeignetes Protokoll und ergänzen die nötige Flusskontrolle, um den Transfer der Speicherdaten über große Entfernungen zu gewährleisten. Zum Einsatz kommt hierbei das Protokoll Fibre Channel - umgewandelt auf IP. Standards sind FCIP (Fibre Channel over IP) und iFCP (Internet Fibre Channel). Die Daten lassen sich anschließend über ein bestehendes WAN übertragen. Entscheidender Vorteil für den Aufbau einer Distance-Storage-Lösung über Flow-Control-basierende Ansätze ist, dass sie die Leistungsfähigkeit von Fibre Channel in Bezug auf Datendurchsatz und Zuverlässigkeit erhalten können. Eine weitere Technik ist iSCSI, bei der man auf FC komplett verzichtet und das ursprüngliche SCSI-3-Speichermedienprotokoll auf IP umwandelt. Sie lässt sich aber für die vorhandenen FC-basierenden SANs nicht direkt anwenden und erfordert den Einsatz von FC-to-iSCSI-Gateways.

Wichtige Elemente von Distance Storage

Lösungen für Storage Networking über weite Entfernungen basieren auf verschiedenen zentralen Elementen. Dazu zählt ein Server, auf dem neben einer Applikation auch eine Datenverfügbarkeitslösung läuft. Über sie initiiert der Server Storage-Operationen wie Backup oder Data Mirroring. Bekannte Lösungen sind etwa SRDF von EMC und GDPS von IBM. Der mit einem Hostbus-Adapter ausgestattete Server ist physikalisch über das Speichernetz (Fabric) mit den Speichersystemen verbunden. Diese enthalten die Speichermedien wie Raid-Platten oder Bänder. Ein Fabric-Switch regelt den Zugriff auf die lokalen und über ein Gateway auch den auf entfernte Speichersysteme. Das Gateway ist das Herzstück einer Distance-Storage-Lösung. Denn es dient als Bindeglied zwischen Speichernetzen in einzelnen Standorten und dem Transportnetz eines Service-Providers. Das Gateway garantiert während des Transports einen hohen Durchsatz und stellt die Zuverlässigkeit der Übertragung sicher. Entsprechend wichtig ist, ein intelligentes Gateway auszuwählen und in die vorhandene SAN-Infrastruktur zu integrieren. Hier sind Systemintegratoren und Service-Provider gefordert: Sie klassifizieren die Gateways für Unternehmen, die bereits SANs einsetzen und mit ihrer Kopplung Kosten senken und Daten besser absichern wollen. Die Dienstleister übernehmen auch die Anbindung an die bestehenden Speichernetze. Möglich sind verschiedene Kundenapplikationen, etwa Remote Backup und Data Mirroring.

Remote Backup and Restore

Ein Backup ist unerlässlich, um Unternehmensdaten regelmäßig zu sichern und jederzeit zur Verfügung stellen zu können. Backup-Konzepte, die nicht auf Speichernetzen basieren, führen dabei oft zu Fehlern und sind mit erheblichem personellen Aufwand verbunden. Denn die Backups müssen extern gelagert und für den Restore aufwändig zurücktransportiert werden.

Mit Distance-Storage-Lösungen lassen sich Remote Backup und Restore effizienter und kostengünstiger realisieren. Denn Initiierungen und Sicherungen erfolgen größtenteils automatisiert und unabhängig vom LAN. Zudem lassen sich Backups zentralisiert betreiben - das spart Personal und vereinfacht die Logistik. Remote Backup und Restore setzen Anwendungsverfügbarkeits-Lösungen voraus. Sie erstellen ein Image des Datenbestands und bilden damit das Mapping zwischen den logischen Dateinamen und den physikalischen Datenblöcken ab. Nach der Initiierung durch den Server übertragen Storage-Connectivity-Services die entsprechenden Datenblöcke vom lokalen zum entfernten Speichersystem.

Remote Archival and Restore

Während Unternehmen Backups zur Datensicherung aus eigenem Interesse vornehmen sollten, ist Archivierung gesetzlich gefordert: Seit 1. Januar 2002 sind deutsche Unternehmen verpflichtet, ihre Geschäftsunterlagen unveränderbar für mindestens zehn Jahre aufzubewahren. Außerdem müssen sie den Finanzämtern im Rahmen der steuerlichen Betriebsprüfung Lesezugriff auf die elektronische Buchführung gewähren. Remote Archival hilft, diese Auflagen zu erfüllen, die Logistik zu vereinfachen und durch zentralisierte Prozesse erhebliche Kosten zu sparen. Außerdem unterstützt eine auf Distance Storage basierende Archivierung die Recherche in Unternehmensdaten, weil sich Speicherdaten standortübergreifend erheblich schneller auffinden lassen. Die Umsetzung von Remote Archival ähnelt dem Aufbau eines Backup-Service. Allerdings werden die Daten auf nicht wiederbeschreibbaren Medien wie Worms (write once, read many) gespeichert.

Data Mirroring

Data Mirroring ermöglicht, neue Daten im lokalen und entfernten Standort nahezu zeitgleich zu speichern. Beeinträchtigt ein unvorhergesehenes Ereignis das lokale Speichersystem, kann der Server den Betrieb im Sinne der Business Continuity aufrechterhalten, indem er auf Remote-Speicher zugreift. Zum anderen vermag Data Mirroring die Daten bei verteilter Produktion sowohl am Entstehungsort als auch an anderen Standorten simultan zugänglich zu machen. Um Data Mirroring nutzen zu können, muss ein Unternehmen die Anwendungsverfügbarkeitslösung im synchronen Modus betreiben. Dieser initiiert die zeitgleiche Speicherung.

Remote Primary Storage

Remote Primary Storage ist für die Erstspeicherung von Daten zuständig. Firmen können ihren Speicherplatzbedarf ganz oder teilweise über entfernte Standorte abdecken oder von einem Service-Provider anmieten. Der Zugriff auf den verfügbaren Speicher erfolgt über den Server und das Gateway direkt auf das Speichersystem am entfernten Standort. Auch hier sind die Systemintegratoren oder Service-Provider Ansprechpartner für die Unternehmen.

Sicherheit auf allen Ebenen

Um die Vertraulichkeit, Integrität und Verfügbarkeit der Firmendaten auch nach Einführung von Distance Storage zu gewährleisten, müssen Dienstleister zudem Systemeinbrüchen, unerlaubten Zugriffen und Dateninkonsistenzen vorbeugen. Dazu müssen sie neben dem Server und dem Hostbus-Adapter auch den Switch, das Speichersystem, das Personal, das Gateway und die Übertragungsleitung in die Überlegungen einbeziehen.

Eine grundlegende Vorsichtsmaßnahme besteht darin, Systeme qualifiziert zu konfigurieren und regelmäßig zu untersuchen, etwa um ungenutzte Dienste und Default-Einstellungen abzusichern. Dabei ist es wichtig, Authentifizierungsmethoden wie ESP für eine sichere Kommunikation zwischen den Speichersystemen einzusetzen und die Management-Anbindung zu schützen. Den Austausch zwischen den Servern und den Speicherressourcen sollten Unternehmen durch Zoning regeln und den Zugriff auf die Speichersysteme durch LUN-Masking begrenzen. Auch gängige Verschlüsselungsmethoden wie 3DES oder AES mit vereinfachtem Key-Management sind sinnvoll. Im Idealfall nutzen Unternehmen dedizierte Übertragungsleitungen statt Shared oder Public Internet.

Wie wichtig das Preis-Leistungs-Verhältnis bei allen Überlegungen ist, zeigt eine Studie der Giga Information Group von 2002: Bei derzeit gängigen Speicherlösungen entfallen insgesamt rund 74 Prozent der Kosten auf Personal und Training sowie das Management von Hard- und Software. Der Einsatz von Distance Storage kann helfen, diese Kosten entscheidend zu verringern. (kk)

*Seyfettin Öztürk ist Business Development Manager bei Lucent Technologies in Nürnberg.

Angeklickt

Der Vorteil von dedizierten Speichernetzen ist bekannt. Im nächsten Schritt wollen Unternehmen ihre SAN-Inseln koppeln - auch über große Distanzen hinweg. Eine der praktikabelsten Lösungen nutzt Flow-Control-basierende Systeme, die Speichersignale in ein für ein WAN geeignetes Protokoll - beispielsweise Fibre Channel over IP - konvertieren. Gelingt die SAN-Kopplung, dann können Aufgaben wie Remote Backup, Data Mirroring oder Restore auch von weit verteilten Speichern übernommen werden.

Zwei Szenarien

Szenario 1: Data Mirroring als Vorbereitung für Krisenfälle

Eine Firma will ihre Rechenzentren in Frankfurt am Main (F) und München (M) gegen Ausfall sichern. In beiden Standorten läuft eine Anwendung, die 100 I/Os pro Sekunde generiert, davon sind 50 Prozent Write-Operationen.

Konventionell:

- 60000 Euro pro Jahr Gebäude für Backup- Lokationen in Frankfurt und München.

- 1200000 Euro pro Jahr Zwölf zusätzliche Personen für Backup-Betrieb in F und M, drei Schichten, zwei Personen pro Schicht.

- 60000 Euro pro Jahr Miete für Dark Fiber in F und M, je 25 Kilometer.

Summe Opex: 1320000 Euro pro Jahr

- 400000 Euro Vier WDM-Systeme in F und M.

- 500000 Euro Zwei zusätzliche Speichersysteme in F und M.

- 20000 Euro Einweisung, Installation und Test für beide Standorte.

Summe Capex: 920000 Euro

Distance Storage:

- 120000 Euro pro Jahr Miete für STM-1 Leased Line zwischen F und M.

Summe Opex: 120000 Euro pro Jahr

- 100000 Euro Zwei Gateways (zum Beispiel "Optistar" Edge- Switch von Lucent).

- 200000 Euro Datenverfügbarkeitslösung.

- 10000 Euro Einweisung, Installation und Test für beide Standorte.

Summe Capex: 310000 Euro

Szenario 2: Backup/Restore

Eine Firma hat SANs in Berlin (B) und Köln (K). In beiden Standorten sind 1 TB Daten täglich zu sichern.

Konventionell:

- 60000 Euro pro Jahr Gebäude für feuerschutzsichere Lagerung von Datenträgern in B und K.

- 400000 Euro pro Jahr Vier Personen für Sicherungsläufe, Transport und Datenträgersortierung in B und K, inklusive Transportkosten.

Summe Opex: 460000 Euro pro Jahr

- 100000 Euro Zwei Datenträgerregale in K und B.

Summe Capex: 100000 Euro

Backup: Von 21 Uhr bis 15 Uhr (Tag danach) für Sicherungslauf, Transport zur Backup-Lokation und Sortieren von Datenträgern in B und K.

Restore: Durchschnittlich 24 Stunden für Suchen, Rücktransport und Einspielen der Datenträger.

Distance Storage:

- 120000 Euro pro Jahr Miete für STM-1 Leased Line zwischen B und K.

Summe Opex: 120000 Euro pro Jahr

- 100000 Euro Zwei Gateways (zum Beispiel Optistar Edge-Switch).

- 200000 Euro Datenverfügbarkeitslösung.

- 10000 Euro Einweisung, Installation und Test für beide Standorte.

Summe Capex: 310000 Euro

Backup/Restore: Läuft weitgehend automatisch, Server-los und LAN-frei, dauert zirka 17 Stunden bei 55 GB Durchsatz pro Stunde mit STM-1 Leased Line und zirka 1,1 Stunden bei 900 GB Durchsatz pro Stunde mit STM-16.

Glossar

- 3DES (Triple Data Encryption Standard): 56-Bit-DES-Verschlüsselungsverfahren; dreifach einzusetzen.

- AES (Advance Encryption Standard): gegenüber 3DES verbesserte Verschlüsselung.

- Escon: Speichernetzprotokoll im Mainframe-Bereich.

- ESP (Encapsulating Security Payload Protocol): dient der Geräteidentifikation.

- FCIP/iFCP: ermöglichen, Fibre Channel über Internet Protocol zu übertragen.

- Fibre Channel: Speichernetzprotokoll im Unix und Windows-Server-Umfeld.

- Ficon: von IBM entwickeltes Host-Channel-System.

- GFP-T (Generic Framing Procedure - Transparent): Datenkonvertierungsverfahren.

- iSCSI: ermöglicht das Übertragen von SCSI-Daten über Internet Protocol.

- Link Extenders: verbinden Speichernetze über größere Distanzen durch Übertragungsmedien wie Long-haul Lasers oder Monomodenfaser.

- LUN (Local Unit Number) Masking: teilt Speicherkapazitäten logisch auf.

- SoWDM (Storage over Wavelength Division Multiplexing): WDM ist eine Wellenlängenmultiplex-Technik.

- SoSDH (Storage over Synchronous Digital Hierarchy): SDH ist eine Multiplex-Übertragungstechnik für Glasfaserleitungen.

- Worm (Write once read many): Speichermedium.

Abb.1: Remote Backup und Restore

Backup und Restore über weite Entfernungen benutzen Metro- oder Wide-Area-Netze und profitieren von deren großen Bandbreiten. Quelle: Lucent

Abb.2: Aufbau einer Distance-Storage-Lösung

Distance Storage verknüpft nicht nur Rechenzentren über große Entfernungen hinweg, sondern bindet auch Außenstellen mit ein. Quelle: Lucent