Speicherkonzepte/SAN - das Netzwerk ist der Speicher

Speichererweiterung alleine reicht nicht aus - die Infrastruktur muß erneuert werden

14.05.1999
Von Dieter Fiegert* Storage Area Networks sind besonders vorteilhaft für Anwendungen wie Backup und Restore, Archive und Retrival, Data-Migration, Data-Mirroring und Data-Sharing. Sie vereinfachen und optimieren das Speicher-Management und bilden durch sehr hohe Leistungsfähigkeit und Sicherheit eine ideale Infrastruktur insbesondere für eine schnelle und funktionale Datensicherung.

Spätestens seit der diesjährigen CeBIT wissen wir, daß 1999 das Jahr des SANs ist und daß dies möglicherweise viele Jahre so bleiben wird. Warum? Es ist die Heterogenität der Netze, die in nahezu allen größeren Unternehmen Windows NT, Unix und OS/390 sowie proprietäre Midrange-Systeme bergen. Jeder dieser Server besitzt seinen eigenen fest zugeordneten Speicher und stellt damit für sich eine Insel dar. Diese Speicherinseln verbreiten sich zunehmend im Unternehmen, bedingt durch ein anhaltendes Wachstum der Informationsmengen.

Parallel dazu vergrößert sich das Problem des Managements dieser isolierten Speichersysteme, besonders wenn es um Backup und Recovery geht. Denn viele Netze sind nicht für unternehmenskritische Anwendungen konzipiert, obwohl heutzutage nahezu alle gespeicherten Daten in einem Netzwerk als unternehmenskritisch einzustufen sind. In einer solchen Umgebung reicht es nicht aus, mehr und schnellere Speichersysteme zu installieren - eine neue Infrastruktur ist nötig.

Eine Möglichkeit, Network Attached Storage (NAS), verwendet ein integriertes Speichersystem, das mit dem TCP/IP-Protokoll kommuniziert. Es birgt jedoch einen Nachteil: Das Protokoll limitiert die Leistungsfähigkeit. Das SAN hingegen adressiert die obengenannten Herausforderungen auf unterschiedliche Weise. Ein SAN ist ein Hochgeschwindigkeitsnetzwerk (Subnetz), das heterogene Server und Speichersysteme miteinander verbindet.

Viele setzen SAN gleich mit dem Fibre Channel. Dies begründet sich im wesentlichen durch die frühe Unterstützung des SAN-Konzepts durch die Fibre-Channel-Lobby. Besonders durch jene Organisationen bzw. Hersteller, die am Fibre-Channel-Arbitrated-Loop (FC-AL) und am Switched Fibre Channel arbeiten, da sich diese Technologien besonders gut für SAN-Anwendungen eignen. Aber so wie ein LAN aus unterschiedlichen Technologien, wie etwa Ethernet, Token Ring oder FDDI bestehen kann, so kann auch ein SAN verschiedene Technologien für lokale, Campus- oder Wide-Area-Implementierungen nutzen. Diese beinhalten natürlich den Fibre Channel, aber auch proprietäre Lösungen, zum Beispiel Escon und für den WAN-Bereich Telco-Services: Mietleitungen, ATM oder SDH.

Obwohl der Fokus typischerweise auf einer lokalen oder Campus-weiten SAN-Implementierung liegt, sollte speziell in bezug auf ein ganzheitliches Backup-Konzept und die Katastrophenvorsorge die Verfügbarkeit von SAN-Lösungen mit Weitverkehrstechnologie einbezogen sein.

Unabhängig von der eingesetzten Technologie - die Absicht ist immer die gleiche: Es geht um die Realisierung eines Hochleistungs-Speicher-Subnetzes, das Fehlertoleranz und Mehrfachverbindungen umfaßt.

Die Integration von bestehenden Servern und Speichersystemen mit SCSI-Technologie in ein SAN ist eine wesentliche Aufgabenstellung. Um es vorweg zu sagen: Obwohl SCSI eine Punkt-zu-Punkt-Architektur verwendet, keine Mehrfachverbindungen unterstützt und mit vielen Limitierungen in puncto Reichweite und Connectivity versehen ist, läßt sich eine Integration in ein SAN realisieren. Machbar ist dies mittels eines Netzwerkprozessors, der SCSI und auch andere I/O-Protokolle unterstützt.

Die Spiegelung von Daten und die Datensicherung sind elementare Maßnahmen im Rahmen eines Business-Recovery- oder Business-Continuity-Konzepts von Unternehmen. In Großrechnerumgebungen gehören die entsprechenden Routinen bereits zum Alltag, sind erprobt und sehr effektiv. Im Open-Systems- und im Midrange-Bereich sind diese Maßnahmen wegen der verteilten Systeme (Client-Server-Architektur) häufig noch verbesserungswürdig oder gänzlich mangelhaft. In beiden Fällen lassen sich SANs nutzen und die Umsetzung von Enterprise-Backup- und Katastrophenvorsorge-Strategien für unternehmenskritische Anwendungen unterstützen.

Die Redewendung "Wissen ist Macht" modifiziert sich im Informationszeitalter zu "Wissen ist Erfolg". Der Verlust von Informationen kann für ein Unternehmen das Aus bedeuten, weshalb die Spiegelung von Daten einem Mittel zum Überleben gleichkommt.

Daten werden hauptsächlich aus drei Gründen gespiegelt: Zur Datensicherung - uneingeschränkte Verfügbarkeit von kritischen Daten; zur Datenreplikation - für Test- und Entwicklungsumgebungen; und zur Datenmigration - bei Umzug, Konsolidierung oder dem Einsatz neuer Plattentechnologie.

Die führenden Hersteller von Speichersystemen haben dieses Thema aufgenommen und effektive Lösungen für die Spiegelung von Daten entwickelt. Die Basiselemente einer Spiegelungslösung bestehen aus dem Plattensystem, das die Daten beherbergt, der Software für die Steuerung der Datenspiegelungsprozesse und aus den Einrichtungen für die Verbindung der gespiegelten Plattensysteme untereinander und mit dem Server. Die Industrie unterscheidet grundsätzlich zwei Kategorien von Spiegelungsverfahren: das speicherzentrische Verfahren und das prozessorzentrische Verfahren.

Das speicherzentrische Verfahren verbindet zwei Plattensubsysteme miteinander, die primäre Platte (die gespiegelt werden soll) mit der Platte, auf der die Daten dupliziert werden sollen. Die Steuerungssoftware für den Spiegelungsprozeß ist dabei Bestandteil der beiden Plattensubsysteme. Dieser Ansatz erlaubt synchrone und nichtsynchrone Spiegelungsarten, abhängig vom Grad der geforderten Datenintegrität. Das synchrone Spiegelungsverfahren bietet hierbei die größtmögliche Datenintegrität. In diesem Verfahren wird die Schreiboperation des Servers erst als abgeschlossen betrachtet, wenn die Daten erfolgreich auf beide Plattensysteme (das primäre und das duplizierte System) geschrieben wurden.

Beim asynchronen und semisynchronen Spiegelungsverfahren übernimmt die Spiegelungssoftware in den Plattensystemen die Kontrolle für den Spiegelungsprozeß. Der Server oder Prozessor hat hier keinen Einfluß mehr, da die Schreiboperation bereits abgeschlossen wurde, womit ein gewisses Datenverlustrisiko verbunden ist, wenn ein Fehler auftreten sollte.

Beim prozessorzentrischen Verfahren sind beide Plattensysteme direkt mit einem Prozessor beziehungsweise Server verbunden, der den Schreibbefehl auf die Speichereinheiten ausführt. In einer sogenannten Dual-I/O-Konfiguration sind beide Plattensysteme mit dem gleichen Prozessor beziehungsweise Server verknüpft, der jeweils einen Schreibbefehl auf die jeweilige Speichereinheit absetzt. In dieser Betriebsart liegt die Software für die Steuerung des Spiegelungsprozesses im Prozessor beziehungsweise Server.

Beide Verfahren (speicher- und prozessorzentrisch) dienen dazu, den Zugang zu den Daten und die Duplizierung in Echtzeit zu ermöglichen. Beide Plattensubsysteme (primäres und dupliziertes) werden zur gleichen Zeit aktualisiert, woraus das duplizierte Plattensubsystem als exakter Spiegel des primären resultiert. Sollte das primäre Plattensystem durch einen Fehler ausfallen, kann das duplizierte sofort als Ersatz fungieren.

Um einem größeren Desaster vorzubeugen, läßt sich das duplizierte Plattensystem auch an einem entfernten Standort installieren. Im Falle einer Katastrophe am Standort des primären Plattensystems ist das duplizierte Plattensystem, das sich an einem entfernten Standort befindet, nutzbar.

Die Spiegelung von Daten ist deutlich teurer als der traditionelle Batch-orientierte Backup auf Bandsystemen. Sie bedarf wesentlich größerer Investitionen und schließt die Verdoppelung des Plattenspeichers, die Software für den Spiegelungsprozeß, die Verbindungseinrichtungen und möglicherweise auch zusätzliche Prozessor-Ressourcen ein. Allerdings bietet sie automatisches Backup und Restore in Echtzeit, was das traditionelle Backup auf Bandeinheiten nicht zu leisten vermag.

Die führenden Hersteller, die zur Zeit Lösungen für die Datenspieglung entwickeln und anbieten, sind: EMC Corporation, IBM Corporation, Hitachi (Comparex) und Amdahl (Fujitsu). Die Auswahlkriterien für eine bestimmte Technologie beziehungsweise einen Hersteller bestimmt der Kunde mit seinen Anforderungen, mit seinen Vorstellungen bezüglich Kosten, Flexibilität, Transparenz und Recovery-Verhalten (Geschwindigkeit).

EMC Corporation hat sich auf eine speicherzentrische Lösung fokussiert und mit der Produktfamilie Symmetrix Remote Data Facility (SRDF) frühzeitig die Marktführerschaft übernommen. Einer der wesentlichen Vorteile dieses Verfahrens ist die Möglichkeit, eine Datenspiegelung gleichermaßen für Mainframe-, Midrange- und Open-Systems-Umgebungen zu realisieren.

IBM, Hitachi/Comparex und Amdahl haben ursprünglich, aufgrund ihrer Wurzeln im Mainframe-Bereich, einen prozessorzentrischen Ansatz verfolgt, allerdings haben IBM und Hitachi/ Comparex jetzt ebenfalls begonnen, eine speicherzentrische Lösung zu favorisieren.

Wie die Illustrationen verdeutlichen, kann die Datenspiegelung über unterschiedliche Entfernungen und Übertragungsmedien erfolgen: Campus, Metropolitan und über große Entfernungen (WAN). Alle diese Lösungen benötigen schnelle und effiziente Verbindungseinrichtungen für die Vernetzung von Escon, SCSI- und Fibre-Channel-Systemen (Storage Networking).

Einer der führenden Hersteller auf diesem Gebiet ist (IDC Studie 1998: Marktführer mit mehr als 44 Prozent) die Computer Network Technology Corporation (CNT), die mit einer SAN-fähigen Produktfamilie alle führenden Hersteller von Spiegelungslösungen in Mainframe-, Midrange- und Open-Systems-Umgebungen unterstützt.

Was bei SANs zu beachten ist

Obwohl die Technologie der Datenspiegelung sehr hoch entwickelt und verbreitet ist, hat sie die traditionelle Datensicherung auf Band noch nicht verdrängt. Daher bieten SANs in diesem Bereich einen großen Vorteil. Aufgrund der großen Leistungsfähigkeit erlauben sie es, die Systemausfallzeiten, die durch Backup-Prozesse entstehen, zu minimieren. Dies bedeutet eine wesentliche Verbesserung, wenn die Zeitfenster für den Backup immer enger werden. In umgekehrter Richtung läßt sich die Wiederherstellung (Restore) eines Servers entscheidend beschleunigen.

Die bisher nicht vorhandene Unterstützung des Fibre Channel bei Bandeinheiten behindert eine Implementierung kaum, denn es sind bereits entsprechende Gateway-Funktionen beziehungsweise -Produkte am Markt verfügbar, die SCSI-Geräte auf Fibre Channel umsetzen. Durch die Weitverkehrsanbindung eines SAN ist es möglich, den Backup auf einer Bandeinheit (Tape Library) in einem entfernt liegenden "Bunker" durchzuführen (Tape Vaulting). Entfernungsbegrenzungen gibt es hierbei nicht. Damit können Unternehmen ihre Backup-Strategie flexibel, in eigener Regie oder in Zusammenarbeit mit einem Backup-Partner beziehungsweise einem kommerziellen Dienstleister realisieren.

Zentralisierte Systeme und Management-SANs ermöglichen es Unternehmen, die existierende Speicherkapazität effizienter zu nutzen. Dies schließt auch die Rezentralisierung von Servern und verteilten Speichersystemen ein. Die Beschaffung neuer Speichersysteme ist ebenfalls ökonomischer, da sich die Kapazitäten in unterschiedlichen Speichersystemen nutzen lassen. Zudem genügt ein Management-Tool, um ein SAN zu verwalten.

Um diese Vorteile umsetzen zu können, müssen Unternehmen spezifische Anforderungen für eine SAN-Implementierung beachten: Es muß als separates Subnetz konzipiert sein, damit kritischer I/O-Verkehr zwischen Server und Speicher nicht durch andere Datenübertragungen blockiert oder verzögert wird. Das bedeutet, daß unterschiedliche "Classes of Service" unterstützt werden müssen, was bei Fibre Channel und ATM gegeben ist.

Für die direkte Anbindung von heterogenen Speichersystemen an ein SAN ist ein spezieller Netzwerkprozessor notwendig, der die unterschiedlichen "Classes of Service" berücksichtigt und unterschiedliche I/O- und Netzwerkprotokolle unterstützt. Diese Geräte sollten darüber hinaus auch die folgenden Eigenschaften besitzen: fehlertolerante Architektur, garantierte Datenintegrität und -übertragung, Lastenverteilung, Datenkompression für die WAN-Verbindungen und alternatives Routing.

Sicherheitsanforderungen in einem SAN müssen aus einem anderen Blickwinkel betrachtet werden als in traditionellen Netzwerken, da Speichersysteme nicht durch vorgeschaltete Server geschützt sind. Da es keine generelle Sicherheitslösung für das SAN gibt, ist dieser Aspekt für jede Implementierung gesondert zu betrachten und zu konzipieren, damit sie für jede Situation paßt.

Angeklickt

Die explodierenden Datenmengen lassen sich mit Speichererweiterung alleine nicht mehr in den Griff bekommen. Unternehmen sollten bei der Einführung eines Speichernetzes auf die richtige Infrastruktur achten und auch WAN-Verbindungen ins Kalkül ziehen, die insbesondere für Backup und Restore interessant sein können.

*Dieter Fliegert* ist Geschäftsführer der CNTware Vernetzungssysteme GmbH in Dietzenbach.