Speicherkonzepte in heterogenen DV-Umgebungen

In der C/S-Welt ist der zentrale Datenpool gefragt

03.10.1997

Nach IDC-Berechnungen steigt der Bedarf an Speicherkapazität bis zur Jahrtausendwende um 50 bis 100 Prozent pro Jahr. Treibende Kräfte sind hier unter anderem Projekte wie Data-Warehouse, Internet/ Intranet, Electronic Commerce, die Euro-Einführung und die Jahr-2000-Anpassungen. Client-Server-Architekturen und deren Implementierung haben vielfach zu einem heterogenen, dezentralen Wildwuchs und damit zum "Inseldasein" der zahlreichen eingesetzten Speichersysteme geführt. Immer stärker geht der Trend deshalb wieder zu einer Server- und Datenkonsolidierung. Insbesondere die kostenträchtigen administrativen Aktivitäten wie System- und Daten-Management sowie die Gesamtkomplexität treiben diese Entwicklung. Die Speicherrevolution wird sich hier in Richtung eines zentralen Storage-Servers bewegen (siehe Grafik).

Datenhaltungssysteme erfüllen heute eine Reihe zusätzlicher Funktionen. Die Fragen, die IS-Verantwortlichen auf den Nägeln brennen, lauten etwa: Wie können Datenbestände gesichert werden, ohne die laufenden Anwendungen zu unterbrechen? oder: Wie können Datenbestände auf der Basis unterschiedlicher Datenbanksysteme konsolidiert beziehungsweise von einer Systemumgebung in eine andere übertragen werden? Gleichwohl sind für die Auswahl eines geeigneten Datenhaltungs-/Plattensystems auch klassische Auswahlkriterien wie Verfügbarkeit oder Kapazität von Bedeutung. Diese Kriterien sollen am Beispiel von drei Speichersystemen beleuchtet werden. Dabei handelt es sich um:

- IBMs 7133/SSA

- Data Generals Clariion Advanced Storage Solution DAS 150/1300/2900

- EMCs Symmetrix 3000/5000.

Interface-Technologien: SCSI versus SSA

Zu den Kriterien für die Leistungsfähigkeit eines Speichersystems zählt das Anschluß-Interface oder die eingesetzte Kanaltechnik, insbesondere die damit erreichbare Geschwindigkeit, mit der die Daten zwischen Host und Speichersystem übertragen werden. Die Interface-Technologien SCSI und SSA werden hier gegenübergestellt (siehe Grafik Seite 36).

SCSI (Small Computer System Interface) repräsentiert eine Bit-parallele Bustechnologie mit Breiten von derzeit acht Bit und 16 Bit. Eine Reihe von SCSI-Standards wurde entwickelt: SCSI, SCSI-2,Wide-SCSI, SCSI 3 (Ultra-SCSI), single ended, differential ended, Fast Wide Differential (FWD). Die nominellen Übertragungsraten reichen von 10 MB/s (SCSI) über 20 MB/s (FWD/Wide SCSI) bis zu 40 MB/s (Ultra-SCSI). Im praktischen Einsatz werden diese Werte aber nur selten voll ausgeschöpft. Die auf SCSI-Techniken basierenden Data-General-Systeme verwenden das SCSI-2 DE Fast/Wide Interface und bieten darüber hinaus einen Lese-Schreib-Cache von 64 MB. Die Cache-Technologie erhöht den Durchsatz je nach laufender Anwendung (Cache-Hit-Ratio) und überbrückt damit Engpässe, die sich aus den Kanalübertragungsraten ergeben.

Als vorteilhaft sind dabei Aspekte wie De-facto-Standards (von allen Anbietern unterstützt), ausgereifte Technologie und Herstellerunabhängigkeit zu sehen.

Nachteilig können sich die verschiedenen SCSI-Standards, die maximale Distanz (25 Meter) bei entfernt aufzustellenden Speichern oder auch die Komplexität der Verkabelung in Multi-Host-Umgebungen auswirken. Mit 40 MB/s (Ultra-SCSI) scheint die SCSI-Technologie zudem leistungsmäßig ausgereizt zu sein.

SSA (Serial Storage Architecture) ist eine von der IBM entwickelte Bit-serielle Interface-Technologie. Die wesentlichen Merkmale sind:

- Loop-Verbindungen: Alle SSA-Geräte werden in einem "Loop", das heißt in einer Schleife untereinander verbunden. Jedes SSA-Gerät besitzt eine Verbindung zu seinen beiden benachbarten Geräten oder zu einem benachbarten Gerät und dem SSA-Host-Adapter (Initiator). Alle SSA-Geräte verfügen über zwei Ports, von denen jeder zwei simultane Datentransfers gestattet, einen Lese- und einen Schreibtransfer.

- Übertragungsrate: SSA unterstützt eine Bandbreite von 20 MB/s je unidirektionalem Link. SSA-Geräte sind mit zwei unabhängigen, unidirektionalen 20-MB/s-Verbindungen je Port bestückt. Da jeder Port zwei simultane Transfers erlaubt, ergibt dies eine gesamte Bandbreite von 40 MB/s (je Port 20 MB/s Read und 20 MB/s Write). Jedes SSA-Gerät wiederum ist mit zwei Ports ausgestattet, wodurch sich eine kumulierte Bandbreite von 80 MB/s ergibt. Die verfügbaren Host-Adapter bieten vier Ports, was beim Einsatz von zwei Loops eine theoretische Bandbreite von 160 MB/s bedeutet.

Konkurrierend zur SSA-Technologie sind die Glasfaser-orientierten, seriellen Techniken FCS (Fiber Channel System) und FC-AL (Fiber Channel Arbitrary Loop) zu sehen. Sie erlauben Transferraten von 100 MB/s. Auch hier gilt, daß die nominellen Übertragungsraten (Burst-Raten) im praktischen Einsatz nur selten erreicht werden. Den vorteilhaften Merkmalen der SSA-Technologie wie hohe Übertragungsrate, physikalische Sicherheit durch redundante Datenpfade, einfache Verkabelung und die Möglichkeit, Einheiten über eine Distanz von bis zu 680 Metern (über Glasfaser) zu installieren, steht die Herstellerabhängigkeit sowie der sich entwickelnde, herstellerunabhängige Markt der FC-AL-Technologie gegenüber. Die SSA-Subsysteme IBM 7133 bieten keinen Lese-Schreib-Cache.

Systemarchitektur der Symmetrix 3000

Während die zuvor beschriebenen Speichersysteme auch im Low-end-Bereich offener Systeme (Unix, NT) zum Einsatz kommen, positioniert EMC die Symmetrix-Familie eher im High-end-Bereich oder im Rahmen von Disk-Farm-Konzeptionen (= Server-Daten-Konsolidierung). Ordnet man die Speichersysteme 7133/SSA und DAS 150/1300/ 2900 der Kategorie "Controller Light" (Quelle: Meta Group) zu, so ist Symmetrix 3000/5000 in die Kategorie "Controller Heavy" einzuordnen. Dies schlägt sich natürlich auch im Einstiegspreis für die Basisausstattung - ohne die skalierbare Kapazität - nieder. Die Systemarchitektur (siehe Grafik) zeigt die Schlüsselelemente: Hohe Parallelität bei der simultanen Host-Anbindung und extrem großer Lese-Schreib-Cache.

Schon die Basisausstattung der Symmetrix 3330 bietet vier Channel Directors (CD), wobei jeder CD als Doppelprozessor ausgelegt ist und damit zwei simultane Kanäle zum Server verfügbar sind. Jedem der simultanen Kanäle kann ein Schaltkanal zugeordnet werden, so daß jeder CD über vier parallele Kanalanschlüsse verfügt. Beim größten Modell Symmetrix 3700 und bei Symmetrix 5700 ergeben sich somit 8 x 2 = 16 simultane + 8 x 2 geschaltete = 32 Kanalanschlüsse. So gut wie alle marktrelevanten offenen Systeme sind seitens EMC zertifiziert und können auch in einer Umgebung mit Servern anderer Hersteller (Unix, NT) angeschlossen werden. Zusätzlich konfigurierbare Remote Link Directors (RLD 2) dienen über Glasfasertechnik (beispielsweise Escon) zur entfernten Spiegelung (Raid 1) auf einem zweiten System.

Anschlußmöglichkeiten

Bei Data Generals DAS 150/1300/2900 können sich bis zu vier Server (in homogener Umgebung) ein Subsystem physikalisch teilen ("sharen"). Bei IBM 7133/ SSA lassen sich die SSA-Loops vom Systemadministrator in maximal 16 "Domains" aufteilen und können sich über mehrere Server erstrecken. Mit der Symmetrix 3000/5000 lassen sich bis zu 16 Server - in einer Kombination von Mainframes und unterschiedlichen offenen Systemen - an das Speichersystem anschließen. Das damit realisierbare "Disk-Farm"-Konzept ist eine ideale Basis für Server-Daten-Konsolidierungen.

Einige wesentliche Kriterien der drei Speichersysteme (Kapazität und Datenverfügbarkeit) sind in der Tabelle zusammengestellt. Die vielfältigen Modellausprägungen der einzelnen Systeme variieren derart, daß eine komplette tabellarische Erfassung den hier gesteckten Rahmen sprengen würde.

Speichermanagement und Sonderfunktionen

Datenhaltungssysteme haben heute zum Teil eine Autonomie entwickelt und den Status von Server-unabhängigen Speicherverwaltungssystemen angenommen. Ähnlich wie in den 70er Jahren Front-end-Systeme zur Steuerung der DFÜ-Netze sich vom Host abkoppelten, geht auch hier der Trend zum autonomen Storage-Server, der speicherrelevante Zusatzfunktionen erfüllt. Der EMC Corp. muß in diesem Kontext eine Vorreiterrolle zugesprochen werden. Beispiele hierfür sind etwa das bereits zitierte Disk-Farm-Konzept mit heterogener Systemumgebung oder die Symmetrix Remote Data Facility (SRDF). Diese erlaubt ein entferntes Speichern des "Spiegels" (Raid-1-Konfiguration) auf einem zweiten System.

*Josef Fischer arbeitet in der Enterprise-Information-Systems-Division der Bull AG in Köln.