SANs für jeden Gelbeutel: Alternative iSCSI

02.11.2004 von Sandra Adelberger

IP, das Internet Protocol, wird seit langem in File-Servern und NAS-Systemen für Datei-basierende Speicherzwecke verwendet. Jetzt kommt mit iSCSI eine Variante auf den Markt, mit der auch Datenblöcke über IP gespeichert werden können.

In den letzten zwei bis drei Jahren hat sich der Trend zur Konsolidierung und Zentralisierung von Speicherressourcen (Storage) am Markt weiter fortgesetzt. Die Begriffe SAN (Storage Area Network) und NAS (Network Attached Storage) sind in aller Munde, die Vorteile von Speichertechniken wie Fibre Channel oder Speichervirtualisierung werden lebhaft diskutiert. Gleichzeitig hat das Internet Protocol (IP) den Markt vollkommen durchdrungen - Rechnernetze und auch das Internet sind ohne IP nicht denkbar.

Wegen der breiten Verfügbarkeit und Reife von IP wird es seit geraumer Zeit auch für die Bereitstellung von Speicherressourcen genutzt: File-Server auf NFS-Basis (Network File System) gibt es seit rund 25 Jahren, und auch CIFS, das Common Internet File System, ist seit mehr als einem Jahrzehnt im Markt zu finden. CIFS und NFS sind dateibasierende Protokolle: Client-Systeme fordern Dateien von einem zentralen File-Server oder NAS-System an, dem das Dateisystem gehört. Geht eine Anforderung beim File-Server ein, dann sucht er die Datei in seinem Dateisystem, übersetzt den Namen in physikalische Blöcke auf seinem Plattenspeicher, lädt die Blöcke in den Hauptspeicher (Memory) und transferiert sie danach über das Netz. Das ist sehr aufwändig und kann zu erheblichen Latenzzeiten beim Dateizugriff führen. Erschwerend wirkt sich aus, dass dieser Vorgang für jeden einzelnen Dateizugriff anfällt.

Für einige Anwendungen ist dieser Overhead nicht akzeptabel. Sie verwalten deshalb die Blöcke in ihren eigenen Strukturen und verlangen nach direktem Datenzugriff auf Blockebene. Der Vorteil davon ist, dass die Latenzzeiten sinken und die Leistung steigt. Mit der Entwicklung von SAN-Techniken sind diese Applikationen nicht mehr auf direkt angeschlossene Speichersysteme (Direct Attached Storage Devices = DASD) angewiesen. Sie können vielmehr auf Basis von Fibre-Channel-(FC-)Netzen direkte Blockzugriffe an zentrale Speichersysteme schicken, die über einen erheblich größeren Durchsatz und eine deutlich höhere Kapazität verfügen als direkt angeschlossene Speicher.

Fibre Channel ist schnell, aber teuer

Das Fibre-Channel-Protokoll (FCP) ist für den Transfer von Datenblöcken über Hochgeschwindigkeitsleitungen ausgelegt: Die Übersetzung von der Datei auf physikalische Blöcke erfolgt nicht im Speichersubsystem, sondern auf dem Rechner, der Daten vom Speichersubsystem anfordert. Der Speicherbereich im SAN erscheint für den zugreifenden Host-Rechner als lokale Festplatte oder Bandlaufwerk, für deren Verwaltung er selbst verantwortlich ist. Da das Host-System die Aufgabe, Dateinamen in physikalische Blöcke auf dem Massenspeicher zu übersetzen, nicht an einen zentralen Server delegiert, sondern selbst im Cache erledigt, entfällt der Übersetzungsaufwand, mit dem ein NAS-System oder File-Server zu kämpfen hat.

Fibre Channel arbeitet mit Spezialhardware und ist somit eine zwar sehr leistungsstarke, aber auch teure Technik: Die Kosten entstehen nicht nur bei den eigentlichen Massenspeichern - dem Festplatten-Subsystem oder der Bandbibliothek -, sondern auch bei den speziellen Controllern, Hostbus-Adaptern, den Switch-Ports und den separaten Netzinfrastrukturen. Hinzu kommen die Kosten für speziell ausgebildetes Personal, das ein FC-SAN einrichten, in Betrieb nehmen und am Leben erhalten kann. Deshalb halten selbst große Unternehmen FC-Technik meist nur für solche Applikationen vor, die unternehmenskritische Daten verarbeiten oder Daten besonders schnell bereitstellen müssen.

iSCSI - der Tritt auf die Kostenbremse

Vor diesem Hintergrund wurde iSCSI als kostengünstige Alternative zur blockbasierenden Datenspeicherung entwickelt. iSCSI - SCSI über IP - setzt auf dem bewährten Internet Protocol (IP) auf, um SCSI-Befehle zu übertragen. Die Funktionsweise ähnelt der von FCP und Fibre Channel: Ein SCSI-Befehl wird in eine iSCSI-Protokolleinheit eingebettet, die wiederum in einen TCP-Protokoll-Header gepackt und wie ein ganz normales IP-Paket über das IP-Netz verschickt wird. Der Empfänger des Paketes entfernt die IP- und TCP-Header, entpackt den SCSI-Befehl, führt ihn aus und schickt etwaige Ergebnisse, etwa Blöcke, die von einer Festplatte oder einem Bandlaufwerk gelesen wurden, zurück. Das IP-Paket kann hierbei genauso geroutet werden wie jedes andere IP-Paket auch - kurzum: die vollständige IP-Infrastruktur lässt sich für den Transfer von iSCSI-Paketen und somit zur blockbasierenden Datenübertragung an Massenspeichersysteme nutzen.

Zentraler Backup-Server

Im Gegensatz zum Aufbau eines FC-SAN ist das Implementieren von iSCSI ein Kinderspiel, da prinzipiell über die gleiche Hardware kommuniziert wird wie der restliche IP-Datenverkehr auch: die Ethernet-Schnittstelle. Dazu wird neben dem IP-Stapel, der für sämtliche Betriebssysteme verfügbar ist, nur noch die Implementierung des iSCSI-Protokolls benötigt, die sich in Software vornehmen lässt, für höhere Leistungsanforderungen aber auch in Hardware gegossen werden kann. Was noch fehlt, sind passende Treiber. Wird mehr Durchsatz gefordert, lassen sich TCP/IP-Stack und iSCSI-Implementierung in Hardware realisieren, die dann die Codierung und Decodierung der SCSI-Befehle übernimmt und sie direkt in TCP-Header ein- beziehungsweise auspackt. Die CPU des Host-Systems wird entlastet. Diese Technik machen sich die Anbieter so genannter iSCSI-Hostbus-Adapter (HBA) zu Nutze - ein schneller iSCSI-HBA ist durchaus in der Lage, ein Gigabit Ethernet zu sättigen, da sämtliche geschwindigkeitsrelevanten Funktionen in Asics, sprich speziellen Chips auf der HBA-Platine, realisiert sind. Die Aufgabe des Kartentreibers besteht im Wesentlichen nur noch darin, Daten vom Hauptspeicher (Memory) des Host-Systems auf den HBA zu schaufeln oder die Informationen schnell genug abzunehmen.

Für die Adressierung von iSCSI-Einheiten im Netz wird es ähnlich dem von Fibre Channel bekannten World Wide Name eindeutige iSCSI-Namen geben, die von ihrem Aufstellungsort oder der IP-Adresse unabhängig sind und aus der IP-Adresse, Port-Nummer sowie dem iSCSI-Namen des Gerätes bestehen. iSCSI-Geräte sind somit, entsprechende Konfiguration vorausgesetzt, überall im Firmennetz erreichbar und eindeutig identifizierbar.

Backup und Disaster Recovery

Gleiches gilt für die Management Information Base (MIB), die die Verwaltung von iSCSI-Geräten über Standardwerkzeuge wie Hewlett-Packards "Openview" oder IBMs "Tivoli" ermöglicht.

Der Trend zur Zentralisierung und Konsolidierung von Speicherressourcen macht auch vor dem großen Bereich Datensicherung und Disaster Recovery nicht halt. Die Ereignisse der letzten Jahre haben gezeigt, wie wichtig eine Datensicherung auch außerhalb des primären Rechenzentrums sein kann, und auch bei einem einfachen Wasserschaden hat sich eine Sicherung auf einem Bandroboter, der in einem anderen Raum stand, schon so manches Mal als Rettungsanker erwiesen. Hinzu kommt, dass Datensicherungen aufgrund der stark steigenden Datenmengen und gleichzeitig schrumpfenden Backup-Fenster insbesondere in größeren Netzen immer schwieriger zu handhaben sind: Eine Datensicherung von Server-Systemen über direkt angeschlossene Bandlaufwerke ist nur in Ausnahmefällen sinnvoll - der Verwaltungsaufwand ist sehr groß, die Ressourcenausnutzung gering und der Backup-Prozess nicht automatisiert. Deshalb wird meist manuell geprüft, ob das Backup erfolgreich war. Ab einer gewissen Anzahl von Servern im Unternehmen ist ein Backup auf direkt angeschlossene Bandlaufwerke nicht mehr sinnvoll.

Backup-Netz ergänzt das LAN.

Eine erste Abhilfe verspricht das Server-basierende LAN-Backup: Der Backup-Server initiiert den Prozess mittels einer Nachricht an das zu sichernde System, das die Daten als Datenstrom an den Backup-Server sendet. Der sichert die Informationen auf Band und pflegt eine Liste der gesicherten Dateien in eine zentrale Medienverwaltung wie TSM oder Networker ein. Diese Methode ermöglicht eine viel bessere Auslastung der Backup-Ressourcen und sorgt für einen höheren Automatisierungsgrad. Vor allem befreit sie das Personal von Routineaufgaben und eliminiert weitgehend Fehler aufgrund menschlichen Versagens.

Allerdings hat auch diese Methode einige Schwachpunkte: Die Verwaltung der Backup-Ressourcen erfordert Speicherplatz und CPU-Leistung auf dem Backup-Server. Die Architektur des Backup-Servers und der angeschlossenen Bandlaufwerke begrenzt den Datendurchsatz und die Skalierbarkeit. Eine angemessene Dimensionierung des Backup-Servers und die Anbindung der Bandlaufwerke über Fibre Channel kann diesen Problemen zwar entgegenwirken, ist aber teuer.

Auch hier bietet iSCSI eine Möglichkeit zur kostengünstigen Konsolidierung. Die einfachste und preiswerteste Variante besteht darin, eine iSCSI-Bandbibliothek in ein bestehendes IP-Netz einzubinden und den Rechnern den Zugriff auf die Library freizuschalten. Dedizierte Bandlaufwerke für einzelne Server entfallen, da alle Systeme ihre Datenkopien auf die zentrale und ständig erreichbare Tape Library senden können. Die Nutzung der bestehenden Ethernet-Infrastruktur und die recht einfache Verwaltung und Skalierbarkeit sprechen für eine sehr günstige Lösung.

iSCSI in der konsolidierten Speicherwelt

Reicht die Netzbandbreite nicht aus, lässt sich mit geringem Aufwand ein eigenes Backup-Netz einrichten und somit die physikalische Trennung von Backup und normalem Datenverkehr erzwingen. Server können nach und nach in das Backup-Netz eingebunden werden oder weiterhin die alte Infrastruktur nutzen. Für den Aufbau eines Backup-Netzes sind zwar zusätzliche Ethernet-Switches, Netzwerkkarten und auch Kabel erforderlich, doch halten sich diese Investitionen wegen der generell niedrigen Kosten für Ethernet-Komponenten und des allgemein verfügbaren Fachwissens in einem vertretbaren Rahmen.

Insbesondere die Personalkosten spielen iSCSI in die Hände: Spezialisten, die sich mit der Wartung und Pflege von Fibre Channel auskennen, sind am Markt selten zu finden und sehr teuer. Ähnliches gilt für Fachpersonal, das Backup-Server einrichten und pflegen kann. iSCSI hingegen erfordert keinen übermäßigen Lernaufwand, da die zugrunde liegenden Protokolle jedem System- und Netzwerkverwalter bekannt sind und der Betrieb und die Wartung von Bandbibliotheken generell kein Hexenwerk sind.

iSCSI lohnt sich somit vor allem für Unternehmen, die die Notwendigkeit zur Konsolidierung ihrer Festplatten- und Backup-Ressourcen anerkennen, gleichzeitig aber die hohen Kosten einer Fibre-Channel-Umgebung scheuen und auf einen maximalen Datendurchsatz verzichten können. Als Zielgruppe bieten sich kleinere und mittlere Unternehmen an, die über eine bestehende leistungsfähige Ethernet-Infrastruktur - möglichst auf Basis von Gigabit Ethernet - verfügen oder diese aufbauen wollen. Großkonzerne haben in ihren Rechenzentren bereits in eine leistungsfähige SAN-Infrastruktur auf Basis von Fibre Channel investiert. Für solche Unternehmen kann sich iSCSI aber zur Anbindung von Außenstellen lohnen. Eine Bedrohung für Fibre Channel stellt iSCSI damit nicht dar: FC wird unternehmenskritischen Anwendungen, in denen es auf maximalen Datendurchsatz und höchste Redundanz ankommt, vorbehalten bleiben.