Vorerst bleiben die Preise fuer ausfallsichere Massenspeicher hoch Die Entscheidung fuer oder gegen RAID-Speicher ist nicht einfach Von Thomas Meyer*

02.07.1993

Die RAID-Technologie in ihrer urspruenglichen Form versucht, die augenblicklichen Engpaesse bei den Massenspeichermedien zu adressieren. Anbietern von RAID-Loesungen zufolge wird RAID in der Zukunft die polemisch so genannten SLED (Single large expensive disks) weitestgehend ersetzen. Dieser Artikel beleuchtet, wie weit eine derartige Entwicklung, auch unter Abwaegung der Wirtschaftlichkeit, tatsaechlich erkennbar ist.

Die Weiterentwicklungen sowohl der Betriebssysteme mit ihren Benutzeroberflaechen als auch der einzelnen Applikationen stellen staendig wachsende Anforderungen an die Hardware in bezug auf Leistungsfaehigkeit und Kapazitaet. Solange die Software auf residente Programmteile oder Daten zugreifen kann, sind die Reaktionszeiten der Systeme durchaus akzeptabel.

50 Befehle pro Sekunde sind das Maximum bei Festplatten

Relativ lange Wartezeiten treten aber dann auf, wenn auf Massenspeicher, meistens rotierende Speichermedien, also magnetische, magneto-optische oder optische Platten, zugegriffen werden muss. Trotz der Verbesserungen der einzelnen Schnittstellen vom Rechner zu den Platten, ESDI, SCSI, DSSI (DEC) und SCSI-2, liegt der Flaschenhals nach wie vor bei dem eigentlichen Beschreiben des Mediums. Erhoehung der Rotationsgeschwindigkeit und der Aufzeichnungsdichte haben zwar nahezu zu einer Verdopplung des Datendurchsatzes gefuehrt; trotzdem gelingt es nicht, die durchschnittliche Anzahl von 50 QIO/s (Queued Input/Output pro Sekunde) deutlich zu ueberschreiten.

Darueber hinaus stellen gerade die magnetischen Platten wegen ihres hohen Anteils an mechanischen Komponenten die Ausfallursache Nummer eins in Rechnersystemen dar. Die durch Datenverlust und Systemausfall hervorgerufenen finanziellen Verluste, speziell in kritischen Anwendungen sind nur sehr schwer zu ermitteln. Gemaess einer amerikanischen Studie liegen die durchschnittlichen Kosten fuer derartige Ausfaelle bei 70 000 US-Dollar pro Stillstand.

Die bekannten Analysen und Resultate von Patterson, Chen, Gibson und Katz an der University of California in Berkeley haben die RAID-Technologie als Loesungsweg aus dem Dilemma der SLED aufgezeigt. Durch den Einsatz von mehreren kleinen, parallel angeordneten Platten sollte in erster Linie der Datendurchsatz.

Die Berkeley-Studie ging allerdings noch einige Schritte weiter. Durch die Ausnutzung von State-of-the-art-Disks mit maximal verfuegbarer Kapazitaet (heute etwa 2 GB) sind RAID-Geraete in der Lage, ein Mehrfaches an Speicherplatz im Vergleich zu den Einzelfestplatten anzubieten.

Ausserdem ist es mit Hilfe des eigenstaendigen Mikroprozessors des Controllers moeglich, auf den Platten intelligente Verteilalgorithmen zu implementieren. Die entsprechenden Techniken Mirroring, Striping, Parity und Kombinationen daraus resultierten in den heute allgemein definierten RAID-Ebenen 0 bis 5 und einigen weiteren Ansaetzen einzelner Hersteller (RAID 6, 7 etc.).

Zwar liegt bei allen Herstellern der RAID-Gedanke zugrunde, die einzelnen Implementierungen unterscheiden sich jedoch zum Teil deutlich voneinander. Sie reichen im Augenblick von reinen Softwareloesungen (Software-RAID) bis zu komplett eigenstaendigen Speichereinheiten mit redundanten Einzelkomponenten, grossen Cache- Speichern und unterbrechungsfreien Stromversorgungen.

Die Mehrzahl der Anbieter adressiert dabei die Datensicherheit beziehungsweise -verfuegbarkeit, was durch die Einfuehrung einer neuen Einheit, der MTBDL (Mean time between data losses) an Stelle von MTBF (Mean time between failures) deutlich wird. Der urspruengliche Wunsch nach einer Erhoehung des Datendurchsatzes ist bei vielen heutigen Loesungen in den Hintergrund getreten oder laesst sich nur mit relativ grossem technischen Aufwand realisieren.

Bei der Kaufentscheidung spielt der Anschaffungspreis eine entscheidende Rolle. Herkoemmliche Harddisks werden heute fuer unter 2000 Mark pro GB angeboten. Bei den RAID-Loesungen tut sich allerdings eine enorme Bandbreite von ungefaehr 500 US-Dollar fuer Software-RAID bis zu ueber 500 000 Dollar fuer ausfallsichere Grossgeraete auf. Die Preise fuer die Mehrzahl der Geraete liegt bei rund 10 000 bis 20 000 Mark pro GB, also um den Faktor 5 bis 10 ueber dem der Standarddisks. Diese Diskrepanz ist erklaerbar, da RAID-Systeme neben den Platten noch zusaetzliche Hardwarekomponenten wie Gehaeuse, Controller, Ersatzdisks und Spannungsversorgungen beinhalten.

Ausserdem bleiben die verkauften Stueckzahlen von RAID deutlich hinter den euphorischen Prognosen der Hersteller zurueck, so dass die Anwender bisher noch nicht in den Genuss der Preisvorteile einer Massenproduktion kommen.

Bei der Bandbreite der angebotenen RAID-Geraete ist es unumgaenglich, die Details der verschiedenen Implementierungen genau zu betrachten: Das klassische RAID-Geraet besteht meistens aus einem eigenen Gehaeuse, einem RAID-Controller, ueblicherweise fuenf Harddisks - vier fuer Daten, eine fuer Parity, abhaengig vom RAID-Level - sowie einer eigenen Spannungsversorgung. In dem Bemuehen, die MTBDL auf die theoretischen Werte von bis zu 49,9 Millionen Stunden (ueber 5000 Jahre) bei RAID 1 zu bringen, werden dann die besonders kritischen Komponenten wie Stromversorgung oder Ersatzlaufwerk redundant und eventuell waehrend des Betriebs austauschbar (hot swapable) ausgelegt. Darueber hinausgehende Massnahmen wie ein zweiter RAID-Controller (Halbleiter- Technologie!)

haengen stark von der jeweiligen Philosophie des Anwenders ab. Wenn das CPU-Board im Rechner doppelt vorhanden ist, wird ein redundanter RAID-Controller zu einem Muss - mit entsprechenden Mehrkosten.

Software-Cache steigert

die Leistung zusaetzlich

Wer als Anwender ausserdem die Vorteile eines erhoehten Datendurchsatzes in Anspruch nehmen moechte, wird auf RAID-Geraete mit eingebauten Cache-Speichern, sei es auf dem RAID-Controller oder an jeder einzelnen RAID-Disk, nicht verzichten koennen und auch eine zweite USV anschaffen. Zusaetzlich zu dem reinen Anschaffungspreis sollte man die versteckten Kosten wie Wartung bei weit entfernt aufgestellten Geraeten sowie Beschaffung und Lagerung der richtigen Ersatzteile bedenken. Je komplexer das Geraet, desto aufwendiger wird die Fehlersuche und der Bedarf an speziellen Austauschteilen.

Neben den Hardware-Cache-Speichern, die durch Halbleiter- Bausteine realisiert sind, werden fuer spezielle Plattformen, zum Beispiel der VAX, Software-Level-Caches angeboten beziehungsweise sind in den RAID-Angeboten enthalten. So erreicht das "Freedom"- Cache von Peak Technologies in einer VAX-Umgebung bis zu 2790 QIO/s im Dauerbetrieb (sustained) allein durch Zusammenfassung der I/Os im Rechnerspeicher und die daraus resultierende Moeglichkeit von optimierten Kopfbewegungen auf der Platte.

Vergleicht man die heutigen Preise von Standarddisks mit denen von RAID-Loesungen, so wird deutlich, dass der von den RAID- Herstellern polemisch gepraegte Begriff SLED irrefuehrend ist. Wegen der aufwendigen zusaetzlichen Hard- und Software muss RAID zwangslaeufig mit einem Aufpreis gegenueber den Disks versehen sein. Die entscheidende Frage ist, wie hoch der Zuschlag sein darf, um den Einsatz der Technologie nicht zu verhindern. Wer wuerde nicht 30 bis 50 Prozent mehr ausgeben, um die leidigen Disk-Crashes ohne Systemunterbrechung und Datenverlust zu ueberstehen?

*Thomas Meyer ist Geschaeftsfuehrer der Firma Aiket Computer in Hohenthann.