Keine Alternative zum Großrechner, sondern Ergänzung:

Der Cluster ersetzt den Mainframe nicht

25.04.1986

Rechnercluster bieten schon heute eine CPU-Gesamtleistung und Hauptspeichergröße, die deutlich die größten Mainframes übertrifft. Randbedingungen wie Integrationsgrad der Anwendungen oder Ausfallsicherheit und nicht zuletzt das EDV-Budget mit typischerweise sinkendem Systemanteil, entscheiden, ob Cluster oder Mainframes Alternativen oder komplementäre Lösungen darstellen.

Altere Industrien, wie das Transportwesen, haben Grundsatzentscheidungen, die in der Computerindustrie noch anstehen, längst getroffen und durch den Markt bestätigen lassen. Omnibus oder Privatwagen sind keine verdrängenden Alternativen, beide Hilfsmittel fanden einigermaßen separate Anwendungsgebiete, und höchstens deren Grenzen bewegen sich langsam. Vergegenwärtigt man sich die konzeptionellen Unterschiede und Integrationsmöglichkeiten von Cluster und Mainframe so wird deutlich, daß beide Konzepte nicht als Gegensatz, sondern als Evolutionsstufen in der Rechnerarchitektur aufzufassen sind. Damit wird indessen das einprägsame Bild von Bus oder Pkw zu einfach, um Voraussagen über die künftige relative Position von Rechnerarchitekturen zu treffen. Gleichwohl hilft es, die Tragweite dieser Positionierung plausibel zu machen.

Ein Blick auf das Konzept eines typischen Mainframes zeigt mehrere Ansatzpunkte für die Weiterentwicklung in Leistung und Verfügbarkeit:

Prozessor. Diese Komponente hat mit 10 Mips (Luftkühlung) beziehungsweise 26 Mips (Flüssigkühlung) eine Reife erreicht, die dramatische Leistungssteigerungen zu akzeptablen Preisen nicht erwarten läßt. Bleibt die Möglichkeit, mehrere Prozessoren gleichzeitig arbeiten zu lassen. Die damit verbundenen Softwareprobleme sind in der Praxis für das Betriebssystem (Scheduling) befriedigend gelöst, sofern man sich auf wenige Prozessoren beschränkt.

Für Mehrbenutzerumgebungen und Multitasking können damit beachtliche Leistungssteigerungen erzielt werden. Für die einzelne Anwendung selbst harrt das Multiprozessorkonzept (eng gekoppelt) noch einer generellen, benutzerfreundlichen Lösung. Der Anwendungs-Overhead wächst mit steigender Prozessorzahl mehr als linear; damit ist der Prozessorzahl, die eine geschlossene Anwendung parallel bearbeiten kann - selbst nach Lösung des Softwareproblems - praktische Grenzen gesetzt.

Hauptspeicher. Ähnlich wie beim Prozessor werden mit Packungsdichten im MBit-Bereich die Grenzen des Wachstums sichtbar. Außerdem bleibt der Abstand zwischen Haupt- und Massenspeicher in Bytes pro DM gemessen groß genug, um dem Hauptspeicher im wesentlichen die Funktion eines Cache für den Massenspeicher zuzuweisen.

Beim Multitasking sind aber beliebig große Cachespeicher für die einzelne Anwendung nicht sinnvoll, da dann der Datenverkehr zwischen Haupt- und Massenspeicher unverhältnismäßig zunimmt (Cache-miss). Rechnersysteme, die sich durch Multiprozessoren als ausgesprochene Multitaskingsysteme ausweisen, können deshalb vom beliebig großen

Hauptspeicher nicht mehr profitieren.

Beim Hauptspeicher wird sichtbar, daß Ausgewogenheit zwischen Prozessorleistung und Hauptspeichergröße auf der Grundlage der Ein-/Ausgabe-Geschwindigkeit gefordert ist, um mit optimalem Preis-Leistungs-Verhältnis am Markt erfolgreich sein zu können.

Ein-/Ausgabe. Die Betrachtungen zur Hauptspeichergröße zeigen, daß Leistungssteigerungen im Verkehr zwischen Haupt- und Massenspeicher im wesentlichen der Zahl der Tasks zugute kommt, die das System gleichzeitig abarbeiten kann. Theoretisch jedenfalls, denn der Betriebssystem-Overhead (Scheduling), zumal bei Multiprozessorsystemen, läßt höchstens einige hundert Tasks zu, die gleichzeitig behandelt werden können. Anderenfalls neigt das System rapide zur Selbstbeschäftigung.

Sinnvolle Größe auch für die Mainframes

Die zu Prozessor, Hauptspeicher und Ein-/Ausgabe angestellten Überlegungen verdeutlichen im Zusammenhang, daß auch bei Maschinen der Informationsverarbeitung - Mainframes sind nichts anderes - das "Gesetz der sinnvollen Größe" gilt. Die Herausforderung für die Zukunft besteht daher nicht so sehr in Entwicklung und Vermarktung immer schnellerer und leistungsfähigerer Systeme von der Art der Mainframes, als vielmehr in Technologiekonzepten, mit denen immer mehr Anwender immer komplexere Probleme wo auch immer sinnvoll im Zusammenhang - also integriert - lösen können.

Das Clusterkonzept stellt sich als ein in der Praxis bewährter Ansatz dar, die inhärenten Wachstumsprobleme der Mainframes zu überwinden und auch für die übernächste Zukunft gerüstet zu sein. Die Grundidee für die Clustertechnologie ist einfach und wird von der Analyse des Betriebsablaufes eines Multiprozessorsystems geradezu provoziert. Da die verschiedenen Prozessoren eines solchen Systems zu jedem Zeitpunkt ebenso viele verschiedene Programme abarbeiten, gibt es potentiell nur einen Grund, weshalb die Prozessoren in einem System vereint arbeiten: das gemeinsame Nutzen von Daten und Programmen, die dem System schnell zur Verfügung stehen qualitativer Schritt der Rechnerarchitektur in Richtung auf höhere Leistungsfähigkeit wird demnach erreicht, wenn man die Funktion des gemeinsamen Nutzens von Daten, Programmen, Routinen und so weiter beibehält und das Betriebssystem von der Aufgabe, mehrere Prozessoren zu verwalten, so weit wie möglich entlastet. Wenn dann noch intelligente Dateiprozessoren ins Spiel gebracht werden, um den Verkehr zwischen Haupt- und Massenspeicher zu optimieren, kann die Zahl der gleichzeitig verarbeitbaren Tasks wesentlich (in der Praxis um mindestens eine Zehnerpotenz) gesteigert werden.

Mit schneller Verbindung ein Cluster aufbauen

Mittels einer schnellen Rechnerverbindung (CI; 70 MBit pro Sekunde) und einem oder mehreren Dateiprozessoren (HSC) ein Cluster aufbauen. Jedes Rechnersystem in einem solchen Cluster verfügt über seinen privaten Hauptspeicher und eine separate Betriebssystemkopie. Eine zwingend notwendige Voraussetzung, um eine solche Konfiguration arbeitsfähig aufzubauen, ist ein durchgängiges, identisches Betriebssystem für alle Rechnerknoten im Cluster, ob groß oder klein. Das Betriebssystem unterstützt die Dateiverriegelung über den Dateiprozessor HSC und verwaltet systemweite Auftragswarteschlangen für Stapel- und Druckverarbeitung. Damit gelingt es, den clusterspezifischen Overhead jeder Betriebssystemkopie in jeder zulässigen Konfiguration unter fünf Prozent zu halten, da nach der Zuweisung eines Auftrags an einen Rechnerknoten das Scheduling zwischen den Prozessoren abgeschlossen ist. Sowohl Dateizugriff als auch die Verriegelung erfolgen transparent für alle Benutzer. Für den Anwender präsentiert sich demnach ein Cluster nicht anders als ein einfacher Mainframe.

Mainframe-Grenzen lassen sich überwinden

Ohne hier auf die Konfigurationsregeln für einen Cluster genauer einzugehen, sei darauf hingewiesen, daß voll funktionsfähige Cluster mit über 100 Mips, mehr als 300 Megabyte Hauptspeicher, 40 Gigabyte Massenspeicher und einem verfügbaren virtuellen Adreßraum in gleicher Größenordnung heute schon installiert werden können. Der größte der über 3000 Cluster, die weltweit im Einsatz sind, enthält beispielsweise 14 Rechnerknoten.

Ein Blick auf die "Nebenprodukte" der Clustertechnologie zeigt, daß nicht nur Wachstumsgrenzen der Mainframes überwunden werden, sondern auch weitere Vorteile erwachsen:

- Da Rechnerknoten jeder Größenordnung im Clusterverbund arbeiten können, ist graduelles Wachstum durch einfaches Erweitern oder Austauschen mit einem System möglich.

- Es gibt keinen Masterknoten; damit ist der Cluster selbst dann funktionsfähig, wenn bis auf einen alle Rechnerknoten abgeschaltet werden oder ausfallen.

- Die Fehlertoleranz eines Clusters kann durch Plattenspeicher mit Zweifachschnittstelle die Verdoppelung der Dateiprozessoren HSC und Dateispiegelung noch wesentlich erhöht werden.

- Die bestens eingeführte LAN-Technik macht über Terminalserver jeden Rechnerknoten für den Dialogbetrieb gleichberechtigt verfügbar.

- Die Investition in ein Cluster kann sinnvoll unter die Anwendergruppen aufgeteilt werden, da die Rechnerknoten dediziert zugewiesen werden können.

- Am Parameter "Mips pro DM" gemessen sind Cluster höherer Leistungsklassen deutlich preiswerter als Mainframes mit vergleichbarer Brutto-CPU-Leistung.

Neue Leistungsklassen zu vernünftigen Preisen

Die Antwort auf die Frage "Cluster oder Mainframe" läßt sich somit in drei Teilen geben:

1. Cluster ersetzen Mainframes nicht, sie basieren in wesentlichen Teilen auf ihnen.

2. Mainframes sind dann sinnvoll, wenn rechenintensive Single-Task-Anwendungen vorliegen oder Multitasking (einschließlich gemeinsamer Dateinutzung) in der unteren Hälfte

des Leistungsspektrums gefordert ist .

3. Cluster sind sinnvoll, wenn Multitasking mit vielen Tasks und gemeinsamer Dateinutzung (Mehrbenutzersysteme) zumal mit rechenintensiven Komponenten gefordert oder ein graduelles Wachstum in eine solche Anforderungsklasse abzusehen ist oder es auf eine hohe Fehlertoleranz ankommt.

Die Clustertechnologie ermöglicht es - auf der Basis geeigneter Mainframes - mainframetypische Restriktionen zu überwinden und in neue Leistungsklassen zu vernünftigen Preisen und mit hoher Fehlertoleranz vorzustoßen.

Frank-Michael Fischer. Frank-Michael Fischer ist Marketing-Manager für High-End VAX-Systeme und VAXcluster der Digital Equipment GmbH in München.