Trucluster-SW und Memory-Channel bringt Skalierbarkeit und Fehlertoleranz

Mit Hard- und Softwarekonzept zielt DEC aufs Data-Warehouse

10.05.1996

Das neue Cluster-Konzept von DEC zeichnet sich durch verschiedene Eigenschaften aus: Gegenwärtig können bis zu vier Rechner aus der Alpha-Server-Familie ("Turbolaser") miteinander zu einem System gekoppelt werden. Jeder einzelne Rechner läßt sich mit maximal acht Alpha-RISC-Prozessoren bestücken, die bekanntlich - wie auch das zugehörige Betriebssystem DEC Unix - in 64-Bit-Technologie ausgelegt sind.

Noch dieses Jahr will DEC ein weiteres Release von Trucluster vorstellen. Mit diesem sei es dann möglich, bis zu acht Alpha-Server zusammenzuschalten. Bereits im Dezember vergangenen Jahres zeigte DEC auf der Supercomputing 95 acht mit je zwölf Prozessoren ausstaffierte Alpha-Server 8400, die zu einem Cluster verbunden waren.

Zweite tragende Komponente des Cluster-Konzepts von DEC neben der Software Trucluster ist die Hardware-Verbindungstechnologie "Memory Channel" (MC). Vor über einem Jahr hatte DEC erstmals für seine Unix-basierten Alpha-Server ein Cluster-Konzept mit Namen "Advantage Cluster" vorgestellt, das sich aber der Vorteile des Memory Channel noch nicht bedient.

Lizenzrechte am MC-Design hatte DEC von der Encore Computer Corp. erworben, die das Konzept unter anderem in ihren "Infinity-90"-Systemen nutzt. Digital modifizierte die Encore-Technologie allerdings, um das MC-Design unter anderem auf die in den Alpha-Servern benutzte PCI-I/O-Bus-Architektur zuzuschneiden.

Im Prinzip besteht das Memory-Channel-Konzept darin, SMP-, also Alpha-Server-Systeme, über PCI-Karten miteinander zu verbinden. Besteht der Cluster aus mehr als zwei Rechnern, werden diese über einen Hub mit maximal acht Steckplätzen aneinan- dergedockt.

Besonderes Kennzeichen der MC-Architektur im Vergleich zur VMS-Cluster-Lösung beziehungsweise anderen herkömmlichen Cluster-Konzepten ist die sehr niedrige Latenzzeit sowie eine hohe Bandbreite.

Bei bisherigen Konzepten funktioniert die Kommunikation und Synchronisation der Rechnerknoten nämlich netzwerkbasiert, sie läuft also beispielsweise über FDDI oder ATM. Bei der MC-Variante sind die Rechnerknoten eines Clusters beziehungsweise deren System-Busse aber direkt miteinander verbunden.

Es gibt keine Netzkarten mehr, die Kommunikation läuft auch nicht mehr über Netzprotokolle. Dieses Verfahren ist insbesondere vorteilhaft bei sogenannten Shared-Disk-Datenbankanwendungen, wie sie etwa mit der Oracle-Datenbank möglich sind.

Als weiteren Vorteil gegenüber bisherigen Cluster-Lösungen stellt DEC heraus, mit der Trucluster-MC-Lösung könne man Latenzzeiten von lediglich drei bis fünf Mikrosekunden erzielen. Darüber hinaus soll der Durchsatz bei MC-Topologien bis zu 100 MB/s betragen. Bei netzwerkbasierten FDDI-Lösungen beträgt hingegen die Bandbreite lediglich 100 Mbit/s. In Verbindung mit der sehr geringen Latenzzeit garantiere das sehr kurze Schaltzeiten zwischen den Rechnern, wirbt DEC weiter.

Mit Trucluster in Verbindung mit der MC-Architektur bietet DECs Alpha-Server-Familie - hierzu gehören die Modelle "2000", "2100", "8200" und "8400" - zumindest in der Theorie ein Rechnersystem, das bezüglich Skalierbarkeit, Ausfallsicherheit sowie Rechenleistung von Analysten wie etwa der Bloor Research Group als extrem leistungsfähig eingestuft wird.

Bei der Präsentation in New York betonten sowohl Oracle-Boß Larry Ellison als auch DEC-CEO Robert Palmer, ein aus vier Alpha-Servern mit jeweils acht Alpha-Prozessoren bestehendes Cluster-System unter DEC Unix habe das bisher mit Abstand beste TPC-C-Benchmark-Ergebnis erzielt: Mit vier geclusterten Alpha-Servern und der Datenbank "Oracle Parallel Server" kam DEC auf 30390 Transaktionen pro Minute (Tpm-C) beziehungsweise Kosten von 305 Dollar pro Tpm-C.

TPC-C-Benchmark-Rekord um 50 Prozent übertroffen

Zuvor hatte zwei Jahre lang Tandem mit einem mit 112 Mips-RISC-Prozessoren bestückten "K10000"-Modell der "Himalaya"-Serie den Rekord von 20918 Tpm-C gehalten. Dies entsprach Aufwendungen von 1151 Dollar pro Tpm-C. Der Anwender erkauft sich diese Leistung allerdings mit einem Nachteil: Die Himalaya-Rechner arbeiten mit Tandems proprietärer Datenbank.

DECs Trucluster-Konzept weist allerdings auch Schwachpunkte auf: Die Analysten der Bloor Research Group vermissen ein voll durchgängiges Cache-kohärentes Speicherkonzept. Ferner monieren Experten, daß es noch kein auf die Cluster-Struktur abgestimmtes Dateisystem gibt. Dieses ist als Bestandteil des VMS-Betriebssystems eine der tragenden Säulen des VAX-Cluster-Konzeptes. Unter DEC Unix wird diese Option voraussichtlich erst 1997 verfügbar sein.

Allerdings, so DEC-Produkt-Manager Dietmar Petereit, werde das Manko eines fehlenden File-Systems durch Eigenschaften von Oracle 7 Parallel Server ausgeglichen. Diese Datenbank nutze nämlich sowohl DECs "Distributed Lock Manager" als auch die "Distributed-Raw-Disk"-Funktion, um dem Anwender eine Cluster-weite Datensicht zu gewährleisten.

Genauso sorge die Oracle-Datenbank dafür, daß eine Cache-Kohärenz zumindest für die Oracle-Daten gegeben ist und die Hauptspeicherinhalte der jeweiligen Rechnerknoten miteinander abgeglichen werden.

DEC betont, das Trucluster-Konzept garantiere die automatische Verteilung von Applikationen auf die Rechnerknoten. Die Anwendungen müßten nicht gesondert an die Charakteristika eines Clusters angepaßt werden. Es sei zudem möglich, unterschiedliche Applikations- und Betriebssystem-Versionen in einem Rechnerverbund zu nutzen.

Momentan läuft auf DECs Alpha-Servern unter Trucluster und der MC-Architektur lediglich Oracles Datenbank. Informix bereitet allerdings für das vierte Quartal 1996 eine Portierung von "Online Extended Parallel Server", Version 8.0, für Trucluster vor. Die Information Builders Inc. plant, Trucluster-Unterstützung für ihre "EDA"-Middleware sowie ihre Entscheidungshilfe-Software "Focus" anzubieten. BEA Systems Inc. vermeldet, der Transaktionsmonitor "Tuxedo" sei bereits voll in die DEC-Technologie integriert.

Eine Memory-Channel-Unterstützung für VMS ist zum Herbst 1996, für Windows NT laut DEC jedoch erst "für einen späteren Zeitpunkt" vorgesehen.

Die Trucluster-Software inklusive Dokumentation kostet für die Alpha-Server der 2000-Modelllinie rund 43000 Mark. Für die Alpha-Server der 8X00-Reihe liegt der Preis pro Lizenz bei 83000 Mark. Die PCI-MC-Adapterkarte kostet pro Server 6200 Mark, das zugehörige Kabel 430 Mark, der MC-Hub 14500 Mark.

Höhere Ausfallsicherheit mit Trucluster

Wesentlicher Bestandteil der Trucluster-Software ist der Distributed Lock Manager (DLM). Er steuert den Zugriff auf gemeinsame Ressourcen wie die Speichersysteme und kontrolliert deren Nutzung. Ferner dient er der Datensynchronisation im Gesamtrechnerverbund.

Von Bedeutung ist ebenfalls die Softwarekomponente Distributed Raw Disk (DRD): Sie bietet einen Cluster-weiten Blick auf alle angeschlossenen Festplatten. Bei DLM und DRD handelt es sich im Grunde um APIs. Programme, die diese Schnittstellen nutzen, sind "DEC safe" und der "Logical Storage Manager" (LSM). DEC safe sorgt dafür, daß beim Ausfall eines Rechnerknotens ein anderer die Aufgaben des havarierten Systems übernehmen kann.

Manche Applikationen brauchen bei sogenannten Fail-overs nicht neu gestartet zu werden. Bei anderen Anwendungen ist es sicherer, die Applikation wieder hochzufahren. Hierzu gehört etwa SAPs R/3, das eine eigene Login-Prozedur und bei Batch-Jobs keine Reentry-Points besitzt.

Die Folgen eines Fail-overs sollen laut DEC in weniger als zehn Sekunden behoben sein. Bei "aufwendigen Applikationen kann es allerdings auch einige Minuten" dauern, meinte ein DEC-Mitarbeiter.

Der Logical Storage Manager erlaubt die dynamische Umkonfiguration im Cluster etwa von physikalischen Plattensystemen in logische. LSM erledigt ferner Probleme, die bei der Havarie eines Rechnerknotens in einem Cluster anfallen.