HP NonStop Server

Mainframe-Zuverlässigkeit auf Standard-Architektur

10.12.2010 von Klaus Manhart
Geht es um Ausfallsicherheit sind Großrechner ungeschlagen. Doch die sind teuer, unflexibel und proprietär - und haben das Dinosaurier-Image längst vergangener Zeiten. Mit den Itanium-basierten NonStop-Servern hat HP eine moderne High-Availability-Lösung entwickelt, die bei der Zuverlässigkeit mit Mainframes gleichzieht - dafür auf Standards beruht und deutlich preiswerter ist.

Verfügbarkeit ist heute wichtiger denn je. In modernen Unternehmen sind Tausende Systeme und Zehntausende von Anwendungen und virtuellen Maschinen im Einsatz. Viele davon sind geschäftskritisch und müssen ständig präsent sein. Zudem geht der Trend immer mehr in Richtung Echtzeit-Geschäftsmodellen, bei denen Transaktionen beinahe verzögerungsfrei durchgeführt werden müssen. Hardware-Ausfälle kann man sich hier nicht mehr leisten.

Während die ersten NonStop-Server noch einen ganzen Raum benötigten, brauchen die HP NonStop Blade Systeme heute in etwa den Platz einiger Schließfächer - mit Funktionalitäten, die bei den ersten Rechnern noch undenkbar waren.
Foto: HP

Basis für hohe Verfügbarkeiten ist die Redundanz von Hardware und Software. Cluster-Architekturen sind eine Möglichkeit, Redundanz auf Hardware-Ebene bereitzustellen. Im Real Time-Business reichen solche Architekturen aber nicht mehr aus, da hier die Daten ohne Zwischenspeicherung im flüchtigen RAM sofort verarbeitet werden.

Geht beispielsweise bei Bestelleingang der Server kaputt, schaltet das Cluster-System auf den Reserverechner um - mit möglicherweise fatalen Folgen. Denn switcht das System genau bei Order-Eingang, sind die Daten, die gerade in der Maschine waren, verloren - trotz des zweiten Rechners. Zudem weiß niemand genau, ob das Umschalten auch funktioniert, weil nicht alle möglichen Szenarien im Vorfeld geprobt werden können.

Viele Jahre waren Mainframes das Maß aller Dinge, was die Zuverlässigkeit betrifft. Die redundante Auslegung der Komponenten und die hohe Fehlertoleranz des Betriebssystems sorgen für einen reibungslosen Betrieb. Großrechner machen es beispielsweise einfach, mehrere unternehmenskritische Applikationen parallel zu nutzen, ohne Kompromisse bei Sicherheit und Verfügbarkeit zu machen.

Weil die Hosts in der Regel Mehrprozessor-Maschinen sind, können einzelne Prozesse auf bestimmten CPUs laufen, so dass sich Applikationen garantiert nicht ins Gehege kommen. Diese Isolierung von Prozessen, die es auch ermöglicht, mehrere Betriebssysteme parallel auf demselben Host laufen zu lassen, trägt wesentlich zur Sicherheit bei.

Die hohe Zuverlässigkeit von Großrechnern hat jedoch ihren Preis. Herkömmliche Mainframes basieren auf teurer, herstellerspezifischer Hardware- und Softwaretechnik. Die Wahlmöglichkeiten von Unternehmen werden dadurch erheblich eingeschränkt - und sie sind auf Gedeih und Verderb der Preis- und Produktpolitik eines einzigen Herstellers ausgeliefert. High End RISC-Systeme sind zwar eine flexiblere und etwas kosteneffizientere Alternative, basieren aber ebenfalls auf relativ teurerer, herstellerspezifischer Hardware mit eingeschränkten Optionen.

Itanium - Verfügbarkeiten wie Mainframes

Moderne Hochverfügbarkeitslösungen sollten heute skalierbar, flexibel und standardisiert sein. Und vor allem auch erschwinglich. Alles Eigenschaften, die Mainframes und RISC-Systemen mangelt. Die Frage ist, ob mit preiswerter, flexibler Standard-Hardware ähnlich hohe Verfügbarkeiten erzielt werden können wie bei Mainframes.

Verfügbarkeit auf Mainframe-Niveau: Die „Enhanced Machine Check Architecture“ des Itanium-Prozessors unterstützt die Verfügbarkeit auf Mainframe-Niveau durch die integrierte Fehlerbehandlung auf mehreren Ebenen.
Foto: HP

Von den derzeit relevanten Prozessoren ist der Intel Itanium-Prozessor der ideale Kandidat, der es mit der Mainframe-Zuverlässigkeit aufnehmen kann. Die auf Standards aufbauende Rechnerarchitektur ist flexibler und weitaus kostengünstiger als Mainframe- und RISC-Systeme. Vor allem basieren Itanium-Chips auf einer Architektur, die Verfügbarkeitsmerkmale in der Mainframe-Klasse erreicht. Intel zielt mit den speziellen RAS-Funktionen des Itanium (Reliability, Availability, Manageability) besonders auf diesen Bereich. Die RAS-Funktionen erkennen und beheben Hardware- und Software-Fehler, die Systemausfälle bewirken.

Insbesondere der Itanium Dualcore-Chip hat zu einer weiteren Leistungssteigerung geführt. Diese neue Prozessorgeneration ist nicht nur schneller, sondern wurde auch um mehrere Verfügbarkeitsfunktionen auf Chipebene ergänzt, die andere CPUs nicht bieten - beispielsweise Anweisungswiederholung oder die Eingrenzung schlechter Daten.

HP hat die RAS-Eigenschaften des Itanium genutzt, um mit seiner NonStop-Serie eine hochintegrierte Verfügbarkeitslösung zu entwickeln. Ein NonStop-Server bildet ein hybrides lokales Cluster aus Hardware- und Software-Redundanz, das innerhalb einer einzigen Maschine realisiert ist. Jeder NonStop-Server ist damit ein Cluster in sich, das 2 bis mehr als 4.000 logische Prozessoren umfassen kann. Ein logischer Prozessor entspricht dabei einem Itanium-Prozessor -in Cluster-Terminologie: Einem Knoten im herkömmlichen Cluster. Fällt ein Prozessor aus, übernimmt ein anderer seine Arbeit.

Die Nachteile von Cluster-Lösungen - etwa bei Echtzeit-Anwendungen - werden so umgangen, da alle Komponenten in einem Einzelsystem mit einem Hauptspeicher untergebracht werden. Mit dieser Philosophie erzielt HP Verfügbarkeiten von 99,99999 Prozent ("7-nines availability") und reduziert das Ausfallrisiko um das 100fache. Umgerechnet werden die ungeplanten Ausfallzeiten so auf drei Sekunden pro Jahr reduziert. In der IT zählen solche Werte zur Spitzenklasse.

Optimiertes Hochverfügbarkeits-Betriebssystem

Den Software-Part dieser kooperativen High-Availability-Lösung übernimmt das speziell optimierte Betriebssystem NonStop OS. Über dieses können Applikationen, Middleware und Daten auf verschiedene Knoten verteilt werden. Es enthält hochintegriert alles, wofür bei einem normalen Cluster die Clusterschicht sorgt. Ein weiterer Vorteil. NonStop OS unterstützt die Java Virtual Machine, so dass Java Enterprise Server und Open Source Frameworks auf den Servern laufen.

Vergleich HA-Cluster mit NonStop-Server: Das NonStop OS übernimmt die Aufgaben des Cluster Layers.
Foto: HP

Mit Hilfe dieser in der Open Source Community weit verbreiteten Frameworks können Kunden neue Anwendungen schnell und einfach auf die NonStop-Plattform bringen. Somit vergrößert sich der Einsatzbereich für geschäftskritische Systeme deutlich. Im Gegensatz zu Cluster-Modellen lassen sich bei NonStop-Servern neue Anwendungen und Dienste damit leichter implementieren, der Betrieb besser steuern und der Zugang zur IT-Infrastruktur verbessern.

NonStop-Server sind im übrigen nicht nur geschützt gegen ungeplante Ausfälle, sondern minimieren auch den Zeitraum der Vollstillstände - etwa bei Wartungsarbeiten. Beispielsweise lassen sich neue Hardware oder aktuelle Software-Versionen im laufenden Betrieb ohne Anwendungsunterbrechung implementieren.

Fazit: Hinsichtlich Hochverfügbarkeit und Skalierbarkeit sind NonStop-Server den Mainframe-Systemen klar ebenbürtig. Sie stellen eine preiswertere Alternative für kontinuierlich verfügbare, unternehmenskritische Anwendungen dar. Die Lösung ist im Vergleich zu Mainframes günstig - inklusive der Wartungskosten. NonStop-Server lassen sich mit sehr geringen Aufwand an Personal betreiben. Egal wie groß das System ist - die Kosten sind sehr niedrig, weil die Server mit einem Minimum an System- und Database-Management auskommen.

Und die heutigen NonStop-Systeme brauchen weniger Energie und Platz: Während das erste System noch einen ganzen Raum umfasste, benötigt das HP Integrity NonStop Blade System jetzt in etwa den Platz einiger Schließfächer - mit Funktionalitäten, die vor einigen Jahren noch undenkbar gewesen wären.

NonStop-Systeme werden derzeit vor allem im Finanz- und TK-Sektor bei geschäftskritischen Applikationen eingesetzt. Datenbankverändernde Transaktionen, wie sie besonders bei Banken, im Handel und der Telekommunikationsbranche häufig vorkommen, laufen auf der Plattform unterbrechungsfrei rund um die Uhr. In Deutschland werden kleinere NonStop-Anwendungen etwa in der Produktionssteuerung bei Mercedes oder bei der Deutschen Bahn in der Logistik genutzt.