HPs Integrity und Superdome Server

Mehr Hochverfügbarkeit mit Tukwila

04.08.2010
Von 
Dr. Klaus Manhart hat an der LMU München Logik/Wissenschaftstheorie studiert. Seit 1999 ist er freier Fachautor für IT und Wissenschaft und seit 2005 Lehrbeauftragter an der Uni München für Computersimulation. Schwerpunkte im Bereich IT-Journalismus sind Internet, Business-Computing, Linux und Mobilanwendungen.

Besonders wichtig ist das Entdecken von Fehlern in Speicherriegeln, um im Fall der Fälle nicht mit fehlerhaften Memory-Inhalten weiter zu rechnen. Hierzu laufen im Rahmen der bekannten ECC Fehlerkorrektur Checksummen, die die Fehler finden, den Inhalt korrigieren oder defekte Riegel isolieren.

Das Erkennen und Isolieren defekter Speicherriegel beherrschten schon die Vorgänger des Itanium 9300. Doch die Fehlerkorrektur in den Itanium-Chips konnte bislang nur einen Hardware-Fehler in einem Speicherriegel Fehler identifizieren und isolieren. Traten Fehler in mehreren Riegeln auf stürzte das System ab.

Die SD2 Analysis Engine überwacht den Superdome 2 und hält ihn über Self Healing Mechanismen fehlerfrei am Laufen.
Die SD2 Analysis Engine überwacht den Superdome 2 und hält ihn über Self Healing Mechanismen fehlerfrei am Laufen.

Der Tukwila erweitert nun die Fähigkeiten seiner Vorgänger und erlaubt es mit der "Double Device Data Correction" (DDDC) einem Memory-Baustein, auch bei zwei aufeinander folgenden Hauptspeicherfehlern weiterzuarbeiten. Abstürze aufgrund von Fehlern in DIMM-Chips können mit dieser verbesserten Variante der Fehlerkorrektur weiter reduziert und die Verfügbarkeit damit erhöht werden.

Dynamisches Partitionieren möglich

Moderne Server müssen nicht unbedingt nur für eine Anwendung zur Verfügung stehen. Dynamic Domain Partitioning erlaubt es, Integrity-Systeme zur Laufzeit in verschiedene Bereiche (Domains) aufzuteilen. Mit der Vergrößerung oder Verkleinerung von Domains lassen sich beispielsweise Belastungen dynamisch abfangen und besser verteilen.