Management-Schnittstelle für alle Server

20.10.2004
Von Peter Dümig*
Für Intel-basierende Server gibt es eine industrieweit standardisierte Schnittstelle für das System-Management, das Intelligent Platform Management Interface (IPMI).

Als Herausforderung erwies sich in der Vergangenheit, Server plattformübergreifend zu administrieren. Jeder Hardwarehersteller schuf anfangs seine eigenen System-Management-Funktionen, die in der Regel auf SNMP-Agenten (SNMP = Simple Network Management Protocol) beruhten. Es gab jedoch kein generelles Modell, mit dem in einer heterogenen Umgebung allgemeine Systeminformationen wie Service-Tags, Bios-Versionen oder ähnliches verfügbar gewesen wären.

Zu Beginn der 90er Jahre startete die DMTF (ehemals Desktop Management Task Force, später Distributed Management Task Force) einen groß angelegten Versuch, die Probleme des plattformübergreifenden System-Managements zu lösen. Die Gründungsmitglieder (Compaq, Dell, Hewlett-Packard und Intel) entwickelten Softwarespezifikationen. Das "Desktop Management Interface" (DMI) bot ein umfangreiches Set vordefinierter Objektklassen für Festplatten, Chassis, CPUs, Speicher etc.

Bescheidene Ansätze wachsen

Jedes mit einem DMI-Agent ausgestattete System konnte mit einer DMI-Konsole administriert werden. DMI 1.0 erlaubte nur die Abfrage lokaler Rechner, DMI 2.0 sah auch ein Remote-Management vor. Die nächste Spezifikation der DMTF nannte sich "Common Information Model" (CIM) und enthielt objektorientierte Features, die eine Wiederverwendbarkeit von Code für häufig vorkommende Objekte vorsahen. Die "Windows Management Instrumentation" (WMI) nutzt heute noch diese Schnittstelle. Rasch zeigte sich jedoch auch der wesentliche Nachteil dieser Software-Implementierungen: Sie benötigen ein in Betrieb befindliches Betriebssystem. Stürzt das Desktop-System oder der Server ab, lässt sich sonst nicht die Ursache für das Fehlverhalten ermitteln.

Als die auf Intel-Prozessoren basierenden Server ab Mitte der 90er Jahre immer leistungsfähiger wurden, gingen die Hersteller dazu über, die System-Management-Funktionen auf eigens dafür entwickelte Controller zu übertragen. Beispielsweise brachte Dells "Remote Access Card" neue Funktionen wie eine Remote Console. Solche Erweiterungskarten arbeiten auch dann noch, wenn der Server von der Stromzufuhr abgeschnitten ist oder das Betriebssystem abstürzt. Damit lassen sich auch während des Power-on Self Test (Post) oder einer Bios-Konfiguration Server administrieren. Derartige Hardwarelösungen sind eine gute Ergänzung für Software-Agenten. DMI/SNMP-Agenten liefern die Systeminformationen vor Ort, während die Erweiterungskarte aus der Ferne eine Fehleranalyse vornimmt. Allerdings muss bei jedem neuen Release der Karte auch die Software geändert werden. Diese soll das Intelligent Platform Management Interface (IPMI) beseitigen. IPMI, 1998 von Dell, Intel und anderen Hardwareherstellern initiiert, bietet eine allgemein akzeptierte, auf Nachrichten (Messages) basierende Schnittstelle zum Zugriff auf alle administrierbaren Funktionen eines Systems. Den Kern bildet ein umfangreiches Set von Befehlen und Interfaces, untergliedert nach Art der Aktivität. Beispiele sind Ermittlung der Betriebstemperaturen und Spannungszustände in Systemen, Leistungsfähigkeit der Kühlventilatoren, Ermittlung von Gehäuseeingriffen (unerlaubte Entfernung der Systemabdeckung), Zugriff auf die Logbuchinformationen (System Event Log = SEL), ein Hardware-Watchdog und Power Control (Shut Down und Neustart).

IPMI ersetzt die zuvor verwendeten abstrakten Methoden für den Zugriff auf Systeminformationen durch einen System Management Bus (SMBus), auch als Intelligent Interface Controller (I2C) bezeichnet. Ein wesentliches Kennzeichen von IPMI: Hardwarehersteller können das bereits sehr umfangreiche Grundgerüst von IPMI um eigene Befehle erweitern. Seit der ursprünglichen IPMI-Spezifikation 0.9 aus dem Jahr 1998 hat es zudem einige Erweiterungen gegeben. Aktuell in Produkten verfügbar ist die Version 1.5. Schriftlich fixiert wurde im Frühjahr 2004 die Version 2.0. Bis Produkte auf den Markt kommen, die sie unterstützen, dürfte es jedoch Ende 2005 oder Anfang 2006 werden.

Bei genauerer Betrachtung zeigt sich, dass IPMI aus insgesamt drei Spezifikationen besteht: IPMI selbst definiert das Nachrichtenübermittlungsprotokoll und die Systemschnittstellen zur Hardware. Der "Intelligent Platform Management Bus" (IPMB) spezifiziert zweitens einen internen Management-Bus für das Management innerhalb eines Chassis. Der "Intelligent Chassis Management Bus" (ICMB) definiert schließlich einen externen Management-Bus zwischen IPMI-Systemen.

Das Herzstück eines jeden IPMI-fähigen Systems ist der "Baseboard Management Controller" (BMC). Er ermöglicht eine Überwachung und Steuerung aller administrierbaren Systemkomponenten. Als Schnittstelle zwischen der Management-Software und der Hardware stellt der BMC die autonome Überwachung, das Event-Logging und die Recovery-Control bereit. Gleichzeitig dient er als Gateway zwischen der System-Management-Software, dem IPMB und dem ICMB.

Der BMC enthält einen Non-Volatilen RAM (NVRAM), einen Memory-Bereich, der auch nach dem Ausschalten eines Systems die Informationen behält. Hier werden in einem Sensor Data Record (SDR) Repository die System Event Logs (SELs) und andere Bestandsdaten aufgezeichnet. Verantwortlich ist der BMC auch für den Empfang und das Handling von Event Messages. Sie können vom Server oder vom Management-Bus (IPMB) an den BMC geschickt werden.

IPMI wird funktional fortlaufend weiterentwickelt. Beginnend mit der Version 1.5 zum Beispiel unterstützt der BMC den Zugriff über den seriellen Port und lokale Netze. Dabei sind serielle oder LAN-Konnektoren direkt oder über andere Systemkonnektoren mit dem BMC verbunden. Damit ist es möglich, einen Server vollständig von einer remoten Konsole aus über das Netzwerk oder ein Modem zu steuern. Die Stärke dieses Features: Auf dem Administrationsarbeitsplatz werden keine (Software-)Agents benötigt. Vorhandene Tools können weiterverwendet werden, denn das Interface und die Nachrichtenkanäle bleiben gleich. Der LAN-Transport nutzt das "Remote Management Control Protocol" (RMCP). Dabei kann der Server automatisch die Benachrichtigung zu aktuellen Events über den seriellen Port, das LAN, als SNMP-Trap oder direkt an einen Pager schicken. (ls)