System-Management/Management von Client-Server-Umgebungen

Ausgefeilte Planung erspart herbe Enttäuschungen

27.09.1996

Heutzutage werden die Konsequenzen eines Fehlers abgeschätzt und automatisch ablaufende Prozeduren geschaffen, mit deren Hilfe sich Abstürze und die damit verbundenen Kosten minimieren lassen. Die Entdeckung von Problemquellen und die automatische Fehlerbeseitigung gehören zu den aktuellen Hauptaufgaben des System-Managements.

Genaue Kenntnis der Netzadministration

Die Natur verteilter Systeme bringt es mit sich, daß es bei einem Fehler schwierig ist, aus der Flut der damit zusammenhängenden Konsol-Meldungen herauszufinden, wo genau im Netz er entstanden ist und warum. Daher brauchen Netz- und Systemverwalter Werkzeuge, die Zusammenhänge darstellen, sowie Filter, die ihnen weniger wichtige Meldungen ersparen. Wichtig ist auch eine genaue Kenntnis der Netzkonfiguration. Diese Aufgabenstellung rangiert nach Ansicht des amerikanischen System-Management-Spezialisten Boole & Babbage vor den weiteren Verfügbarkeitsanforderungen in verteilten Umgebungen.

Zur Lösung dieser Aufgaben sind organisatorische Maßnahmen oft relevanter als die Technik. Tatsächlich ist System-Management für die meisten Anbieter ein Projektgeschäft. Nicht alle haben dafür jedoch umfassende Vorgehenskonzepte entwickelt, wie etwa die aus dem Großrechnerumfeld stammende Candle Corp.

Eindeutige Zuordnung ist oft schwierig

Auch die Boole & Babbage Inc., Conyer, Georgia, setzt auf gründliche Planung. Dabei unterscheidet das Unternehmen zwei grundlegende Bereiche:

- Das Event-Management reagiert auf Ereignisse, meist Fehlermeldungen,

- die Administration nimmt Wechsel in der Anwenderumgebung vor, plant die Kapazitäten und legt Sicherheits- und andere Vorgehensregeln fest (vgl. Grafik).

Auf der Ebene der Anwendungsverfügbarkeit ist es laut Boole & Babbage zudem üblich geworden, Helpdesk-Abteilungen einzuführen. Deren Aufgabe bestehe inzwischen nicht mehr nur darin, auf Klagen von Benutzern zu reagieren, sondern mögliche Probleme vorauszusehen und im Vorfeld auszuschalten.

Von besonderer Bedeutung ist die Entscheidung, welche Maßnahmen zentral und welche dezentral durchgeführt werden. So hat die Meldung, daß ein Drucker im lokalen Netz kein Papier mehr hat, nichts auf der zentralen Konsole zu suchen. Ausfälle, die den operativen Betrieb gefährden, deren Behebung sehr teuer oder nur durch Service-Unternehmen zu leisten ist, verlangen dagegen eindeutig zentrale Zuständigkeiten. In vielen Fällen ist die eindeutige Zuordnung weit schwieriger.

Angesichts der Menge und Vielfalt von Ereignissen in einer verteilten Umgebung sind Automatisierungsmechanismen unabdingbar, sollen kurze Reaktionszeiten gewährleistet sein.

Wegen des großen Entwicklungsaufwands werden jedoch meist nur Anwendungen für fundamentale Funktionen erstellt.

Eine weitere Anforderung ist die Skalierbarkeit. Sie mißt sich beim System-Management an der Anzahl der zu verwaltenden Objekte und der anfallenden Meldungen sowie der eingesetzten Operatoren. Es muß daher möglich sein, Objekte in Gruppen zusammenzufassen, die auf einem Bildschirm Platz finden. Tritt ein Problem auf, muß der Operator der Lage sein, sich bis zur Fehlerquelle durchzuklicken. Außerdem sollten sich Meldungen nach Sachgebieten und Know-how der Administratoren auf die Monitore verschiedener Abteilungen und Niederlassungen verteilen lassen, damit das RZ-Personal von zweitrangigen Problemen entlastet wird.

Eine Selbstverständlichkeit sind inzwischen Filter, die nur wichtige Meldungen anzeigen. Ein Paradebeispiel dafür ist das seit Jahren verwendete Ampelprinzip von Candle. Auf der allgemeinsten Stufe ist ein Anwendungsbereich lediglich mit den Farben Grün, Gelb oder Rot gekennzeichnet, die aufgrund der eingehenden, aber nicht dargestellten Meldungen die Dringlichkeit eines Eingriffs signalisieren.

Flexible Verteilung von Aufgaben wichtig

Da ein weitreichender Fehler manchmal eine wahre Flut von Meldungen auslöst, sollte durch ihre Aufteilung auf mehrere Systeme sichergestellt sein, daß sie den System-Management-Betrieb nicht durch die pure Menge lahmlegen und so die Fehlerbehebung behindern.

Dieses einfache Beispiel verdeutlicht, daß ein solches System-Management nur durch solche Client-Server-Konzepte realisierbar ist, die eine flexible Verteilung der Aufgaben erlauben.