Systemadministration/Prophylaxe gegen Probleme in heterogenen Umgebungen

Administratoren als Agentenführer

10.10.1997

Durch die Umstellung auf moderne Client-Server-Umgebungen - und noch sehr viel stärker durch die Einführung der Web-Technologie - haben sich die Rahmenbedingungen im DV-Bereich drastisch verändert. Rechenleistung ist heute oft nicht einfach verteilt. Computer unterschiedlicher Hersteller, die mit zahlreichen verschiedenen Betriebssystemen, Netzwerkkomponenten und modularer Software arbeiten, müssen ständig überwacht werden.

Derartige Umgebungen bringen entsprechend viele potentielle Fehlerquellen mit sich, und auch die Kapazitätsplanung ist zu einem ernsten Problem geworden. Speziell durch das Vordringen der Web-Technologie ist es heute nicht mehr möglich, bei der Implementierung einer Applikation voraussagen zu können, welchen Anforderungen Hard- und Software im praktischen Betrieb genügen müssen.

Ein Ausfall - und sei er noch so kurzfristig - hat in den meisten Fällen gravierende Folgen. Es gilt daher, mögliche Fehlerquellen zuverlässig ausfindig zu machen, bevor es zu echten Problemen kommt. Die Aufgabe einer modernen System-Management-Lösung liegt deshalb nicht einfach nur in der Benachrichtigung eines Supervisors. Vielmehr muß es autark zur Fehlervermeidung beitragen und Probleme erkennen und beheben, bevor es zu gravierenden Schwierigkeiten kommt.

Viele Hersteller liefern für ihre eigenen Produkte sehr gute proaktive Überwachungs-Tools. Doch ohne die Möglichkeit einer zentralen Kontrolle und Steuerung sind diese Produkte für den unternehmensweiten Einsatz ungeeignet. Moderne IT-Umgebungen sind nicht nur innerhalb einer Organisation räumlich verteilt - die meisten Systeme erstrecken sich heute auch über verschiedene lokale Standorte. Soll hier eine effiziente und vor allen Dingen kostengünstige Überwachung erfolgen, müssen alle relevanten Informationen an einem zentralen Punkt zusammenlaufen.

Aus diesen Anforderungen ergibt sich ein sehr exaktes Leistungsprofil für effizientes System-Management, an dem heute die bedeutendsten Anbieter in diesem Marktsegment ihr Lösungsangebot ausrichten. Dazu gehören unter anderem IBM mit "Tivoli", CA mit "Unicenter", Candle mit dem "Candle Command Center", Platinum mit "ESM" und Compuvar mit "Eco-Tools".

Eine umfassende Systemadministration muß die zentrale Überwachung sämtlicher Hard- und Softwarekomponenten ermöglichen - vollkommen herstellerunabhängig und über sämtliche Systemgrenzen hinweg. Technisch gesehen läßt sich diese Aufgabe durch eine zweigeteilte Architektur lösen: Agenten ermitteln vor Ort die Informationen und liefern sie an ein zentrales Analyse- und Überwachungs-Tool weiter. Dieses wertet die Daten aus und sorgt entweder selbst oder durch Eingriff des Supervisors dafür, daß bei einer Störung entsprechende Aktionen eingeleitet werden.

Dieses Konzept ist nicht neu; Simple Network Management Protocol (SNMP) und Desktop Management Interface (DMI) arbeiten schon lange nach diesem Prinzip. Doch ein modernes System-Management unterscheidet sich in einigen wesentlichen Punkten von diesen direkten Vorläufern. Während SNMP und DMI primär dafür entwickelt wurden, ein einwandfreies Funktionieren der Hardware sicherzustellen, liegt der Fokus einer ganzheitlichen Lösung auf dem gesamten Netzwerk. Dazu gehören neben den Hardwarekomponenten auch die Betriebssysteme, Protokolle, Dienste und die unternehmenswichtigen Anwendungen.

Darüber hinaus müssen Agenten nicht nur in der Lage sein, Informationen über die überwachte Komponente weiterzuleiten - sie müssen bei einer Störung auch aktiv in die Komponente eingreifen können. Allerdings sollte bei der Überwachung eines großen Netzwerks mit mehreren tausend Komponenten nicht jeder Agent alle Informationen an die zentrale Überwachung weiterleiten - das Netz würde zusammenbrechen.

Daraus ergibt sich die Forderung nach objektorientierten, weitgehend unabhängig operierenden Agenten.

Software-Agenten, die ihre Informationen der zentralen Überwachungsstelle übermitteln, arbeiten als eigenständige Objekte.

Es gibt sie nicht nur für alle wichtigen Komponenten auf allen relevanten Plattformen vom Großrechner bis zum Web-Server, sondern auch für das Auslesen von Hardware-Informationen aus Netzwerkkomponenten über die SNMP-Schnittstelle.

Bei größeren Netzen werden außerdem hierarchische Strukturen eingeführt, so daß lokale Agenten ihre Informationen an lokale Server leiten, und diese dann entscheiden, welche Aktionen auszulösen und welche Informationen an die zentrale Überwachung weiterzugeben sind. Der Supervisor bekommt dadurch nur noch die Alarmmeldungen angezeigt, die eine Aktion von ihm verlangen. Er hat allerdings jederzeit die Möglichkeit, sich Echtzeitdaten jeder überwachten Komponente anzusehen.

Eine leistungsfähige System-Management-Lösung überwacht alle wichtigen Komponenten eines Netzwerks. Das beginnt bei den unterschiedlichsten Rechnerplattformen, erstreckt sich über die Betriebssysteme, umfaßt alle populären Datenbanken und reicht bis zur Überwachung geschäftskritischer Applikationen. Es kann nicht Aufgabe des Anwenders sein, seine DV-Umgebung an das System-Management anzupassen. Dieses muß sich um die aktuell vorhandene Umgebung legen und darauf ausgelegt sein, auch künftige Erweiterungen abzudecken.

Während sich in diesen Punkten System-Management-Lösungen immer ähnlicher werden, scheidet sich bei den unterstützten Plattformen sehr schnell die Spreu vom Weizen. So sind etwa einige PC-basierte Produkte nicht in der Lage, Großrechner oder Midrange-Systeme in die Überwachung einzubeziehen. Speziell Microsoft ist noch sehr stark in der PC- und Windows-Welt gefangen.

Da aber eine Kette nur so stark ist wie ihr schwächstes Glied, ist eine lückenlose Überwachung die wichtigste Voraussetzung für eine funktionierende Systemadministration. Vom Großrechner, der auch in Zukunft eine wichtige Rolle in der unternehmensweiten DV spielen wird, bis hin zu modernster Web-Technologie muß bei einer umfassenden Management-Architektur alles unter Dach und Fach sein.

Das ist auch im Hinblick auf die Skalierbarkeit von größter Bedeutung. Nur dann, wenn sich eine einmal installierte Lösung - ohne Beeinträchtigung der Funktionalität - auf beliebig viele Plattformen ausweiten und sich die Anzahl der überwachten Komponenten beliebig steigern läßt, ist eine Skalierbarkeit der Systemüberwachung erreicht.

Ein wichtiges Feature einer leistungsfähigen System-Management-Lösung ist die Berücksichtigung korrelierter Events. So kann es immer wieder geschehen, daß zwei Komponenten für sich gesehen keinerlei Probleme verursachen - ihre Kombination aber für Schwierigkeiten sorgt. Durch die logische Verknüpfung beider Komponenten läßt sich diese Störung genau ermitteln und beheben.

Ein zweiter Punkt ist das Verhältnis von Ursache und Wirkung. Denn nicht immer ist von einer Auswirkung in einer bestimmten Komponente auf die Ursache zu schließen, oft stellt sich heraus, daß vielmehr eine andere Komponente (die mitunter sogar räumlich weit entfernt sein kann) dafür verantwortlich ist. Es sollte möglich sein, die Auswirkungen eines Fehlers bis zu seiner Ursache zurückzuverfolgen und diese zu beseitigen.

Dem Web - und damit verbunden auch Intra- und Extranets - kommt nicht nur bei der Nutzung geschäftskritischer Applikationen, sondern auch bei der Überwachung der Netze eine immer größere Bedeutung zu. Durch die Einspeisung der ermittelten Informationen der Agenten in ein Intranet können alle berechtigten Administratoren bei entsprechender Ausstattung von jedem Rechner aus mit einem Standard-Browser auf die Daten zugreifen. Das bringt eine enorme Flexibilität bei der Überwachung.

Aufgrund geringer Bandbreiten hat das Web aber zwei gravierende Nachteile. So ist es nicht oder nur mit großem Aufwand möglich, anspruchsvolle Grafiken zu erstellen. Web-basierte System-Management-Lösungen beschränken sich deshalb derzeit im wesentlichen auf die Darstellung textlicher Informationen.

Das zweite Problem liegt darin, daß sich Web-basierte System-Management-Lösungen kaum für die Übertragung von Echtzeit-Daten eignen. Aus diesem Grund sind die aktuell angebotenen Systeme primär für die Überprüfung von Log-Protokollen sowie für die Fehlersuche geeignet - die Überwachung selbst findet hingegen noch immer an Workstations statt, die direkt ins Netz eingebunden sind.

Natürlich ist ein leistungsfähiges System-Management kein Allheilmittel. Denn ein von Anfang an schlecht konzipiertes Netzwerk wird auch durch die beste Überwachung nicht wesentlich leistungsfähiger. In der Praxis zeigt sich jedoch, daß eine optimale Verwaltung die Verfügbarkeit deutlich steigert, die Performance-Verbesserung durch den gezielten Einsatz neuer Komponenten die Investitionen reduziert und sich die Betriebskosten durch ein integriertes System-Management im Einzelfall um bis zu 20 Prozent senken lassen. Vor diesem Hintergrund verwundert es nicht, daß laut Hurwitz Group der Markt für Performance-Management-Software von 1997 bis zum Jahr 2000 um rund 30 Prozent auf gut 1,6 Milliarden Dollar wachsen wird.

Anforderungen

an eine ganzheitliche System-Management-Umgebung

- Integration in bestehende Umgebungen

- Skalierbarkeit für optimale Anpassung an aktuelle und künftige Anforderungen

- echte Herstellerunabhängigkeit

- objektorientierte Agenten für alle wichtigen Hardware-Umgebungen, Betriebssysteme, Datenbanken und die unternehmenskritischen Applikationen (zum Beispiel SAP R/3)

- Unterstützung moderner Technologien (Web, Intranet, Extranet)

- zentrale Überwachung und Steuerung aller Komponenten mit einem GUI-Terminal

Checkliste

Schwachstellen aufspüren und beheben

- Einrichtung einer ganzheitlichen System-Management-Umgebung

- Installation einer zentralen Überwachungs- und Steuerungskonsole

- objektorientierte Agenten für die Überwachung der einzelnen Komponenten

- Verknüpfung von Daten unterschiedlicher Plattformen

- Integration von Informationen über Hardware, Betriebssysteme, Datenbanken und Applikationen

- Performance-Kontrolle zum rechtzeitigen Aufspüren möglicher Gefahrenpunkte

- Einrichtung automatisierter Alarmmeldungen

- Erstellung automatisierter Problemlösungen

Angeklickt

Die Überwachung und Steuerung heterogener Umgebungen ist eine der zentralen DV-Aufgaben. Doch während sich viele Unternehmen Gedanken um einzelne Komponenten machen, bleibt die Überwachung und Verwaltung des Gesamtsystems oft außen vor. Dabei lassen sich durch den Einsatz guter System-Management-Lösungen viele Probleme bereits im Vorfeld beseitigen. "Agenten" könnten nicht nur relevante Daten sammeln und melden, sondern gegebenenfalls auch eigenständig Schwierigkeiten beheben. Das jedoch mit Einschränkungen.

*Jürgen Alber ist Director Consulting & Services bei der Candle GmbH in München.