Wissensbasierte Techniken für das Fault Management (Teil 1)

Komponentenvielfalt erschwert Management von Breitbandnetzen

27.11.1992

Breitbandnetze als integrierter Bestandteil der Unternehmenskommunikation sind, wie Carla Neumann* meint, in ihrer strategischen Bedeutung nicht hoch genug einzuschätzen. Sie ermöglichen unterschiedliche Anwendungen wie Sprache, Text, schnelle Faksimile-Übertragung, Video und hochauflösendes Fernsehen. Die Euphorie erhält jedoch einen Dämpfer, wenn es um das Netz-Management geht. Die Autorin stellt in Teil 1 Kriterien der ISO für das Netz-Management im allgemeinen und das Fault Management im speziellen vor.

Komplexe Netzstrukturen, die sich aus LANs, Nebenstellenanlagen, integrierten Sprach- und Datenressourcen sowie schnellen Übertragungswegen zusammensetzen, haben die Mängel der bis dato vorhandenen des Netz-Managements ans Tageslicht gebracht. Dies gilt insbesondere für das Fault Management von Breitbandnetzen, das obendrein durch unzählige Komponenten verschiedener Hersteller erschwert wird.

Das generische Fault-Management-System, das hier dargestellt wird, ist als eine beispielhafte Anwendung für zukünftige integrierte Breitband-Kommunikationsnetze (IBCN = Integrated Broadband Communication Networks) zu sehen, das im Rahmen des Race-Projektes AIM (Application to IBCN Maintance) entwickelt wurde.

Das System zeichnet sich in erster Linie dadurch aus, daß es das Auftreten von Fehlern in unterschiedlichen Netzkomponenten, die teils voneinander abhängig, teils unabhängig sind, ermitteln und beheben kann.

Gemeinsames Ziel von AIM und anderen Race-Projekten ist die Entwicklung eines integrierten, breitbandigen Netzwerk-Management-Systems, um mit Hilfe automatischer Dienstleistungen hochkomplexe TK-Netze verwalten zu können. Eine dieser Dienstleistungen ist das Fault Management. Netz-Management bedeutet die Koordination aller Ressourcen, die Design, zur Planung, Modellierung, Steuerung, Simulation, Generierung, Implementierung, Analyse, Überwachung, Messung sowie Test von Kommunikationsnetzen notwendig sind.

Die heutigen Anforderungen an Netze erwachsen zumindest aus zwei Dimensionen:

- Die Zahl der Netzelemente pro Netz steigt permanent, und

- die logische Komplexität beziehungsweise funktionale Ebene der durch das Netz zu leistenden Funktionen erhöht sich.

Darüber hinaus ergeben sich zusätzliche Probleme durch den Verbund heterogener Netze. Damit einher geht in der Regel der Wunsch nach einem zentralen Management-System, durch dessen Einsatz man möglichst aller Netzproblemem Herr werden und beliebige Komponenten des heterogenen Netzverbundes verwalten kann.

Für heute existierende Kommunikationsnetze existieren gemäß ISO folgende vier Gruppen von Management-Funktionen:

- Das Configuration Management enthält Hilfsmittel und Funktionen zur Planung, Erweiterung und Änderung der Konfiguration.

- Das Performance Management überprüft die aktuelle Netzlast sowie die Leistungsfähigkeit des Systems.

- Das Accounting Management: Um die Kosten des Kommunikationssystems zuordnen zu können, sollte ein Management-System Informationen über die in Anspruch genommenen Ressourcen und Dienste liefern können.

- Das Fault Management (Maintance): Dieser Punkt stellt einen zentralen Aspekt des Netz-Managements dar. Das Fault Management muß Fehler wie etwa den Ausfall von Komponenten oder Verbindungsstrecken im Netz erkennen, anzuzeigen und protokollieren. Außerdem sollten Testeinrichtungen zur Verfügung stehen, um die Funktionsfähigkeit von Netzkomponenten überprüfen zu können.

Fault Management ist, so wie hier beschrieben, die Bearbeitung von Hardwarefehlern im laufenden Netzbetrieb (Online Corrective Maintance). Fault Management bedeutet also mehr als nur die Lösung des Diagnoseproblems elektronischer Komponenten. Gemeint ist vielmehr das Problem, eine Vielzahl von Fehlermeldungen zu verarbeiten und entsprechende Fehlerhypotesen aufzustellen und zu verifizieren, um Reparaturen und gegebenenfalls vorbeugende Maßnahmen zu generieren.

Die Dienste des Fault Management umfassen Funktionen zur Erkennung, Eingrenzung und Behebung abnormaler Netzfunktionen. Als Funktionen wurden bisher definiert:

- Fehlererkennung (Fault Detection): Die Alarme werden entgegengenommen, in einer Alarmdatei abgespeichert und zur Fehlerkorrelation weitergegeben.

- Fehlerkorrelation (Fault Correlation): Die Störung einer physikalischen Komponente kann sich auf mehrere Funktionen des Netzes erstrecken, so daß alle entsprechenden Meldungen wie eine Störungsmeldung für diese einzige Komponente interpretiert werden müssen. Die Fehlerkorrelation übernimmt diese Funktion und liefert eine Liste möglicher schadhafter Komponenten, die die zuvor eingetroffenen Fehlermeldungen erklären.

- Fehlerdiagnose (Fault Diagnosis): Die Funktion Fehlerdiagnose führt tiefer in die Netzhierarchie zur Lokalisation des Fehlers. Die möglichen fehlerhaften Komponenten, die aus der Korrelation vorgeschlagen werden, werden nacheinander durch Ausführung von speziellen Tests überprüft.

- Fehlerbehebung (Fault Correction): Nach der Identifizierung einer fehlerhaften Komponente muß der Fehler behoben werden. Dies wird üblicherweise durch den Ersatz der fehlerhaften Komponente bewerkstelligt. Dabei sind eventuell Vorsichtsmaßnahmen zu treffen, um den Ausfall eines Netzteils so minimal wie möglich zu halten. Nachdem eine Komponente ausgetauscht worden ist, folgen weitere Tests, um zu prüfen, ob der Fehler behoben ist.

Die Beziehungen zwischen diesen Fault-Management-Funktionen sind logisch sequentiell, wobei die Ergebnisse der Vorgängerfunktion den Input der Nachfolgerfunktion darstellen (vgl. Abbildung). Rückkopplungen bestehen zwischen Fehlerkorrelation, -diagnose und -behebung. Bei besonders schwer zu ermittelnden Fehlerursachen kann es notwendig sein, erneut auf die Ergebnisse der Fehlerkorrelation zurückzugreifen.

Um das erforderliche Wissen über ein Netzwerk mit seinen Komponenten zu akquirieren, wurden Interviews mit Experten geführt sowie formale Beschreibungen über physikalische Komponenten und andere technische Informationen herangezogen. Dadurch ließ sich sowohl strukturelles Wissen über Netzkomponenten als auch über ihr Verhalten im Netz akquirieren.

*Carla Neumann ist Beraterin für Telekommunikation in der Geschäftsstelle Kommunikation und Anwendungen der Danet GmbH, Darmstadt. Ein Verzeichnis weiterführender Literatur zu diesem Thema ist bei der Autorin erhältlich.