Wissensbasierte Techniken für das Fault Management (Teil 2 und Schluß)

Komponentenvielfalt erschwert Management von Breitbandnetzen

04.12.1992

Breitbandnetze als integrierter Bestandteil der Unternehmenskommunikation sind, wie Carla Neuman* meint, in ihrer hoch genug einzuschätzen. Sie ermöglichen unterschiedliche Anwendungen wie Sprache, Text, schnelle Faksimile-Übertragung, Video und hochauflösendes Fernsehen. Die Euphorie erhält jedoch einen Dämpfer, wenn es um das Netz-Management geht. Die Autorin untersucht in Teil 2 das Fault Management mit Hilfe wissensbasierter Systeme als einen möglichen Weg zur Problemlösung.

Außer Experteninterviews wurden auch Beschreibungen physikalischer Komponenten sowie anderer technischer Informationen berücksichtigt. Die Wissenserhebung für das Generic Maintenance System (GMS) basiert dabei letztlich auf den zwei prototypischen Breitbandkommunikations-Netzen - Berkom (Berliner Kommunikations-) und DSSS des System X (Digital Subscriber Switching System of the System X Exchanges). Weiter wurden für eine allgemeine Darstellung des Wissens über Netze die Standardisierungsvorschläge von OSI/NMF und ANSI-TIM 1.5 hinzugezogen.

Das Wissen wird abgebildet

Die Wissensbasis stellt das Know-how, das zur Fehlerbehandlung notwendig ist, zur Verfügung. Es wird logisch unterschieden zwischen strukturellem Wissen und Erfahrungen über die Beziehung zwischen verschiedenen strukturellen Einheiten. Das strukturelle Wissen wird in Form eines funktionalen und eines physikalischen Modells repräsentiert (vgl. Abbildung). Entsprechende Regeln beschreiben das Verhalten von lokalen Netzkomponenten sowie des gesamten Systems.

Das heißt, sowohl für das funktionale als auch für das physikalische Modell erfolgt eine Abbildung des Wissens über die funktionale respektive physikalische Struktur und über das Verhalten einzelner funktionaler beziehungsweise physikalischer Komponenten. Auf diese Weise ist es möglich, Schlußfolgerungen über Netzkomponentenzustände zu ziehen, die auf einem detaillierten kausalen Modell eines Netzes basieren.

Folgende Wissensarten werden dabei unterschieden:

- Funktionales Wissen: Hierzu gehören Informationen über den Aufbau des Systems sowie über die zwischen seinen Einheiten bestehenden funktionalen Zusammenhänge.

- Diagnosewissen: Im Zusammenwirken mit dem funktionalen Wissen ist es möglich, gemeinsam zu wartende Einheiten zu definieren. Hier sind Informationen über verschiedene Tests und unter welchen Gegebenheiten diese angewendet werden sollen, gespeichert. Darüber hinaus gehört hierzu Wissen über erwartetes Testverhalten bei korrektem Verhalten des Netzes sowie auch bei bestimmten Fehlersituationen.

- Physikalisches Wissen: Hierzu zählen Informationen über die einzelnen physikalischen Komponenten des Systems und ihre Verknüpfungen.

- Reparaturwissen: Im Zusammenwirken mit dem physikalischen Wissen ergeben sich Informationen darüber, welche physikalischen Einheiten gemeinsam ausgetauscht werden müssen.

Zur Implementierung der oben beschriebenen Modelle diente ein objektorientierter Ansatz, wobei die jeweiligen Objekte entsprechende Elemente von Interesse im Netz darstellen. Spezielle Eigenschaften eines Objektes werden dabei durch eine Menge von Attributen für dieses Objekt definiert. Die Abbildung des Verhaltens von Netzkomponenten erfolgt somit anhand folgender Informationsarten:

- Internal States: Dieses Attribut ist jeder funktionalen Einheit zugeordnet. Komponentenzustände (Internal States) wie zum Beispiel "Working" oder "Notworking" sind die grundlegende Ursache eines spezifischen Verhaltens des Systems. Dementsprechend bilden Aussagen über den Zustand der Komponenten den Inhalt der Hypothesen über mögliche Fehlerursachen.

- Port States: Ports beinhalten Informationen über Beziehungszusammenhänge zwischen den funktionalen Einheiten und deren jeweiligen Status.

- Rules: Diese Regeln geben Auskunft über den Zustand der Output-ports in Abhängigkeit vom Zustand der zugehörigen Input-Ports sowie der Internal States.

Da sämtliche Regeln den entsprechenden Komponenten zugeordnet sind, sind diese im Sinne eines strukturellen Systemaufbaus gegliedert. Folglich lassen sie sich auch in generische, für alle Telekommunikationssysteme geltende Regeln, zum Beispiel zwischen dem Verhalten einer Verbindung (Line) und netzspezifischen Regeln, unterscheiden.

Der Schlußfolgerungs-Mechanismus, der hier verwendet wird, ist im AIM-Projekt entwickelt worden. Er zeichnet sich dadurch aus, daß er nicht an eine spezifische Wissensbasis gebunden ist - kann also für Wissensbasen aus dem TK-Bereich zur Korrelation, zur Diagnose und zur Reparatur verwendet werden. Zudem basiert er auf dem Dempster-Shafer-Ansatz und kann daher unsicheres Wissen gemäß der Wahrscheinlichkeitstheorie berücksichtigen, ist aber zugleich allgemeiner als der Bayesian-Ansatz. Dadurch ist es möglich, auch fehlendes Wissen mit zu berücksichtigen.

Wie beschrieben, besteht Sinn und Zweck der Fehlerkorrelation darin, mögliche Fehlerursachen zu identifizieren. Zu diesem Zweck werden verschiedene funktionale Beziehungszusammenhänge untersucht. Der Schlußfolgerungs-Mechanismus besteht aus den Modulen:

- Hypothesen-Interpretierer,

- Kontrollmonitor,

- Modell-Interpretierer und dem

- propositionalen Schlußfolgerungs-Modul, die jeweils andere Arten von Schlußfolgerungs-Arten ermöglichen. Dadurch kann das Fault Management wirksam unterstützt werden.

Der Hypothesen-Interpretierer benutzt die Regeln über das Verhalten einzelner Komponenten abduktiv, daß heißt, er registriert die Fehlermeldungen von Komponenten und leitet aus den zu diesen gehörenden Regeln Aussagen ab, die als Hypothesen dienen.

Jede dieser Hypothesen verfügt über eine mit ihr verbundene "Maßeinheit", die angibt, wie stark oder schwach diese Annahme aufgrund der vorliegenden Tatsachen abgesichert ist. Im Anschluß daran müssen die aufgestellten Hypothesen bearbeitet beziehungsweise als falsche oder richtige Aussagen über mögliche fehlerhafte Komponenten bestätigt werden.

Der Modell-Interpretierer ist ein Schlußfolgerungs-Modul, das das Verhalten der Komponente deduktiv interpretiert. Grundlage dafür bilden die Wissensbasen - einschließlich des Wissen darüber, welche Deduktionen sinnvoll sind. Die aufgestellten Annahmen werden deduktiv interpretiert, verweisen dann die richtigen auf die wahrscheinlich fehlerhaften Komponenten

Der Kontrollmonitor ist für die Aufteilung eines Problems in Teilprobleme zuständig. Auf diese Weise wird der sehr umfangreiche Suchraum eingegrenzt. Hauptaufgabe ist es, Steuerungs-Informationen für die anderen Module des Schlußfolgerungs-Mechanismus bereitzustellen. Dabei wird jede Funktion des Fault Management, wie Korrelation oder Diagnose, getrennt gesteuert.

Das propositionale Schlußfolgerungs-Modul kann durch die Technik des Assumption Truth Maintenance System (ATMS) temporäre Veränderungen berücksichtigen (Truth Maintenance System). Wie schon erläutert, entscheidet der Modell-Interpretierer darüber, welche Deduktionen abgeleitet werden. Hier wird ein Netz aufgebaut, das die Annahmen (Propositions), die die erfolgten Deduktionen unterstützen, in den Knoten speichert. Gleichzeitig werden Informationen darüber erstellt welche Kombinationen von diesen Annahmen inkonsistent sind.

Durch Anwendung des Schlußfolgerungs-Mechanismus für die Korrelation werden zwei Ergebnisse erzielt:

- Das Herausfiltern einer weitreichenden, möglichst viele Fehlermeldungen erfassenden, konsistenten Erklärung für die auftretenden Fehlermeldungen und,

- der Vorschlag einer qualitativ guten, in vielen Fällen mit der tatsächlichen Ursache übereinstimmenden, konsistenten Erklärung für die vorliegenden Fehlermeldungen.

Diese Techniken zur Wissensdarstellung und modellbasierten Diagnose haben sich insbesondere für Breitband-Kommunikationsnetze als sinnvoll im Bereich des Fault Management erwiesen, vor allem in puncto funktionaler und physikalischer Modellierung eines Netzes sowie der Objektdarstellung. Um die einzelnen Funktionen des Fault Managements, der Fehlerkorrelation und Fehlerdiagnose zu realisieren, werden mehrere Schlußfolgerungsarten in einem Schlußfolgerungs-Mechanismus verwendet.

Zukünftige Erweiterungen des GMS werden daher vor allem in Richtung Effizienzsteigerung und Schnelligkeit des Schlußfolgerungs-Mechanismus gehen. Ein weiterer wichtiger Aspekt ist der einer geeigneten grafischen Benutzeroberfläche, die eine wesentliche Voraussetzung für die erfolgreiche Nutzung ist.

Zur Zeit wird eine solche Komponente für das GMS entwickelt. Sie wird die grafische Abbildung des Netzes und der Zustände seiner Hauptkomponenten umfassen. Weiterhin werden für die Benutzeroberfläche Editoren angeboten, die es ohne Kenntnis der Implementierung des Systems und der verwendeten Wissensdarstellung ermöglichen, neue Netzkomponenten oder ganze Netzwerke zu modellieren.