Mit zunehmendem Umfang der Netze steigen die Anforderungen

Diagnose und Therapie: Zwei Seiten der Netzwerkmedaille

05.08.1988

Datennetze sind heute wichtige Bestandteile im gesamten DV- Konzept eines Unternehmens. Daher wird es für diese Unternehmen besonders wichtig, die Betriebssicherheit, die gesamte Systemverfügbarkeit und auch die Kostenentwicklung des Netzwerkes zu kontrollieren. In den vergangenen Jahren sind sowohl die Größe der Netzwerke als auch deren Funktionen und Eigenschaften stark gewachsen. Für die Pflege haben deshalb die Netzwerk-Diagnose und die daraus notwendigen "Therapien" eine ganz besondere Bedeutung.

Die Begriffe "Netzwerk-Diagnose" und "Therapie" könnten auf den ersten Blick den Eindruck vermitteln, bei dem Netzwerk handelt es sich um einen Patienten, der geheilt werden müßte. Das ist sicher manchmal notwendig, aber nicht die Regel. Viel wichtiger ist die kontinuierliche Überwachung der Betriebssicherheit, der Systemverfügbarkeit und der Betriebskosten.

Bevor jedoch eine Diagnose gestellt werden kann, müssen zuerst Informationen aus dem Netzwerk verfügbar sein, die ausgewertet und zugeordnet werden, damit sie zusammen mit den Randbedingungen als "Therapie" wirksam werden. Bild 1 zeigt diesen Ablauf.

Hier wird schon deutlich, daß die Therapien kurz oder lange dauern können: So muß bei einer Störung im Netzwerk die Fehleranalyse sehr schnell erfolgen, während die Analysen von Kapazitäts-Auslastungen und Netzwerkkosten nur langfristig möglich sind.

Netzwerk-Informationen

In jedem Netzwerk liefern die eingesetzten Komponenten Informationen über ihren Betriebszustand in vielfältiger Form, sei es als Leuchtanzeige, als gedrucktes Ablaufprotokoll oder als spezielle Netzwerkstatistik. Da das Netzwerk aus vielen Komponenten besteht, haben auch die Informationen verschiedene Inhalte, je nachdem, wo sie entstehen.

Für die Netzwerk-Diagnose lassen sich diese Informationen in zwei Kategorien unterteilen. Bild 2 zeigt diese Unterteilung in einzelne Übertragungssysteme und das gesamte Netz. Aus der Darstellung könnte man zwar schlußfolgern, daß in jeder Kategorie eigentlich alle geforderten Informationen vorhanden sein müßten. Das wäre jedoch ein Trugschluß. Häufig kann man nur aus mehreren Teilauswertungen eine Gesamtaussage ableiten.

Als Beispiel sei hier nur die Bestimmung und Zuordnung von Antwortzeiten genannt. Hier muß zwischen den durch die einzelnen Übertragungsstrecken verursachten Zeitverzögerungen und den Verarbeitungszeiten innerhalb der Zentral- und der Vorrechner sowie der Steuereinheiten unterschieden werden.

Informationen von Übertragungssystemen (1. Kategorie):

Diese Informationen sollten Auskunft über den Fehlerort und die Fehlerursache geben, damit eine Störung schnell behoben werden kann. Aus der historischen Entwicklung der Netzwerke sind diese Ergebnisse und auch die Meßverfahren für ihre Gewinnung sehr weit entwickelt worden. Da jedoch die Netzwerke und die technischen Komponenten im Netzwerk in der Funktion und auch in der Anzahl stark steigen, wächst im gleichen Maßstab auch die Menge dieser Informationen.

Informationen über das Netzwerkverhalten (2. Kategorie):

Diese Informationen werden immer wichtiger, da sie nicht erst im Fehlerfall anfallen, sondern schon im Normalbetrieb Aussagen über eine Netzwerkbelastung, das Antwortzeitverhalten und auch Aussagen über das Anwenderverhalten liefern. Sie sind die Grundlage für die Planung von Netzwerk-Erweiterungen und dienen weiterhin einer Kostenkontrolle. Diese Berichte sind je nach Rechner- und Netzwerksystem ganz unterschiedlich in ihrer Menge und ihrem Informationsgehalt.

Informationsquellen

Für den praktischen Betrieb eines Netzwerks stellen sich sofort die Fragen: "Wie kann man diese Informationen erhalten, wie aussagekräftig sind sie und wie steht es mit der Vergleichbarkeit, wenn unterschiedliche Netzwerksysteme eingesetzt sind ?"

- Informationen der Kategorie 1 (siehe Kasten auf Seite 21)

Üblicherweise werden diese mit einem "Line-Trace" gewonnen, entweder mit Hilfe von in den Übertragungskomponenten integrierten Trace-Funktionen, durch den Einsatz von Meßgeräten auf Leitungsebene (Datenleitungsmonitore) oder mit speziellen Hardware-Monitoren, die mehrere Leitungen gleichzeitig überwachen können.

Durch die Vielzahl der eingesetzten Meßgeräte beziehungsweise der unterschiedlichen Darstellung der Abläufe und Ereignisse ist eine einheitliche Auswertung nicht ganz einfach. Die Meßwerte enthalten jedoch an dieser Stelle alle Informationen über den Ablauf der Datenübertragung einschließlich des Funktionsablaufes der Übertragungsgeräte.

Weiterhin können an dieser Stelle ebenfalls die Qualität und das Zeitverhalten des Übertragungsnetzwerkes gemessen werden.

Ein ganz wichtiger Gesichtspunkt ist, daß die Informationen an dieser Stelle ohne eine Belastung des Zentralrechners gewonnen werden, und damit alle Zeitmessungen der Realität entsprechen.

- Informationen der Kategorie 2 (siehe Kasten auf Seite 21)

Diese Informationen liefern üblicherweise Software-Monitore, die im Hintergrund des Zentralrechners laufen. Diese Monitore sind in der Lage, die gesamten Zugriffe von Anwendungen über das Netzwerk zu sammeln und festzustellen, wie häufig Benutzer auf welche Anwendungsprogramme zugreifen.

Da diese Monitore im Hintergrund des Zentralrechners laufen und sie nicht alle Informationen der Kategorie 1 von dem Front-End- Prozessor, Steuereinheiten und Modemstrecken erhalten, sind Aussagen über echte Zeiten und Datenmengen direkt nicht verfügbar.

Jedoch sind diese Monitore ein wichtiges Werkzeug für den Überblick über das Zusammenwirken von Anwendungsprogrammen, Systembelastungen und die Anzahl der aktiven Benutzer. Die Monitore legen diese Ergebnisse in Dateien ab, die dann nach Bedarf ausgedruckt oder ausgewertet werden können.

Nicht selten sind Betreiber von Datennetzen der Meinung, daß man auf die Informationen der Kategorie 1 weitgehend verzichten kann. Dabei wird jedoch allzugern vergessen, daß bestimmte Informationen bei dem Einsatz von Software-Monitoren überhaupt nicht, nur lückenhaft oder nicht realtime-orientiert zur Verfügung stehen. So könnte zum Beispiel eine im Rahmen der Fehleranalyse getätigte Messung auf Leitungsebene zu lange Modemumschaltzeiten aufzeigen. Eine Korrektur dieses Problems würde wesentlich kürzere Antwortzeiten bedeuten. Dazu müßten aber solche Informationen nicht nur den für die Entstörung des Netzes zuständigen Mitarbeitern, sondern auch dem Operating und, im Idealfall, auch den Netzwerkplanern zugänglich gemacht werden.

Der Einsatz von Hardware-Monitoren fällt häufig dem Argument "zu teuer" zum Opfer, wobei von den Anwendern der Software-Monitore leicht übersehen wird, daß der durch Software-Tools erzeugte Overhead Kosten erzeugt, die bei weitem den Einsatz von realtime-orientierten overhead-freien Hardware-Monitoren übersteigen.

Auswerten und Zuordnen der Informationskategorien

Dieser Schritt auf dem Weg zur "Therapie" hat eine zentrale Bedeutung. So muß doch hier aus dem großen Angebot sowohl von der Kategorie 1 als auch von der Kategorie 2 erkannt und ausgewählt werden, welche Information für welche "Therapie" notwendig ist.

Dieser Schritt wird dadurch erschwert, daß die Ausgabe der Informationen von den Meßsystemen, den Netzwerk- Überwachungssystemen und den Datendarstellungen der Software- Monitore je nach Hersteller und Verwendung unterschiedlich sind. Eine Korrelierung beziehungsweise Filterung redundanter Informationen manuell oder durch geeignete Hilfsmittel ist an dieser Stelle unerläßlich. In Bild 3 wird dieser wichtige Schritt als Informations-Filter bezeichnet.

Damit erhalten die Produkte, die diese Informationen allgemein interpretierbar und auswertbar machen, einen ganz besonderen Stellenwert. Dementsprechend werden auch von führenden Herstellern große Anstrengungen unternommen, solche Produkte (in Hard- und Softwareversionen) anzubieten und entsprechende Standards zu schaffen.

Wichtig für das Archivieren und Auswerten dieser Informationen ist ebenfalls die Einrichtung einer entsprechenden Datenbank, da diese Ergebnisse auch zu einem späteren Zeitpunkt für Vergleiche wichtig sein können.

Die Randbedingungen für die Auswahl der Therapie

Welche Therapie angewendet wird und auch wann sie eingesetzt wird, kann nur das Unternehmen bestimmen, das dieses Netzwerk betreibt.

So kann das Unternehmen A vor allem Wert auf die Betriebssicherheit und die Systemverfügbarkeit legen, während es für ein Unternehmen B wichtig ist, die Kosten des Netzwerkes laufend zu kontrollieren. Hieraus wird deutlich, daß auch die Zielsetzung eines Unternehmens einen Einfluß auf die Netzwerk-Diagnose und auf die Therapie hat. Bild 4 stellt diesen Ablauf vereinfacht dar.

Ausblick

Für einen schnellen Informationsaustausch sind Netzwerke einfach notwendig. Sind sie erst einmal installiert und auch in Betrieb, so wachsen sie oft erschreckend schnell.

Betrachtet man weiterhin die Zunahme der funktionellen Eigenschaften der Netzwerke, dann läßt sich die Wichtigkeit einer Netzwerk-Diagnose und auch einer entsprechenden Therapie durch konsequente Auswertung der im Rahmen der Entstörung gesammelten und hoffentlich auch archivierten Daten leicht erkennen.

Diagnostiker und Therapeut in Personalunion, das wäre der Idealfall. Je größer das Unternehmen beziehungsweise das Netzwerk, desto unwahrscheinlicher ist diese Konstellation. In einem großen Unternehmen werden die für die Entstörung und Pflege des Netzwerkes zuständigen Mitarbeiter wohl kaum gleichzeitig für den Betrieb des Netzes oder gar für die Planung zuständig sein.

Doch was in der Medizin funktioniert, sollte auch innerhalb der Datenverarbeitung machbar sein. Dort gehört die Kommunikation zwischen Diagnostikern und Therapeuten zum Alltag und vor allem man spricht im Interesse des Patienten die gleiche Sprache.

Eine große Herausforderung an das DV-Management besteht daher in der Schaffung einer intensiven Zusammenarbeit, gemeinsamer Sprachregelungen und Verständnis für die Probleme des anderen. Auch die Hersteller sind aufgefordert, ihren Beitrag dazu zu leisten. Denn nicht selten ist der vom Operating erzeugte Trace für den Netzwerktechniker genauso ein Buch mit sieben Siegeln, wie die Darstellung der Daten auf dem Linemonitor für den Operator.

Jürgen Schneider ist Dipl. - Ing. und hat sich auf Netzdiagnose-Systeme spezialisiert.

Typische Meßwerte der Kategorie 1 sind: Umschaltzeiten von übertragungseinrichtungen Verzögerungszeiten im POLL-Betrieb Verbindungsaufbauzeiten in Wählnetzen Echte Datenmengenmessungen Füllgradbestimmung für X.25-Pakete Eindeutige Analyse von Blockwiederholungen Messung von Antwortzeiten

Typische Informationen der Kategorie 2 sind: Anzahl der aktiven Benutzer Anzahl der Zugriffe auf Programsysteme Zeitmessung zwischen "Logon" und "Logoff" Belegung von Ressourcen des Zentralrechners Anzahl ungültiger Zugriffe Häufigkeit der Benutzung von Endgeräten Führung von Statistiken

Wesentliche Ziele beim Betrieb eines Netzwerkes

- Schnelles Erkennen von Fehlersituationen

Für die Netzwerkwartung ist dieser Punkt wichtig, damit eine kurzfristige Reaktion erfolgen kann.

- Erkennen von Engpässen im Netzwerk

Spitzenbelastungen des Netzwerkes zu bestimmten Zeiten lassen sich oft durch organisatorische Maßnahmen beseitigen, wenn man den Grund der Spitzenbelastungen kennt.

- Trendanalyse zur Kapazitätsplanung

Ein wesentlicher Gesichtspunkt für geplante Investitionen, da oft nur unsichere Angaben über den wirklichen Kapazitätsbedarf vorhanden sind. Gute Anhaltspunkte hierfür erhält man beispielsweise aus dem Verlauf von Antwortzeiten über einen längeren Zeitraum.

- Datenmengenmessungen für Kostenanalysen

Für die Auswahl des richtigen Übertragungsnetzwerkes sind diese Werte notwendig, da Schätzwerte häufig an der Realität vorbeigehen.

- Erstellen von Eingabedaten für Netzmodellrechnungen. Die zukünftige Auslegung eines Netzwerkes läßt sich mit Modellrechnungen ziemlich gut bestimmen, wenn dafür relativ sichere Anlangswerte vorhanden sind.