Problem-Management bei der Braun AG:

Monitore erhöhen die Systemstabilität

15.09.1989

Zuverlässigkeit rund um die Uhr. Mit dieser Erwartungshaltung muß heute jeder Leiter eines Rechenzentrums leben. Jochen Ewe* hat sich im Informationsbereich der Braun AG umgesehen und festgestellt, daß Ausfallsicherheit ohne hochwertige Systembeobachtung nicht zu gewährleisten ist.

Der dem Finanzressort im AG-Vorstand direkt unterstellte Bereich "Information Systems" (IS) ist in fünf Abteilungen untergliedert. Sie tragen die Bezeichnungen "International EDP", "Manufacturing Systems", "Commercial Systems", "IS Operations" und "Technical and End-User Services". Mit den beiden letztgenannten Abteilungen und ihrem Arbeitsumfeld beschäftigt sich dieser Artikel.

Die "Technical and End-User Services" - 21 Mann stark - werden von Max Tiefenthaler geleitet und sind für alle DV-technischen Schlüsselsysteme zuständig, darunter für Systemprogrammierung (zentrale DV) und Datenmanagement. Tiefenthaler: "Meine Abteilung ist so etwas wie eine Serviceabteilung innerhalb einer Serviceabteilung." Das zu Tiefenthalers Bereich gehörende Information-Center arbeitet seit neuestem ausschließlich mit IBMs DB2 als operativer Datenbank: DL/ 1 ist für Neuentwicklungen passé. DB2 wird über QMF erschlossen und läuft auf einem IBM 3090-Mainframe unter CICS.

Die wesentlichen Aufgaben des Rechenzentrums ("IS Operations") skizziert Abteilungsleiter Hans Jung stichwortweise so: Versorgung der Braun AG mit Information, Online-Verfügbarkeit, zentrale und dezentrale Auswertungen, Beschaffung und Wartung von Hardwaresystemen. Das Rechenzentrum nutzt je einen Bildschirm für die "Exception-Analysis", die im Monitor "Omegamon" des Softwareanbieters Candle GmbH, München, enthalten ist, und für die Überwachung der Laufzeiten und des I/O-Verhaltens der Batch-Jobs.

Diese Gruppe ist unter anderem damit befaßt, Vorschläge zu erarbeiten, wie die Nacht als dritte (Operator-lose) RZ-Schicht besser genutzt werden könnte, außerdem: wie ein besseres - Print-Management aussehen müßte. Was speziell das Change-Management betrifft, so obliegt dieser Gruppe der Aufbau eines effizienten Berichtswesens. Sie will zu diesem Zweck vor allem auf Informationen zurückgreifen, die von Realtime- und Background-Monitoren zur Verfügung gestellt werden. Braun setzt diese Monitore auch für andere Aufgaben ein, wie noch zu zeigen sein wird.

Das Problem-Management wird mit Hilfe eines PCs angegangen, in dem alle Vorgänge abgespeichert werden, die über einen "normalen" Programmabbruch hinausgehen. Wenn es im RZ von Braun, wo mit einem Job-Planungs- und Steuerungssystem gearbeitet wird, geschieht, daß ein Programm "aussteigt", so prüft zunächst das Operating die möglichen Ursachen und leitet jeden Fall der sich nicht schnell klären läßt, an das Problemmanagement weiter.

Das Problemmanagemt führt eine Kurzanalyse durch. Läßt sich die Fehlerursache nicht ermitteln, so wird der Vorgang an den jeweils zuständigen Experten zur Problembearbeitung weitergereicht. Das Problemmanagement verfolgt den Vorgang bis zu dessen Abschluß und sorgt für die Archivierung der Resultate im PC.

Nachts arbeitet das Rechenzentrum mannlos

Heute schon herrscht im Braun-RZ des Nachts keineswegs Funkstille. Dann nämlich ist die Zeit der "Jobnetze". Jobnetze entstehen durch die Verknüpfung einzelner Jobs, die in Abhängigkeit voneinander ablaufen. Sollte es zu einer Störung kommen, so wird über einen "Condition Code" abgefragt, ob aus diesem Grund der Ablauf des betreffenden Jobnetzes (automatisch) angehalten werden muß. Auf diese Weise werden Fehlbearbeitungen und -auswertungen vermieden.

Kassetteneinheiten werden tagsüber so vorgerüstet, daß sie nachts ohne weiteres Zutun Platten- und Dateisicherungen vornehmen können.

Im Rechenzentrum der Braun AG steht derzeit eine IBM 3090-180 mit 64 MB und 16 Kanälen. Geplant ist die Anschaffung einer 3090-200E mit 64 MB Erweiterungsspeicher. Die neuen 3380K-Plattenlaufwerke der IBM erweitern die Plattenkapazität der Kronberger auf 60 Gigabyte.

Die Braun-Zentrale unterhält zwölf Datenverbindungen zu den inländischen Verkaufsbüros, außerdem Direktleitungen zu den Werken sowie zum Zentrallager. Bei den Auslandstöchtern sind insgesamt 16 Systeme IBM/36 installiert. Der Datenaustausch mit der Muttergesellschaft erfolgt über das General Electric-Netz "Mark III".

Jung: "Wir sind organisatorisch relativ früh in die Richtung gegangen, mit dezentralen Rechnern zu arbeiten. Man wird sich bestimmt innerhalb der nahen Zukunft Gedanken machen müssen, ob die IBM/8100 auch für die neunziger Jahre noch die richtige Hardware ist. Unsere Überlegungen werden dabei vom PC bis zum Midrange-Mainframe, die vone Breite der denkbaren Ablösesysteme abdecken - und zwar nicht nur unter der Überschrift IBM."

Seit fünf Jahren bereits ist der Realtime-Monitor Omegamon/CICS bei Braun im Einsatz, anfangs noch zu einer Zeit, als Braun VSE als Betriebssystem nutzte. Die Onlineverarbeitung unter CICS geht sogar auf das Jahr 1974 zurück.

1983 aber, mit stetig steigenden Transaktionsraten, wurde es - so Tiefenthaler - "lebensnotwendig, CICS transparent zu machen". Nach einer Marktuntersuchung fiel damals die Entscheidung zugunsten von Candles Omegamon/CICS aus. Trotz prinzipieller Zufriedenheit äußert Tiefenthaler auch Kritik an den Candle-Produkten.

Ohne Fachleute hilft der Monitor nur wenig

In der Hand des Spezialisten seien sie zwar hervorragende Werkzeuge; aber es gebe auch Benutzer, die von der Komplexität dieser Monitore überfordert seien. Die Arbeit mit derartigen Monitoren lerne man nicht im Vorbeigehen; und deshalb sei es für Braun eine wichtige Aufgabe, dahin zu kommen, daß noch im laufenden Jahr alle betreffenden Mitarbeiter lernten, mit den Monitoren in der erforderlichen Tiefe umzugehen.

Mittlerweile hat Braun seit der Umstellung auf MVS/XA außer Omegamon/CICS weitere Monitore installiert. Seitdem liegt die Verfügbarkeitsrate bei Braun eigenen Angaben zufolge oberhalb der 99-Prozent-Marke.

"Es ist schon paradox", merkt Tiefenthaler an, "die absolute Notwendigkeit, einen CICS-Realtime-Monitor zu haben, wie dies noch unter VSE der Fall war, ist unter MVS nicht mehr in gleicher Weise gegeben. Je höher die Verfügbarkeit steigt, je sicherer und stabiler ein System wird desto mehr verringert sich die Wirtschaftlichkeit des CICS-Monitors. Andererseits sind wir weiterhin froh, diesen Monitor aktivieren zu können, wenn es mal zu kritischen Situationen kommen sollte."

RZ-Chef Jung, angesprochen auf das Thema Monitore, unterstreicht: "Diese Software soll dazu beitragen, daß wir ein besser fundiertes Wissen über die DV-Anlage, vor allem über ihre Engpässe und Schwachpunkte haben. Sie soll uns außerdem ein sicheres Kapazitätsmanagement ermöglichen." Was die TP-Verfügbarkeit betrifft differenziert Jung:

"Wir haben diese Meßgröße sehr stark nach oben gebracht. Das ist zum einen auf den Übergang auf neue Plattenspeicher und auf das neue Betriebssystem zurückzuführen, zum anderen auf den Übergang zur 3090, die wesentlich stabiler ist als ein System 4300, letztlich aber auch auf die Monitorsoftware, die den eventuell auftretenden Störungen ihre Schrecken nimmt."

Der Monitor erhöht die System-Verfügbarkeit

Braun hat seine Datenverarbeitungsanwendungen aufgeteilt auf ein Steuerungs- und vier Anwendungs-CICS plus DB2. Für jedes dieser Systeme wird, so Jung, die Verfügbarkeit gemessen; und die sei während der ersten fünf Monate des Jahres 1988 drei Monate lang bei 100 Prozent gelegen.

Jung: "Noch vor zwei Jahren waren wir stolz, wenn diese Zahlen überhaupt einen Wert zwischen 95 und 97 Prozent erreichten. Immerhin ist bei den rund 500 Terminalbenutzern, die wir haben, eine Stunde Systemausfall mit einem Schaden von minimal 25 000 Mark zu veranschlagen. Ohne das Instrumentarium, das die Monitore bieten, wäre niemand in der Lage, ein RZ optimal zu managen.

Jung-Mitarbeiter Dirk Rasmus räumt allerdings ein, daß es für den Operator, bei der Ausnahmeanalyse gelegentlich nicht ganz einfach sei, MVS-Meldungen aus Omegamon korrekt zu interpretieren. Die Ursache dafür sei, daß auf dem Ausbildungssektor für die Leute aus dem Operating kein MVS-Terminologie-Lehrgang mit RZ- und Problem-Handling-Bezug angeboten werde.

Rasmus: "Hier liegt, wenn man an Aufgaben wie RZ-Automation und Netzwerkmanagement denkt, ein absoluter Schwachpunkt." Wiederholt sei es infolge von Interpretationsschwierigkeiten zu unnötigen Zeitverlusten und zu Kommunikationsproblemen zwischen den Operatoren und Systemprogrammierern gekommen.

Auf der anderen Seite lobt MVS-Systemprogrammierer Siegfried Freichel die leichte Handhabung des Monitor-Systems. Daran entzündet sich ein spontanes Streitgespräch: Tiefenthaler wendet ein, es dauere reichlich lange, bis der Benutzer die Omegamon-Systemnachrichten verstehe und die Features in voller Breite nutzen könne - weshalb ja auch die Schulung der betreffenden Mitarbeiter diese hohe Priorität habe.

Freichel aber argumentiert, man könne dem Monitor nicht vorwerfen, sehr differenzierte Angaben zum jeweiligen Systemstatus zu machen; eine MVS/XA-Umgebung sei nun einmal so komplex, daß ihr mit simplen Darstellungen nicht beizukommen wäre. Es liege am Benutzer, ob er in der Lage sei, die vom Monitor gelieferten Werte richtig zu interpretieren.

Tiefenthalers Gegenargument, man müsse von einem Monitor automatisch bereitzustellende Analysehilfen und Anregungen erwarten können, akzeptiert Freichel, gibt aber zu bedenken: "Nach Lage der Dinge bin ich es, der den vom Monitor gelieferten numerischen Wert interpretieren können muß. Solch ein Wert kann für die eine Installation völlig normal sein, für die andere aber vielleicht schon Stillstand bedeuten; und das kann auch der Monitor nicht unterscheiden."

In einem Fall mußte IBM für einen Fehler haften

Dies sei, stellt Tiefenthaler dazu fest, der Preis dafür, daß die Braun-Crew erst seit zweieinhalb Jahren mit MVS arbeite. Wäre das Unternehmen schon seit 15 Jahren mit MVS vertraut, so wäre das Verständnis aller dieser Werte kein Problem. So aber fehle den DV-Spezialisten, wie er bereits gesagt habe, eine systemgestützte Interpretationshilfe eben doch.

Freichel erinnert sich eines Falles, in dem die CSA zu 100 Prozent "vollgelaufen" war und der Monitor hieb- und sichtfest ermittelte, daß das IMS dazu beigetragen hatte.

Diese Fehlerlokalisierung war der Schlüssel dafür, daß die IBM zur Behebung herangezogen werden konnte. Sie fand dann auch eine falsch installierte IMS-Routine als Quelle allen Übels heraus. Bis es soweit war, hatte das Vollaufen der CSA aber schon zehn IPLs während der Produktionszeit verursacht.

Die BRAUN AG

Die mit einem Grundkapital von 50 Millionen Mark ausgestattete Braun Aktiengesellschaft, zu 99,6 Prozent im Besitz der Gillette Company, Bosten, ist seit 1967 in Kronberg/Ts. niedergelassen. Braun stellt neben Elektrorasierern auch Küchenmaschinen und Haarpflegegeräte her.

Gegenwärtig hat das Unternehmen insgesamt rund 8000 Mitarbeiter. Der Umsatz erreichte im Geschäftsjahr 1986/87 rund 1,35 Milliarden Mark. Zirka ein Viertel davon entfiel auf Deutschland als den größten Einzelmarkt. Die Hälfte des Umsatzes wurde von Produkten getragen, die in den letzten drei Jahren neu auf den Markt gekommen sind.