Wenn das System ausfällt ...

29.11.1985

Sytemabstürze gehören zu den Schreckgespenstern der DVer. Eine Untersuchung über ihre Ursachen ergab, daß zehn Prozent durch CPU, 25 Prozent durch Peripherie, 40 Prozent durch Software und 25 Prozent durch Operating und Klima/Strom verursacht werden.

Aus dieser Verteilung geht hervor, daß eine 100prozentige Ausfallsicherheit mit großer Wahrscheinlichkeit ein kaum zu erreichender Idealfall bleiben wird.

Die Verursacherkomponenten im einzelnen:

- CPU

Die technische Entwicklung der meisten Hardware-Hersteller zielt darauf ab, die Fehlertoleranz erst gar nicht in Anspruch nehmen zu müssen, das heißt, soviel wie möglich Fehlerkorrekturen zu verwenden. Eine 100prozentige Fehlersicherheit wäre aber nur durch Redundanz, also des Vorhandensein von drei CPUs, die alle das gleiche Problem (parallel) verarbeiten, zu gewährleisten (wie etwa Navigationscomputer in Flugzeugen).

- I/O-Devices

Die I/O-Form hat durch den relativ hohen Anteil an bewegten Teilen gegenüber CPUs eindeutig Nachteile, Vorteilhaft gegenüber den CPUs wirkt es sich allerdings aus, daß periphere Geräte sowieso mehrfach vorhanden sind, so daß eine "Umleitung" des Datenflusses in vielen Fällen schon zur Problembeseitigung führt.

- Software

Die Software stellt mit 40 Prozent den höchsten Anteil. Geht man davon aus, daß Software nicht kaputtgehen kann, muß man die Ursachen wohl in der Sorgfalt bei der Erstellung und beim Test suchen. Die meisten Systemausfälle durch Software treten auf, wenn neue Versionen eingesetzt werden. Handelt es sich um Betriebssystemversionen, hat der Anwender nur bedingt Einfluß auf die Güte de Produkte. Abhilfe in solchen Situationen schafft das Zurückgreifen auf eine ältere Version.

- Operating

Bedienungsfehler können nur minimiert werden, wenn gut ausgebildetes Personal eingesetzt wird. Dies hat bei vielen Anwendern dazu geführt, daß der gesamte RZ-Betrieb von sogenannten Command Centers aus gesteuert wird, wo nur wenig, dafür aber bestens geschultes Personal eingesetzt ist. Ein anderer Ausweg ist das sogenannte Automatic Operating, wo dem Operator soviel Arbeit wie möglich durch standardisierte Prozeduren abgenommen wird.

- Klima/Stromversorgung

Jedes Rechenzentrum hat zwar für Netzstörungen vorgesorgt, aber gerade die Sommergewitter mit ihren Blitzschlägen führen uns immer wieder deutlich vor Augen, wie verletzlich besonders die Umweltkomponenten im EDV-Komplex ist.

Quelle: Amdahl Deutschland GmbH