Checkliste

Tipps für den IT-Notfall

18.09.2014
Von 
Markus Reitshammer ist Gründer und Inhaber des IT-Systemhauses Re-Systems in Innsbruck.
Tritt der Ernstfall ein, ist es für Vorbereitungen zu spät. Wer mögliche IT-Störungen bereits im Voraus durchdenkt und Notfallpläne erstellt, ist im Vorteil.

Das IT-Notfallmanagement umfasst die Notfallvorsorge mit Präventivmaßnahmen sowie die Planung der Notfallbewältigung mit der Wiederherstellung von Geschäftsprozessen und Systemen.

In der Notfallvorsorge werden technische und organisatorische Maßnahmen geplant und umgesetzt, die eine Geschäftsunterbrechung verhindern oder vorbeugen sollen. Kommt es trotzdem zu einem Schaden, soll durch zeitnahes und koordiniertes Vorgehen der Normalbetrieb des Unternehmens wieder hergestellt werden.

Mit der folgenden Checkliste können sich Unternehmen auf den Ernstfall vorbereiten.

Prozesse erfassen und analysieren

Eine IT-Notfallmanagement-Lösung erfordert zunächst eine Business Impact Analyse (BIA). Die BIA ist eine Methode, die Kernprozesse sowie deren zugehörige Infrastruktur und IT innerhalb einer Organisation sammelt und identifiziert. Dadurch können die den Prozessen zugrunde liegenden Ressourcen erfasst werden. Diese Analyse hilft auch dabei, die Abhängigkeiten zwischen Prozessen, Services und IT-Wiederanlaufzeiten darzulegen und deren Schwachstellen aufzudecken.

Eine gründliche Business Impact Analyse ist das A und O.
Eine gründliche Business Impact Analyse ist das A und O.
Foto: rrrob - Fotolia.com

Wichtige Abkürzungen in diesem Zusammenhang sind:

  • RTO (Recovery Time Objective) ist die verkraftbare Zeit vom Eintritt des Schadens bis zur vollständigen Wiederherstellung des bewerteten Geschäftsprozesses. Dabei findet eine Betrachtung jedes einzelnen Geschäftsprozesses statt, die aufzeigt, wie lange dieser ausfallen darf.

  • RPO (Recovery Point Objective) ist die maximal verkraftbare Zeitspanne innerhalb der Daten, die verloren gehen können. Daraus ergibt sich der maximal erlaubte Zeitraum zwischen zwei Datensicherungsläufen. Bei dieser Analyse wird jeder Datentyp beziehungsweise IT-Prozess gesondert betrachtet.

Notfallhandbuch

Nach der Analyse sollte das Unternehmen ein Notfallhandbuch erstellen, in dem Verfahren für alle denkbaren IT-Ausfälle definiert sowie Wiederanlaufpläne erstellt und verwaltet werden. Diese erarbeiteten Pläne sind ständig zu pflegen, um im Ernstfall alle Geschäftsprozesse so schnell wie möglich wieder zum Laufen zu bringen.

Monitoring-Tools

Das Notfallhandbuch ist meist nur eine Momentaufnahme, die schnell veraltet. Eine wesentlich einfachere und effizientere Möglichkeit ist die Benutzung von IT-Monitoring- und Alertingsystemen, die bei der Erstellung von Notfallhandbüchern und laufenden Dokumentationen unterstützen. Tritt ein Schadensereignis ein, so wird der zuvor hinterlegte Notfallprozess automatisch ausgelöst. Das spart bereits im Prozess der Schadenserkennung Zeit und Ressourcen.

Notfallteams und Krisenstab

Für das Eintreten eines Notfalls sollte vorab ein Team zusammengestellt werden, das bei Vorliegen entsprechender Notfallparameter sofort zum Einsatz kommt. Der Krisenstabsleiter ist dafür zuständig, die Auswirkungen abzuschätzen und weitere Schritte zu planen.

Rascher Informationsfluss

Im Notfall ist ein schneller und passender Informationsfluss wesentlich. Bereits im Vorfeld definierte Kommunikationswege und -mittel verhelfen zu einer effizienten und raschen Fehlerbehebung. Dabei sollte an Meldungen, Eskalation oder Alarmierung gedacht werden. Intelligente Alarmsysteme erlauben beispielweise die technische und automatisierte Umsetzung.

IT-fremde Stellen einbinden

Achtung: Auch IT-fremde Stellen sind zu informieren. Denn bei einer Störung oder einem Ausfall ist rege Kommunikation mit Geschäftsführung und Abteilungsleitern wesentlich. Auch Positivmeldungen wie die Schadensbehebung oder das Erreichen des Normalzustandes sind elementar, um Vertrauen und Stimmung im Unternehmen aufrechtzuerhalten. Ebenso Zwischenmeldungen über den Umfang des Schadens oder die zu erwartende Ausfallzeit. In diesem Zusammenhang sollte man auch an die Minimierung des Schadens denken: Betroffene Mitarbeiter können in Zeitausgleich oder Urlaub geschickt und anstehende Termine verschoben werden. Für solche Kommunikationswege gilt es, Prozesse im Vorfeld zu definieren und im Alerting-Tool oder Notfallhandbuch zu hinterlegen.

Nicht-technische Ereignistypen

Auch unerwartete Störfälle von außen wie ein Feueralarm oder der Ausfall eines Dienstleisters (beispielsweise Outsourcer oder Cloud-Anbieter) können den geregelten Tagesablauf eines Unternehmens verzögern oder komplett zum Stillstand bringen. Auch eine Finanzkrise kann den Betrieb beeinträchtigen, da wichtige Systeme oder Leistungen nicht zugekauft werden können oder Lieferanten ausfallen. Ein Umgang mit solchen Notlagen ist vorab zu bedenken.

Konfigurationsreports

Eng verzahnt mit dem Notfallhandbuch sind Konfigurationsreports, die im Gegensatz zu Leistungs- oder Verfügbarkeitsreports für den laufenden Betrieb eingesetzt werden. Ein wichtiges Stichwort ist Change Management (ITIL), also die kontinuierliche Dokumentation von Änderungen in der Infrastruktur. Auch die Nachvollziehbarkeit der Verantwortlichen und das Dokumentieren von "Wer ist oder war wann für was zuständig" ist im Ernstfall essenziell.

Fazit

Kommt es zu einem Notfall, sind jene im Vorteil, die schon im Vorfeld mögliche Szenarien durchgespielt, IT-Systeme, Geschäftsprozesse und Daten nach Wichtigkeit klassifiziert haben und die Notfalldokumentation sowie die Konfigurationsreports laufend am aktuellen Stand halten. Das klingt zu sehr nach Binsenweisheit? Gut möglich. Allerdings: Begraben liegt der Hund immer im Detail - der tatsächlichen Ausführung, idealerweise mit der Unterstützung professioneller Werkzeuge. (sh)