TeamQuest

Kapazitätsmanagement bei der CSOB-Bank

Systemausfälle – nur noch als Simulation

24.08.2012
Von 
Holger Eriksdotter ist freier Journalist in Hamburg.

Engpässe rechtzeitig erkennen

Dabei ging es nicht nur darum, ob die aktuelle vorhandene Server-Infrastruktur ausreichen würde, sondern auch darum, die maximale Anzahl von Nutzern und Transaktionen zu ermitteln, die mit der vorhandenen Infrastruktur stabil und sicher zu bewältigen waren. Bei Abweichungen konnte das System darüber hinaus benutzt werden, um Vorschläge für eine Zielarchitektur zu machen, die den erwarteten Lastverhalten gerecht wird. Rückblickend haben sich alle Vorhersagen und Modelle im operativen Betrieb als ausgesprochen realistisch und exakt erwiesen.

Dreh- und Angelpunkt des Performance- und Kapazitätsmanagement-Systems ist der Teamquest Analyzer. Er analysiert in Realtime Auslastung und Effizienz der IT-Infrastruktur und erstellt Reports – sowohl Standard-Berichte für unterschiedlich Nutzergruppen als auch Ad-hoc-Reports, die bei Bedarf jeweils neu definiert werden können. Dabei verwendet er auch historische Daten, um die Wechselwirkungen einzelner Komponenten auf die Gesamtperformance zu analysieren. Auswertungen sind auf unterschiedlichen Ebenen möglich – etwa für einzelne Applikationen, Nutzer und Nutzergruppen, Kostenstellen oder Projekte. Alle ermittelten Ergebnisse können auch in Form von Diagrammen abgerufen werden.

Damit wird der Einfluss der unterschiedlichen System-Komponenten sichtbar, auf deren Basis dann Kontroll-Metriken installiert werden können. So sind etwa Schwellenwerte und Alarmfunktionen definierbar, die auf drohende Engpässe aufmerksam machen. Das kann etwa das Überschreiten von Arbeitsspeicher- oder Prozessorauslastung, Nezwerk-Traffic, Storage-Kapazitäten oder Transaktionsvolumen betreffen. Auf diese Weise werden die IT-Manager in die Lage versetzt, pro-aktiv einzugreifen, bevor ein tatsächlicher ein Schaden eintritt.

Auf diesen Analysen setzt wiederum das Simulations-Modul auf. Es erlaubt der CSOB-Bank, diverse Szenarien mit Was-wäre-wenn-Simulationen durchzuspielen und Fragen zu beantworten wie „Was würde passieren, wenn wir zusätzlichen Speicher installieren?“, „Wie würde sich die Performance verändern, wenn zwei Server ausfallen?“, oder „Welche Auswirkungen hätte eine Verdoppelung der Nutzeranzahl?“ Hinter den Simulationen steht ein ausgefeiltes mathematisches Modell, das in das prognostizierte Systemverhaltens sowohl den gegenwärtigen Zustand des Systems als auch historischen Daten einbezieht und unter den angenommenen Simulationsbedingungen in die Zukunft hochrechnet.