Application Performance Management (APM)

Tuning für die Anwendungen im WAN

14.07.2010 von Jürgen Hill
Weitverkehrsnetze sind die elektronischen Lebensadern der globalisierten Wirtschaft. Für Unternehmen mit weltweiten Standorten gerät das Management ihrer ICT-Infrastrukturen jedoch zu einer immer größeren Herausforderung. APM ist ein Ansatz zur Optimierung.
Staus vermeiden: Mit Hilfe von Monitoring und Optimierung-Tools lässt sich das WAN optimal auslasten.
Foto: Deutsche Telekom

Wachsender Sprach- und Datenverkehr, eine zunehmende Zahl von Videokonferenzen und nicht zuletzt die Übertragung geschäftskritischer IT-Applikationen aus zentralisierten Rechenzentren fordern die Firmennetze und erhöhen die Gefahr von Verzögerungen. Application-Performance-Management (APM) bietet Unternehmen nun die Möglichkeit, ICT-Infrastrukturen vom Server über das Netz bis zum Nutzer zu überwachen und die Performance zu steigern.

Die Zentralisierung der IT gilt nicht nur in global operierenden Unternehmen als Königsweg, um Kosten zu sparen. Wer national oder international über mehrere Filialen und Niederlassungen verfügt, bekäme unweigerlich ein Kosten- und auch Sicherheitsproblem, wenn er vor Ort überall identische Server und Applikationen bereitstellen müsste. Daher ist es grundsätzlich ratsam, eine zentrale IT-Infrastruktur aufzubauen, die das eigene Unternehmensnetz steuert und sämtliche Standorte mit allen geschäftskritischen Applikationen versorgt.

Doch diese Zentralisierung und Konsolidierung birgt nicht zu unterschätzende Gefahren. So sind viele Applikationen, die über ein WAN geschickt werden, dafür nicht ausgelegt, da sie ursprünglich nur für den Einsatz in einem Local Area Network (LAN) vorgesehen waren. Darüber hinaus müssen die Netze eine stetig steigende Nutzung von Diensten wie Voice und Video over IP verkraften. Daraus resultieren Datenstaus und längere Antwortzeiten, die der Anwenderzufriedenheit nicht gerade förderlich sind und zudem die Geschäftsprozesse mit Kunden und Partnern erschweren.

Transparenz durch umfassendes Monitoring

Um die Leistungsfähigkeit der eigenen Applikationslandschaft möglichst transparent zu machen, empfiehlt sich daher eine umfassende Überwachung der Performance vom Server über das Netz bis zum Anwender mittels Application-Performance-Management. Auf diese Weise lässt sich die Gesamtleistung der ICT-Infrastruktur (Information and Communications Technologies) besser analysieren und optimieren, als es mit dem separaten Monitoring von Servern, Netzen und Applikationen möglich wäre.

Als ICT-Dienstleister realisiert beispielsweise T-Systems APM-Projekte mit Lösungskomponenten für Monitoring und WAN-Optimierung, die führende Hersteller entwickelt haben. Erst durch die Kombination dieser Monitoring- und Optimierungs-Engines lässt sich echtes Ende-zu-Ende-Monitoring - auch in optimierten Netzen - betreiben und die Performance-Schwachstelle identifizieren und beseitigen. Dabei erfolgt die Messung passiv über einen sogenannten Spiegelport aus dem Rechenzentrum heraus, sodass Unternehmen keine zusätzliche Hard- oder Software in den Außenstellen installieren müssen. Transparenz ist gewährleistet, da Unternehmen und APM-Dienstleister dieselbe Sicht auf die ICT-Infrastruktur haben und sich jederzeit auf "Augenhöhe" befinden. Die Kontrolle behält das Unternehmen.

Zu den immer wieder auftretenden Problemen bei der Übertragung von Applikationen über ein WAN gehören Bandbreitenengpässe, Paketverluste und erhöhte Laufzeiten (Latenzen). Als eine der Ursachen für die langsamen Antworten gilt das "geschwätzige" Transport-Protokoll (TCP). Will beispielsweise ein Anwender in einer Niederlassung über das WAN eine Bestellung im zentralen SAP-System aufgeben, kommt es zu einer Reihe von TCP-Anfragen und Rückmeldungen bezüglich Status, Authentifizierung etc. zwischen Server und Nutzer, bevor die eigentliche Bestell-Transaktion gestartet und auch nur ein Bit Inhalt gesendet wird. Ein zwischengeschalteter WAN Optimization Controller (WOC) kann hier Abhilfe schaffen, indem er quasi als lokale Instanz die TCP-Anfragen und Antworten zwischen Server und Nutzer reduziert und so steuert, dass sie größtenteils nicht mehr den Weg über das WAN nehmen müssen.

Redundanzen im Datenverkehr vermeiden

Ein Cache hilft, die Datenmengen zu verringern, die über ein WAN übertragen werden. Hierzu speichert er einmal übertragene Anfragen und Antworten. So wird verhindert, dass die gleiche Prozedur wiederholt wird. Darüber hinaus lassen sich durch diesen Cache auch Mehrfachübertragungen identischer Datenpakete vermeiden. Diese Funktion sorgt dafür, dass in Unternehmen häufig verschickte Daten wie etwa Layouts, Logos und Corporate Designs oder auch E-Mails mit identischen Anlagen nicht jedes Mal von neuem an viele Empfänger über das ganze WAN geschickt werden müssen, sondern aus dem Zwischenspeicher übertragen werden. Zusätzlich werden die noch verbliebenen, über das WAN zu übertragenden Daten ähnlich wie bei einer Zip-Funktion "on the fly" komprimiert.

Eine Optimierung der zu übertragenden Daten entlasten den Flaschenhals WAN.
Foto: T-Systems

Um das Netz möglichst leistungsfähig zu machen, müssen die Bandbreiten optimal zugewiesen und ausgenutzt werden. Der Einkauf zusätzlicher Bandbreiten kann so entfallen, wenn Voice und Video over IP im Netz eigene Kapazitäten mit einer festgelegten Qualitätsklasse im Rahmen der Quality of Service (QoS) bekommen. Zudem lässt sich durch das Monitoring bereits vorab feststellen, ob ein Qualitätsverlust droht, und dementsprechend eine höhere Dienstgüte zuweisen. Last, but not least müssen Voice und Video over IP im Netz Vorfahrt erhalten, sprich priorisiert übertragen werden.

Reserven ermitteln und aktivieren

Auf ähnliche Weise lässt sich auch zusätzlicher Schub für die Beschleunigung der Applikationen gewinnen. Hierfür müssen bestimmte Anwendungsprotokolle wie etwa CIFS, http, https, Video/RTSP oder MAPI schneller übertragen werden. Durch die Kombination aller dieser APM-Maßnahmen lassen sich Applikationen um das bis zu 50-fache beschleunigen.

Den Nutzen von APM dokumentieren Unternehmensprojekte aus unterschiedlichsten Branchen, so beispielsweise ein international agierender Handelskonzern, der die Anzahl seiner Standorte in den USA von drei auf neun verdreifachte. Die Außenstellen nutzen per Fernzugriff Systeme wie File-Server, Mail-Exchange, Citrix und Data Link Switching (eine Echtzeitanwendung) sowie Unified Communication & Collaboration (UCC), während das zentralisierte Rechenzentrum (RZ) aus Sicherheitsgründen weiter in der Nähe des Firmensitzes in Europa verbleibt. Um den gestiegenen Anforderungen gerecht zu werden, investierte das Unternehmen in die Bandbreite seines WAN. Dennoch traten erhebliche Performance-Probleme auf Applikationsebene auf.

Durch die Installierung von Monitoring- und Optimierungs-Engines ließ sich die Netzlast so weit senken, dass weder eine Erhöhung der Bandbreite noch ein zweites Rechenzentrum in den USA nötig wurden. Bei zusätzlichen Belastungen seiner Infrastruktur (etwa aufgrund weiterer Expansionsschritte) weist das gemanagte APM-System von sich aus darauf hin, wann die Leistungsfähigkeit des Netzes möglicherweise überschritten sein wird. Parallel dazu erhält das Unternehmen Informationen, wie die Infrastruktur erweitert werden muss, um die optimale Performance zu erhalten und unnötige Kosten zu vermeiden.

Auch bei einem Baukonzern erhöhten sich nach der globalen Ausweitung seiner Geschäfte die Anforderungen an die ICT-Ressourcen. Denn das neue Portfolio umfasst neben Bauprojekten auch ein umfassendes Facility-Management öffentlicher und privater Einrichtungen rund um den Globus. Daher wurden an den einzelnen Standorten neue Anwendungen benötigt, bei deren Einführung und Betrieb es jedoch immer wieder zu Performance-Problemen kam. Weder der Austausch von Servern, Leitungen und Routern noch die Verdopplung der Bandbreite konnten Abhilfe schaffen. Erst mit Hilfe von Application-Performance-Management gelang es schließlich, die Leistungsfähigkeit der ICT wiederherzustellen. Als Ursache für die Leistungseinbußen ermittelte das APM-Monitoring-Werkzeug Programmier- und Migrationsfehler innerhalb der Netzinfrastruktur, die sich ohne großen (Kosten-)Aufwand beheben ließen.

Transparente Gesamtsicht

Ein Performance-Monitoring erleichtert zudem die Fehlersuche.
Foto: T-Systems

Mit ICT-Monitor können sich die Verantwortlichen des Bauunternehmens nun jederzeit einen Überblick über die Qualität des Gesamtsystems verschaffen. Diese transparente Gesamtsicht erlaubt es ihnen, auch künftig die Infrastruktur schnell an Veränderungen der Geschäftsprozesse anzupassen. Sollte sich etwa durch das Überschreiten festgelegter Schwellenwerte ein Leistungsengpass ankündigen, informiert der User Helpdesk den Kunden umgehend. So lassen sich Performance-Einbußen bereits im Vorfeld vermeiden.

Weitere Zahlen aus Fallbeispielen verdeutlichen den Nutzen von APM: So verringerte ein Sportwagenhersteller seinen Zeitaufwand für Backups von mehreren Stunden auf zwölf Minuten. Gar den Aufbau eines kompletten Rechenzentrums konnte sich ein Logistikunternehmen sparen, da sich durch die Monitoring- und Optimierungs-Engines die über das WAN laufende Datenmenge um 60 Prozent reduzieren ließ. Gleichzeitig beschleunigte sich die Datenübertragung um das 15-fache. Somit entfiel für das Unternehmen die Notwendigkeit, ein RZ in Asien zu installieren.

Zuweilen bringt schon die Analyse Erstaunliches oder Kurioses hervor: Ein Industrieunternehmen hatte wegen schlechter SAP-Performance in zwei Außenstellen alle relevanten Leitungen und Router ausgetauscht und die Bandbreite verdoppelt - ohne Erfolg. Mittels seines Monitoring-Werkzeugs konnte T-Systems einen Migrationsfehler nachweisen: Die Außenstellen waren schlichtweg auf einem alten Server "vergessen" worden. In einem anderen Fall beklagte ein global operierendes Unternehmen eine schlechte VoIP-Performance. Durch die APM-Analyse stellte sich heraus, dass VoIP zusammen mit http in dieselbe Verkehrsklasse eingeordnet war, aber tatsächlich eine höhere QoS benötigte, da die Leitung häufig durch den Abruf von YouTube-Videos blockiert wurde.

So unterschiedlich die vorgefundenen Fehlerquellen in den Projekten waren: Nur durch die Gesamtsicht über Server, Netz, Nutzer- und Applikationsverhalten ließen sie sich ermitteln. Dies gilt im Übrigen auch für virtualisierte Umgebungen, in denen etwa die Ressourcen einer Server-Maschine auf mehrere virtuelle Clients verteilt werden. Auch die Datenströme mobiler Clients wie Laptops lassen sich mit einer APM-Lösung optimieren.

Hoher Wertbeitrag und Return on Investment

APM ermöglicht eine gezielte Ursachenforschung, die verhindert, dass IT-Abteilung, Nutzer und externe Netz-Provider den Fehler beim jeweils anderen vermuten. Es sorgt für eine aktive Systemüberwachung und erlaubt die frühzeitige Anpassung an kommende Geschäftsprozessanforderungen. Last, but not least liefert APM einen hohen Wertbetrag: Die Analysten von Forrester Research betrachteten den Einsatz von APM-Tools in einem globalen Fertigungsunternehmen der Elektronikbranche drei Jahre lang und ermittelten einen Return on Investment von 266 Prozent, wobei der Breakeven bereits nach drei Monaten erreicht war.