Performance-Schwächen vermeiden

So beugen Sie Ausfällen in der Kommunikationsinfrastruktur vor

19.02.2015 von Michael Halbwirth
Komplexe Systeme wie Unified Communications machen die Fehlersuche zum Glücksspiel. Ein wirksames Performance-Management-Tool sorgt für eine bessere Sichtbarkeit von Schwachstellen und hilft, durch eine Optimierung der Systeme Ausfälle proaktiv zu vermeiden.
Fehler in der Kommunikationsinfrastruktur machen sich schnell bemerkt.
Foto: Photosebia - Fotolia.com

Ein Fehler in der Telefonanlage? Die Videokonferenz bricht ab? Eine fieberhafte Suche beginnt. Wenn ein Unternehmen nicht oder in schlechter Audio- oder Bildqualität erreichbar ist, dann hinterlässt das Spuren. Gerade in der Kommunikationsinfrastruktur werden Fehler oder Ausfälle sehr schnell spürbar. Ist eine Nummer nicht erreichbar oder stimmt die Tonqualität nicht, merkt der Kunde das sofort. Und im schlimmsten Falle verbreitet er seinen Unmut über viele Kanäle oder wechselt gar zur Konkurrenz.

Es ist also absolut geschäftskritisch, schnell auf Ausfälle oder Qualitätsprobleme zu reagieren - möglichst, bevor sie merkbar werden. Das macht die Sache langwierig und kostspielig. Doch sie sind auch nicht einfach zu beheben: Oft weiß die IT-Abteilung nicht einmal, wo sie anfangen soll. Bei Unified Communications poppt zwar der Fehler hoch und ein Ticket wird eröffnet, die Ursache kann jedoch ganz woanders liegen - im Netzwerk-Umfeld, im Desktop-Bereich oder in den Sicherheits-Features. Irgendwo in der komplexen Architektur mit ihrer Vielzahl von Komponenten, die vom Front-end bis in die Backup-Infrastruktur reichen steckt der Fehler. Eine grundlegende Analyse oder gar System-Optimierung wird meist hintenan gestellt, jetzt gilt es erst einmal den Fehler zu beheben. Und dabei schieben sich die Spezialisten gegenseitig die Verantwortung zu.

Das hat seinen Grund: Troubleshooting und Performance Überwachung sind ungeliebte Aufgaben, denn es gilt, Architekturen mit hoher Komplexität zu verwalten - und das in vielen Unternehmen nicht über ein einheitliches Tool, sondern über eine Kombination aus unterschiedlichen Management-Features in Einzelsystemen. Viele Kommunikationskanäle und -systeme laufen in einer Infrastruktur zusammen - und die ist weitgehend virtualisiert, mit anderen Geschäftsprozessen integriert und kommt von verschiedenen Herstellern.

Ein UC-Manager jongliert mit H.323 und SIP Handsets, Softphones, Call Recording und Contact-Center-Applikationen, verhandelt mit Cisco, Avaya, Microsoft, Acme Packet & Co. Dazu kommen Varianten von PBX, Voice Gateway, UC Servern, Session Border Controllern (SBCs) und Video-Raumsystemen oder auch die unterschiedlichsten Signalisierungs- und Sprachprotokolle, Codecs und Verschlüsselungen. Erschwert wird das UC-Management noch weiter: Video und mobile Geräte generieren viele, teilweise auch große Daten, die ihrem Lebenszyklus entsprechend gespeichert werden müssen - on-site oder in der Cloud.

Was UC wirklich braucht

Eine gut funktionierende Unified Communication & Collaboration Architektur ist ohne eine stabile Infrastruktur nicht denkbar. Informationen über Mobility- und Collaboration-Features, Instant Messaging, Voice- und Video-Conferencing laufen in einer leistungsstarken Plattform - im Unternehmen oder bei einem Dienstleister ausgelagert - zusammen, unabhängig davon, welches Endgerät eingesetzt wird.

Viele UC-Anwendungen kranken jedoch daran, dass die Konfiguration der Applikationen nicht sauber aufgesetzt ist, die Anwendungen miteinander um Netzwerk-Ressourcen konkurrieren oder gar das Netzwerk-Design nicht auf UC ausgelegt ist. Dem auf die Spur zu kommen ist nicht einfach. Diese Komplexität wird weiter verschärft, denn die Komponenten kommen von unterschiedlichen Herstellern, die oftmals versuchen, ihre eigenen Standards zu etablieren. Will man nun eine durchgängige Performance garantieren, so müssen die Fachleute weit über den eigentlichen Call hinaus schauen. Sie müssen Probleme innerhalb oder außerhalb des Netzwerkes lokalisieren und gegebenenfalls einzelnen Komponenten oder Knoten zuordnen. Erst dann macht es Sinn, den Carrier oder den Anwender anzusprechen. End-to end-Sichtbarkeit erlaubt es, schnell die geeigneten Schritte einzuleiten und die richtigen Instanzen ins Boot zu holen. Die Problemlösung kann dann oftmals in Minutenschnelle umgesetzt werden, statt sich über Tage hinzuziehen.

Umfassende Performance-Analyse in Echtzeit

Händisch nach Fehlern zu suchen, ist umständlich.
Foto: Savando

Eine übergreifende Lösung zur Performance-Optimierung reduziert die Komplexität in einem Umfeld mit vielen Herstellern. Sie verwaltet die UC-Umgebung proaktiv und ermöglicht ein leistungsstarkes Risk Management, das Business Continuity und schnelles Disaster Recovery gewährleistet. Kurz, sie sorgt dafür, dass Service Levels eingehalten und Kapazität sowie Fail-over besser planbar werden. In Echtzeit wird sichtbar, ob die Systemleistung ausreicht, Server durch zu viele Anfragen überlastet sind oder ob die Kommunikationswege zu viel Traffic bewältigen müssen. Die Beobachtung von Nutzung, Performance, Fehlern und Kapazität zeigt Muster auf, die Einfluss auf den Geschäftserfolg haben können - egal ob bei Speichersystemen, Memory, Front-end oder Back-end Servern und Applikationen.

Die Erkennung dieser Muster basiert auf einem Behavior Analytics-System: Es analysiert das Verhalten von Menschen oder Geräten. Größere Abweichungen von der Norm lösen einen Alarm oder eine regelbasierte Aktion und es wird eine Handlungsempfehlung für eine schnelle Problemlösung gegeben. Eine rückwirkende Problemanalyse bringt Schwachstellen zu Tage, die sich auch auf zukünftige Leistung auswirken könnten. Diese Kombination von rückwirkendem und Echtzeit-Gesundheits-Check für UC-Systeme macht Performance Optimierung einfacher und effizienter. Aber auch Predictive Analytics funktioniert nur dann, wenn eine Gesamtschau auf einen End-to-end Prozess gegeben wird - herstellerübergreifend und tiefschürfend.

End-to-end ist entscheidend

Überwacht werden neben der PBX-Leistung auch jene von Messaging-Produkten der wichtigsten Anbieter (Cisco, Avaya, Microsoft & Co.). Ein Performance-Management-System misst Status, Aktivität, Leistung und Robustheit von Session Border Controllers (SBC) und UC-Diensten wie Instant Messaging, Presence und Application Sharing. Wichtig ist auch die End-to-end Voice-Qualität eines Calls im Netzwerk und innerhalb der operativen Einheitenoder die konstante Leistung von Telepresence und Video Conferencing. Das System stellt sicher, dass das Call Recording funktioniert und - für höhere rechtliche Sicherheit - Anrufe wirklich sicher aufgezeichnet werden. ein individualisierbares Regelsystem stellt dabei die Einhaltung von Datenschutzrichtlinien sicher. Absolut entscheidend aber ist es, den Blick über die reine UC-Infrastruktur hinaus auf die Server Infrastruktur mit allen Virtualisierungslayern und das Netzwerk mit seinen Komponenten zu lenken. Erst die Messung dieser gesamten Architektur zeigt Engpässe auf und erleichtert die Fehlerbehebung.

Voraussetzung ist eine Übersetzungsleistung: die kryptische Machine-to-Machine-Kommunikation verschiedener UC Endpunkte, Geräte und Technologien braucht eine intelligente, leicht verständliche Darstellung: ein Blick auf den Bildschirm und es muss klar sein, worum man sich kümmern muss. Alle wichtigen Geräte, alle zentralisierten oder autonomen Kontrollpunkte sind mit ihrem Status in einer Maske dargestellt. Dank dieser Ursachenforschung können sich Administratoren an der richtigen Stelle tief hineinbohren in den Netzwerkpfad eines Anrufs - Prioritäten und Maßnahmen sind einfach erkennbar.

Auf die Details kommt es an

Die unterschiedlichsten UC-Systeme in einem einzigen Performance-Management-System sichtbar zu machen und darüber hinaus Einblick in das IT Netzwerk mit seinen Switches, Routern und Gateways zu bieten ist nicht einfach. Dafür braucht man - trotz Automatisierung von Interventionen und Standard-Aufgaben - Fachleute und Prozesse in Support-Level 1, 2 und sogar 3. Vor allem aber braucht es eine Performance-Management-Lösung mit einem einzigen Dashboard für die operative und Service-orientierte Perspektive. Sie muss einige Voraussetzungen erfüllen: Wird ein Verbindungspfad oder eine Netzwerk-Topologie nicht in Echtzeit visualisiert, dann steigt der Aufwand erheblich. Beinahe ebenso wichtig ist ein flexibles Reporting etwa zu Analytics, Kapazitätsplanung, SLA-Verwaltung und Voice-Qualität. Ohne diese profunden Berichte ist ein Soll/Ist-Abgleich kaum möglich. Erst ein automatischer Alert garantiert eine schnelle Fehlerentdeckung und sogar ein proaktives Eingreifen. Verknüpft man die Warnung mit der Fehleranalyse so müssen sich die Engineering Teams kaum noch mit False Positives plagen. Sie werden zudem noch unterstützt durch eine regelbasierende Antwort: automatisierte Aktionen machen einen Teil ihrer Arbeit überflüssig.

Wann also lohnt ein Performance Management System für UC? Hier spielen viele Faktoren zusammen: je komplexer die Infrastruktur wird, desto anfälliger ist sie auch und desto mehr lohnt sich vereinfachtes Management. Dies gilt umso mehr, je abhängiger ein Unternehmen von der Leistungsfähigkeit seiner Kommunikationssysteme ist - sei es im Umsatz oder aufgrund seines Geschäftsmodells. Und: Je sichtbarer ein Unternehmen, desto anfälliger auch die Marke - insofern ist Performance Management auch ein Teil des Brand Management. (mb)