Client-Monitoring

Wie man Anwenderzufriedenheit messbar macht

20.01.2014
Von Peter Schweizer
Die Server-Kollegen signalisieren Grün. Die Netzwerker melden: Keine Störung. Aber der Anwender auf der anderen Seite der Weltkugel sieht Rot. Diese Erfahrung machte auch der Automatisierungstechnik-Spezialist Festo.

Die IT Abteilung agiert nach der Maxime agiert: Ein Handwerker ist immer nur so gut wie sein Werkzeug. Ihre Services für die internationalen Anwender stellt die Festo-IT zentral aus Esslingen-Berkheim bereit. Von hier wird ein Netz betrieben, das auch 10.000 Kilometer entfernte Standorte in China oder einschließt. Mit Standard-Tools aus dem Baumarkt kommt man da nicht weit.

Warum neue Wege notwendig waren

Zeitverschiebung und Sprachenvielfalt machen auch bei Festo den IT-Support nicht einfacher. Erschwerend hinzu kommen kulturelle Unterschiede. Der deutsche Anwender im Büro nebenan gibt dem Support sehr schnell und direkt Feedback. Aber das keineswegs die Norm. "Die Hemmschwelle für eine Beschwerde liegt in anderen Kulturen deutlich höher", erklärt Matthias Schmidt, Leiter Information Management Workplace Services bei Festo.

Sensibel am Frontend: Der adaptive Greifer DHDG von Festo kann Blumenzwiebeln nach Größe und Qualität sortieren.
Sensibel am Frontend: Der adaptive Greifer DHDG von Festo kann Blumenzwiebeln nach Größe und Qualität sortieren.
Foto: Festo

Worauf das Projekt abzielte

Wie die Verantwortlichen der Festo-IT immer wieder erfahren mussten, waren im Rechenzentrum und Netzbereich alle Services gemäß Service-Level-Agreements verfügbar, doch die Anwender klagten trotzdem mehr oder weniger offen über Performance, geringe Bandbreiten oder Fehlverhalten der Clients. "Auch wenn ein Service vollständig verfügbar ist, heißt dies noch lange nicht, dass er optimal abgerufen werden kann", umreißt Helmut Claß, Leiter User Services bei Festo, das grundlegende Problem.

Während im Backend der Zustand der Systeme quasi lückenlos feststellbar ist, erweist sich ein umfassender Gesundheitscheck der Client-Landschaft als umständlich bis unmöglich. Diverse Tools liefern vielfältige Informationen darüber, mit welcher Hard- und Software ein Arbeitsplatz ausgestattet ist. Doch hinsichtlich Verhalten, Performance und Stabilität ist der Client der große Unbekannte.

Es galt also, neue Verfahren und Lösungen zu entwickeln, um Performance-Probleme und Verhaltensauffälligkeiten in der Client-Landschaft frühzeitig - und unabhängig vom Anwender - gemeldet zu bekommen, idealerweise bevor der Nutzer die Probleme überhaupt bemerkt.

Welche Ansätze nicht funktionieren

Sicher kann man manuell Informationen aus diversen Log- und Konfigurations-Files sammeln oder ganz klassisch die Anwender befragen. Aber das ist umständlich und zeitaufwändig - insbesondere dann, wenn die Störung nicht dauerhaft auftritt; der Anwender spricht dann beispielsweise allgemein von "Performance- Problemen", häufigen Verbindungsabbrüchen oder Blue-Screens. "Die Informationen, die nötig wären, um das Problem nachzuvollziehen oder nachzustellen, sind häufig unzureichend", weiß Alexander Mack, Mitglied des Projektteams bei Festo: "Eine Ursachenforschung ist damit fast unmöglich."

Dann kann man auch ein Data Warehouse aufbauen, das bei einer übergreifenden Analyse der Informationen aus unterschiedlicher Systeme wie Netzwerk-Monitoring, Virenscanner und Software-Management hilft. Doch diese Idee erwies sich als zu komplex und aufwändig.

Eine Programmierung von Robotern für die automatisierte Standardprüfungen am Client kam ebenfalls nicht in Betracht. Für Routine-Tests muss es zumindest eine Vermutung geben, worin die Ursache eines Problems liegen könnte. "Ein Perspektivenwechsel war notwendig", erinnert sich Projektspezialist Mack. Für eine einfache Fehleranalyse wäre es sinnvoll, die Client- und Netzwerkverfügbarkeit aus der Sicht des Anwenders zu betrachte. Man bräuchte also eine Lösung, die fortlaufend Informationen über Aktivitäten am Client abgreift und auf Unregelmäßigkeiten analysiert - "analog zu den Monitoring-Lösungen im Server-Bereich".

Woher Unterstützung kam

Eine Lösung suchten die IT-ler von Festo gemeinsam mit dem Beratungshaus Consulting4IT aus Waldbronn, das als Spezialist für Client-Automation schon seit Jahren bei Festo bekannt war. Consulting4IT brachte die Client-Monitoring Lösung des Schweizer Softwareanbieters Nexthink ins Spiel: Die Monitoring-Lösung sammelt kontinuierlich detaillierte Daten zu den Aktivitäten am Client. Der Kollektor analysiert die IT-Services aus der Anwenderperspektive, erkennt Verbindungen und Ziele, überwacht live alle wesentlichen Ereignisse. Dazu gehören Ressourcenverbrauch, Crashes, Bandbreiten und Fehler.

"Wir waren skeptisch", räumt der Workplace-Manager Schmidt ein: "Wir wussten nach intensiven eigenen Recherchen, dass das Thema Client Monitoring im Allgemeinen noch in den Kinderschuhen steckt. Zudem war Nexthink im Speziellen - zumindest im deutschen Markt - noch weitestgehend unbekannt ." Den Ausschlag gab offenbar Nexthink-Partner Consulting4IT: "Ohne einen Ansprechpartner in greifbarer Nähe hätten wir weiteren Schritten nicht zugestimmt."

Wie das Projekt verlief

Im Januar 2013 stellte Cons7ulting4IT die Lösung vor. Festo entschied sich, ihre Leistungsfähigkeit punktuell zu prüfen - aufgrund drängender Aufgaben in China. Das Projekt wurde im März desselben Jahres angegangen. Innerhalb von zwei Tagen ließ sich die vorinstallierte Appliance so implementieren, dass sie 3.500 Rechner in den asiatischen Festo-Gesellschaften fortlaufend analysierte.

Nachdem der Kollektor, ein kleiner passiver Treiber mit 500 KB Speicherbedarf, über die Softwareverteilung ausgebracht worden war, sammelte er vier Wochen lang Daten für die Testphase. Um Ursachenforschung zu betreiben, wurden Schwellenwerte definiert, bei deren Überschreitung das System proaktiv Alarm schlug.

Nach Ablauf der vier Wochen präsentierte die als Systemintegrator am Projekt beteiligte Consulting4IT die ermittelten Daten - mit ein paar Überraschungen vor allem auf Seiten der Local Area Networks: Zum einen war die Anzahl der aktiven Geräte pro WLAN-Access-Point höher als erwartet - teilweise hingen bis zu 20 Arbeitsplätze an einem Knotenpunkt. Zum anderen stellten die Anwender häufig fachspezifische Anforderungen, für die das jeweilige Gerät ursprünglich gar nicht ausgelegt war.

In Summe war die Infrastruktur vor Ort nicht überall ausreichend dimensioniert. Die Engpässe waren nach der Analyse eindeutig belegbar. Aufgrund dieser Ergebnisse entschied Festo, die Lizenzkosten zu investieren, um jederzeit Adhoc-Analysen in Echtzeit, aber auch umfassende Auswertungen über längere Zeiträume vornehmen zu können.

Wo es kritisch wurde

Doch diese Transparenz am Client sorgte nicht überall für eitel Freude: Sie legt die Vermutung nahe, dass auch über das Anwenderverhalten Informationen gesammelt und ausgewertet werden könnten. "Die Tragweite dessen war uns bewusst", berichtet Schmidt, "deshalb wurden der Betriebsrat und der Datenschutzbeauftragte wurden sehr früh in alle Diskussionen eingebunden."

Um die Privatsphäre des Anwenders zu schützen, erlaubt Nexthink eine umfassende Anonymisierung der Daten. Ein schlagendes Argument gegenüber Skeptikern war aber auch, dass nicht nur die Ergonomie eines Arbeitsplatzes wichtig ist, sondern auch die Performance der Arbeitsgeräte. Und es besteht die Gefahr, dass unbefriedigende Ergebnisse eventuell nicht der Technik, sondern der Leistung des Mitarbeiters zugeschrieben werden.

Die nächsten Schritte

Nach den asiatischen Standorten wird Nexthink nun auch auf etwa 11.500 Clients in Europa und Amerika ausgerollt. Die Tests dienten dazu, viele konkrete Fragen zu beantworten. Heute werden die neuen Verfahren überwiegend im Rahmen der betrieblichen Problem-Management-Prozesse eingesetzt.

Im nächsten Schritt sollen First- und Second-Level-Support im Fokus stehen. Die Support-Mitarbeiter an der Hotline lassen sich mit Hilfe der Echtzeitanalyse in die Lage versetzen, Störungen schneller zu beheben, also die Bearbeitungszeit zu verringern. Wenn der Mitarbeiter den Zeitpunkt eines Fehlers kennt und alle zeitgleichen Events in dessen Umfeld abrufen kann, wird er mit großer Wahrscheinlichkeit die Ursache schnell identifizieren können.

Langfristig soll das Client-Monitoring auch im Security-Management zum Einsatz kommen. "Ich muss - im Gegensatz zu klassischen Security Lösungen - den Fußabdruck des Angreifers nicht mehr kennen, um diesen zu identifizieren", führt Schmidt aus: "Ein verdächtiges Verhalten, etwa der Upload von großen Datenmengen in Kombination mit dem Aufruf einer unbekannten EXE, reicht bereits aus für einen Alarm." (qua)