Ratgeber Server-Monitoring

Tools zur Server-Überwachung

30.11.2010 von Johann Baumeister
Lesen Sie in unserem Ratgeber, welche Server-Monitoring-Tools sich in der Praxis bewährt haben.

Zur Überwachung der Server bietet der Markt eine ganze Armada an Werkzeugen an. Sie reichen vom einfachen Monitoring-Tool für einen einzelnen Server bis hin zu umfassenden Systemwerkzeugen, die ein End-To-End-Monitoring der Prozesskette übernehmen. Die Zielsetzung des Monitoring liegt darin, durch die laufende Überwachung frühzeitig über Ausfälle oder Engpässe der Server unterrichtet zu werden. Da zeigt sich allerdings bereits das Dilemma. Was ist ein Engpass? Und wann ist ein Ausfall kritisch? Es ist offensichtlich, dass Ausfälle und Engpässe zu den Geschäftszeiten völlig anders behandelt werden müssen, als beispielweise nachts oder zu betriebsfreien Zeiten. Entscheidend sind auch der Grad der Verzögerung und die Dauer eines Ausfalls. Das bedeutet, dass jegliche Engpässe immer mit Rücksicht auf die Benutzer, die Zeit, die geschäftliche Relevanz, den Grad der Verzögerung, usw. gewertet werden müssen.

Große Funktionsunterschiede und Einsatzbereiche

Die Unterschiede bei den Überwachungstools sind groß. Manche der Tools übernehmen lediglich ein passives Monitoring mit der Alarmierung der Administratoren. Umfassendere Werkzeuge wiederum ermöglichen auch aktive Eingriffe oder Optimierungen. Um die Tools an die eigenen Anforderungen anpassen zu können, sollten Sie daher eine Vielzahl an Stellschrauben besitzen.
Die Überwachung der Geräte passiert meist durch spezielle Agenten (Monitore) auf den Servern. Diese können aktiv oder passiv sein. Diese Unterscheidung bezieht sich darauf, ob die Überwachung aus der Sicht der Verwaltungskonsole aktiv (wie etwa durch Polling) oder passiv (durch Überwachungscode auf dem jeweiligen Gerät) ausgeführt wird. Aktive Monitore verwenden in der Regel feste Intervalle. Sie fragen die überwachten Geräte in regelmäßigen Abständen ab. Bei relativ wenigen Systemen ist die aktive Überwachung leicht realisierbar. Wenn es sich aber um tausende an Endpunkten handelt, so wird allein die periodische Abfrage (das Pollen) zu einem Grundrauschen auf dem Netzwerk führen.

Wege zum effizienten Data Center
Bestandsaufnahme mit Asset-Management
Schritt 1: Die RZ-Betreiber müssen alle Geräte und Systeme, Hard- wie Software lückenlos erfassen und dokumentieren.
Outsourcing prüfen
Schritt 2: Als Alternative zum Eigenbetrieb sollte auch ein Komplett- oder Teil-Outsourcing in Betracht gezogen werden.
Standardisierung als Ziel
Schritt 3: RZ-Betreiber sollten auf eine standardisierte IT-Landschaft mit einheitlichen Lizenzen und einheitlichen Versionen hinarbeiten.
Kosten im Blick behalten
Schritt 4: Grundsätzlich sollten die Einkäufer darauf achten, möglichst schlank dimensionierte und verbrauchsarme Geräte einzukaufen.
Bessere Auslastung mit Virtualisierung
Schritt 5: Um Hardware zu optimieren, muss man sie reduzieren. Das funktioniert mit mehreren virtuellen Servern auf einem physikalischen Gerät.
Das passende Kühlkonzept
Schritt 6: Durch eine effizientere Auslastung der Rechner, lässt sich die Menge aller Stromabnehmer deutlich reduzieren.
Stromverbrauch planen
Schritt 7: RZ-Betreiber müssen die Richtwerte für den Stromverbrauch pro Quadratmeter RZ-Fläche realistisch planen.
Die richtige Dimension
Schritt 8: Ein Raumkonzept hilft, die vorhandenen Räumlichkeiten, Klimatisierung sowie Systeme und Geräte aufeinander abzustimmen.
Monitoring
Schritt 9: Ein umfassendes Monitoring sollte den Rechner-Pool, Stromversorgung, Kühlsysteme und die USV-Anlagen beinhalten.

WhatsUp von IPswitch

WhatsUp umfasst eine Vielzahl an Konfigurationseinstellungen zur Überwachung der Server.

WhatsUp von Ipswitch ist ein Klassiker unter den Überwachungstools. Das Werkzeug liegt bereits in der Version 14.2. vor. Die Architektur von Whatsup basiert auf einem zentraler Management-Server. Dieser erhält von den zu überwachenden Geräten die Messwerte und hinterlegt diese in einer angeschlossenen Datenbank. Das Einsammeln der Messwerte passiert durch WMI, Polling, SNMP sowie dem Auslesen der Syslog oder des Windows Event Monitors. Daneben existiert die Möglichkeit via VBScript oder Java Script Werte von gänzlich fremden Stellen wie z.B. TK-Anlagen oder Support-Ticket-Datenbanken abzuholen.

Überwachung von virtuellen Servern

Auch VMware-Server und deren virtuelle Maschinen lassen sich mit WhatsUp überwachen.

Das Verwaltungsinterface von WhatsUp ist modern und erlaubt dem Administrator eine vollständig webbasierte Arbeit mit dem Monitoring-Tool. Durch frei konfigurierbare Arbeitsbereiche (Work Spaces) mit mehr als 150 anpassbaren Berichten lassen sich individuelle Arbeitsumgebungen schaffen. Diese liefern Informationen über alle wichtigen Zustände der Systeme. Eingeschlossen sind auch die Statuswerte der CPUs, Arbeitsspeicher, Netzwerke und einer Vielzahl an Applikationsdiensten. Ferner lassen sich auch SLA-Vereinbarungen damit überwachen und prüfen.

Die aktuelle Version bezieht nun auch virtuelle Systeme von VMware in diese Überwachung ein. Dazu steht ein spezielles PlugIn zur Verfügung. Dieses greift durch das VMware API direkt auf die VMware-Server „ESX“ und „ESXi“ zu und liest die Information über die virtuellen Maschinen aus. Über das VMware-API sind dann auch die grundlegende Verwaltungsfunktionen wie etwa eine „PowerOn“ „PowerOff“, „Suspend“, „Shutdown-Guest”, “Reset-Guest” und Take-Snapshot aus der WhatsUp Konsole ausführbar.

Zum Umfang von WhatsUp gehört auch die Definition von Abhängigkeiten zwischen den Geräten. So kann zum Beispiel festgelegt werden, dass ein bestimmter Dienst andere Serversysteme zu seiner korrekten Arbeit benötigt. Elementar sind hierbei natürlich alle Netzwerkkomponenten, denn wenn ein Router oder Switch ausfällt, sind alle daran angeschlossenen Server nicht mehr verfügbar. Diese Anhängigkeiten lassen sich mit dem Tool abbilden.

Monitore überwachen die Server

Zur Überwachung der Server setzt WhatsUp auf Monitore. Dabei unterscheidet das Werkzeug nach aktiven und passiven Monitoren. Zu den aktiven Monitoren gehören unter anderem der ICMP Ping, http, DNS, POP3, Radius oder NT-Dienste. Die Überwachungsmonitore sind auch via SSL-Schnittstellen anzubinden.

Die Server lassen sich nach Bedarf aus der WhatsUp-Konsole Starten oder Stoppen.

Die aktiven Monitore genügen in vielen Fällen, um den Zustand des Gerätes abzufragen - sicher aber nicht in allen. Insbesondere all jene Ereignisse, die mehr den Charakter einer Warnung haben, lassen sich damit nicht eindeutig kennzeichnen. Häufig wird dabei auch ein Eintrag in einer Logdatei vorgenommen oder es wird ein SNMP-Trap ausgelöst. Diese Ereignisse werden nun von den passiven Monitoren überwacht. Dabei handelt es sich um Code, der auf dem Zielgerät just diese Ereignisse filtert und dann die Whatsup-Zentrale informiert. Im Gegensatz zu den aktiven Monitoren wartet Whatsup beim passiven Modus auf Meldungen vom überwachten System, anstatt aktiv zu pollen. Im Falle von Windows werden beispielsweise die Start- und Stoppvorgänge in den Windows Syslogs protokolliert und sind damit für Whatsup zugänglich.

Solarwinds Ipmonitor

Ipmonitor von Solarwinds ist ein Werkzeug zur Überwachung von Servern und weiteren Netzwerkressourcen. Die Wurzeln des Toolsets liegen in der Überwachung jeglicher IP-Geräte. Mittlerweile hat der Hersteller Solarwinds das Tool aber erheblich erweitert. Nunmehr können auch komplexere IT-Systeme und Applikationen in die Überwachung einbezogen werden.

Grafische Schaubilder und ein Dashboard sorgen für einen schnellen Überblick

Zur Überwachung der Geräte werden Monitore eingesetzt. Hierbei liefert das Toolset eine breite Palette an unterschiedlichen Möglichkeiten. Dazu gehören Active Directory-, Radius- und LDAP-Abfragen, DNS, FTP, NTP, NNTP, DUP, Eventlog-Abfragen, IMAP, Ping und viele weitere Varianten. Die Zustände der Geräte visualisiert der Ipmonitor in unterschiedlichen Farben. Hierbei unterscheidet das Werkzeug nach den Zuständen: Up and running (in Ordnung), Warning, Down (Gerät nicht aktiv), Lost (für einen fehlerhaften Zustand), Suspended/Maintenance (Wartung) und Uninitialized.
Ein zentrales Dashboard hilft, alle Ergebnisse schnell im Blick zu haben. Hier findet man sich diverse graphische Diagramme, die die Auslastung der überwachten Systeme kurz und übersichtlich präsentieren. Bei Bedarf lässt sich das Dashboard an die eigenen Anforderungen anpassen.

Agenten sind nicht notwendig

Assistenten helfen bei der Konfiguration des IP-Monitors. Im Beispiel das Einrichten der Benachrichtigung für den Administrator.

Das Setup des Monitoring-Tools ist schnell und einfach vorgenommen. Das Überwachungstool kann von der Website des Herstellers als begrenzte Demoversion frei geladen werden. Im Gegensatz zu vielen vergleichbaren Produkten verlangt das Monitoring-Tool allerdings keine vorausgehende Installation von Agenten auf den überwachten Systemen. Der Verzicht auf Agenten beruht darauf, dass Ipmonitor ausschließlich über SNMP, WMI und RPC operiert. Neben IPMonitor hat der Hersteller aber auch eine Vielzahl an weiteren Überwachungstools. Die Website gibt hierzu Auskunft.

Bei der Installation werden eine Datenbank zur Ablage der Statuswerte und ein Webserver automatisch mit eingerichtet. Beim ersten Start fragt das Tool einige weitere Konfigurationsangaben, wie etwa die Berechtigungen für den Benutzer oder auch die Portangaben für die Kommunikation der Administrationskonsole mit dem Webserver von Ipmonitor ab. Das Setup ist schnell. Dabei werden bereits die wichtigsten Überwachungsmonitore für den Plattenplatz des Laufwerk C: und die Auslastungen der CPU und des Speichers eingerichtet. Anschließend muss die Webkonsole gestartet werden.

Die Verwaltungskonsole benötigt lediglich einen Browser, wie etwa den Internet Explorer, Firefox oder Opera. Als weitere Systemvoraussetzungen verlangt der Hersteller beim Einsatz von bis zu 500 überwachten Elementen eine Single Core CPU mit 2 GHz und 240 MB Festplattenplatz. Das Tool kann somit auch auf etwas betagteren Rechnern mit Windows XP eingesetzt werden, kommt aber auch mit den neueren Betriebssystemen zurecht. Assistenten unterstützen bei der Konfiguration und der Untersuchung des Netzwerks. Die Suche nach Geräten kann unter anderem nach IP Range, DNS Zone und Network Neighborhood erfolgen
Ipmonitor liefert ein umfangreiches Toolset zur Überwachung der Geräte, Aufgrund der Einfachheit in der Inbetriebnahme und vielen Vorteilstellungen eignet es sich besonders für mittlere Umgebungen.

Paessler PRTG

Das Nürnberger Unternehmen Paessler bietet mehrere Tools zur Überwachung von Servern und Netzwerk. Der PRTG Router Traffic Grapher (PRTG) und IPcheck. Zusammen kümmern sich diese Tools um die Verfügbarkeiten von Netzwerk und der Servern.

Die überwachten Geräte mitsamt ihren Ergebnissen werden in einem Dashboard dargestellt.

Die Überwachung der Server passiert mittels Sensoren. Hierzu hat der Hersteller dem Tool mehr als 50 Sensoren mitgegeben. Diese überstreichen die unterschiedlichsten Protokolle und Anwendungen wie etwa Ping, http, SMTP, Pop3, FTP. Beim Auftreten von Fehlern oder Engpässen erfolgt eine Alarmierung. Eingesammelt werden die Daten entweder per SNMP, Packet Sniffing oder Netflow. SNMP benötigt die zugehörigen Agenten auf den überwachten Geräten. Beim Packet Sniffing werden die Datenpakete mitgeschnitten und ausgewertet. Die dritte Methode Netflow gilt für den Einsatz in Verbindung mit Cisco Routern. Hierbei senden die Router, ähnlich wie bei SNMP, Statistikinformationen zum Überwachungssystem.

Zur den überwachten Parametern gehört auch die Auslastung der System. Damit lassen sich Engpässe besser erkennen.

Als Auswerte und Anzeigeoptionen stellt das Tool mehrere unterschiedliche Grafiken bereit. Eine Vielzahl von Optionen erlaubt die Adaption der Anzeigen an die eigenen Bedürfnisse. Angepasst werden kann beispielsweise die Zeitspanne der Anzeigen, sie reicht von fünf Minuten bis zu 365 Tagen. Eingeschlossen sind ferner spezielle Auswertungen wie etwa die Benutzer mit dem höchsten Anteil an Ressourcenverbrauch.

Verwaltung über Windows-GUI oder auch iPhone-App

Durch iPhone-Apps lassen sich die Server auch aus der Ferne sehr einfach überwachen.

Paesller liefert drei unterschiedliche Verwaltungskonsolen mit Windows-GUI und Web-Interface sowie eine iPhone-App. Das Einrichten des Systems und der Sensoren wird durch Assistenten unterstützt. Zu den weiteren Parametern, die zum Einrichtung eines Sensors gehören, zählt die Zuordnung des Sensors zu einem der Geräte oder Server und schließlich die Bestimmung des Prüfintervalls. In Abhängigkeit vom gewählten Intervall beziehungsweise den ankommenden Datenpaketen überwacht das Monitoring-Werkzeug den Datenverkehr. Hinterlegt werden die gesammelten Daten in einer internen Datenbank. Von dort können sie neben der integrierten Anzeige auch als CSV-Datei exportiert werden.

Das Werkzeug ist schnell installiert und liefert zuverlässig die Angaben zum Netzwerktraffic und seinen Verursachern. Es eignet sich damit zur Überwachung der Kommunikationskanäle und Netzwerkstrecken. Eine Zusammenarbeit mit Managementkonsolen wie sie etwa von IBM Tivoli oder HP OpenView ist möglich.

Open Source Tool Nagios

Das Überwachungssystem Nagios kommt aus der Open Source Bewegung und hat sich bei vielen Administratoren, insbesondere im Linux-Umfeld, einen Namen gemacht.

Die Architektur von Nagios ist sehr modular. Auf der Grundlage eines Basis-Frameworks werden die weiteren Überwachungsmodule als Plugins eingeklinkt. Diese sind in der Lage Netzwerk-Geräte und Protokolle, wie etwa SMTP, POP3, http oder NNTP zu überwachen. Die Statusmeldungen der überwachten Geräte werden dann an den Nagios-Server zur Analyse zurückgereicht. Nagios ist in der Lage alle II-Infrastrukturbaugruppen wie etwa Applikationen, Services, Betriebssysteme, Netzwerkprotokolle, Leitungsdaten und Netzwerkbaugruppen zu überwachen.
Bei Bedarf können die Unternehmen aber auch eigene PlugIns zur Überwachung aufbauen.

Mittels diverser Analysemethoden scannt das Monitoring-Tool permanent die zu überwachenden Geräte. Die Methoden dazu, dessen Intervalle und die Reaktionen bei Statusänderung der Geräte sind konfigurierbar. Die gesammelten Daten werden zur Statusanalyse und Berichtsauswertung in einer zentralen Datenbank hinterlegt.

Der Hersteller op5 bündelt Nagios zusammen mit einer eignen Appliance zur Überwachung der Systeme.

Der Nagios-Server wertet die Daten aus und kann bei der Überschreitung von Schwellwerten Alarme generieren und sie auf unterschiedlichem Wege, wie etwa Email, Instant Messaging oder SMS an den Administrator schleusen. Dabei wird auch eine Eskalation der Alarme unterstützt. Im Fehlerfall können durch Event-Handler auch aktive Eingriffe in die Systeme zu Fehlerbehebung vorgenommen werden. Ferner lässt sich in Nagios eine Netzwerkhierarchie definieren. Diese kann zur besseren Fehlersuche, wie etwa der Unterscheidung, ob ein Gerät nicht erreichbar oder wegen eines Fehlers ausgefallen ist, heranziehen. Zum Funktionsumfang des Überwachungstools gehört auch die Alarmierung der Administratoren, bei der Überschreitung von Schwellwerten oder sonstigen Fehlerhinweisen.

Als Fundament für die Laufzeitumgebung erfordert Nagios ein Linux-Betriebssystem.
Nagios wird von vielen Anbietern als Basis zur Entwicklung eigener Monitoring-Lösungen herangezogen. Diese Unternehmen erweitern den Funktionsumfang von Nagios und bieten diese dann als umfassende Überwachungs-Suites an. Zu diesen Suiten gehören verschiedene Ausbaustufen von Monitoring-Werkzeug für eine zentralisierte Verwaltung von IT-Infrastrukturen. Oftmals werden dabei auch die Verwaltungsoberflächen erweitert und verfeinert. Manche Hersteller integrieren das Überwachungsset auch in spezielle Appliances für das Monitoring und vertreiben Nagios im Set mit einer vorkonfigurierten Hardware.