Monitoring-Systeme

Nagios wacht für Wilken

27.05.2008
Von Dieter Schmitt

Wilken wählt Nagios

Das Open-Source-Werkzeug Nagios weist im Vergleich mit den genannten Überwachungssystemen deutliche Vorteile auf: Die einfach zu bedienende Software ist über das Internet in Sekundenschnelle verfügbar. Diverse Ampelfunktionen machen das System leicht verständlich und übersichtlich. Erweiterungen lassen sich mit "NagiosQL" schnell realisieren. Lastaufzeichnungen wiederum ermöglicht das Zusatz-Tool "Nagiosgrapher", mit dem Server und Dienste zur Laufzeit grafisch aufgezeichnet und dann später ausgewertet werden können. Auch ein Backup-System lässt sich ohne großen Aufwand einrichten.

Beispiel für die Lastauszeichnung einzelner Messwerte zur späteren Performance-Auswertung.
Beispiel für die Lastauszeichnung einzelner Messwerte zur späteren Performance-Auswertung.

Die freie Software ist hinsichtlich der zu überwachenden Dienste plattformunabhängig. Prüfungen gehen über mehrere Netze und VPNs (Virtual Private Networks) hinweg. Darüber hinaus ist es möglich, ohne genaue Kenntnisse von Simple-Network-Management-Protokollen (SNMPs) und Management Information Bases (MIBs) Spezialprüfungen zu integrieren. Dennoch können ohne weiteres SNMP-OIDs (Object Identifier) in die Nagios-Struktur eingebunden werden. Wichtig ist dies insbesondere für Spezialdienste wie die Lüfterüberwachung von Routern, für die es meist keine Check-Skripte gibt.

Auch die herstellerspezifischen MIBs lassen sich nutzen, um Nagios noch vielseitiger zu gestalten. Die geplanten Erweiterungen können auch über selbst geschriebene Shellscripte erfolgen, was beispielsweise neue Möglichkeiten eröffnet, eigene Software in das Monitoring einzubinden. Erwähnenswert ist auch "NagVis", das - in Nagios eingebunden - Netzstrukturen visuell darstellen kann. Auf der frei zugänglichen Webseite www.nagiosexchange.org lassen sich Plug-ins herunterladen und in das Nagios-System integrieren oder selbst geschriebene Scripte anderen Benutzern zur Verfügung stellen. Dabei gilt es natürlich, zwischen sinnvollen und unsinnigen Dienstabfragen zu differenzieren, denn nur ein übersichtliches System garantiert dem Administrator klare Sicht auf seine Server.

Nagios im Wilken-RZ: Die Umsetzung

  • Überwachung von gut 250 Systemen und rund 2500 Diensten;

  • Prüfung aller relevanten Systemdienste der angebundenen Betriebssysteme, Server und Hardwaregeräte;

  • Prüfung der Applikationen, Datenbanken und Spezialdienste;

  • Aufzeichnung der Last mit "Nagiosgrapher";

  • im Störfall Benachrichtigung des Admins mittels E-Mail und SMS auf Rufbereitschafts-Handy;

  • Eskalationsstufen für Störmeldungen (Bereitschaft, Admin-Gruppe, Geschäftsführung).

Fazit

Das Projekt zog sich über einen relativ langen Zeitraum. Nach dem Auswahlprozess im Jahr 2005 und der anschließenden Installation geht es bis heute darum, die Lösung zu ergänzen. Dabei gilt es sowohl, die einzelnen Systeme zu einem sinnvollen Ganzen (Nagios, Scripte, NagiosQL, Nagiosgrapher, NagVis) zusammenzustellen, als auch eine Backup-Lösung sowie Benachrichtigungen und Eskalationen zu erarbeiten. Rund 250 Server und die heterogene Struktur der Betriebssysteme bei Wilken (Windows, Linux, Solaris, HP-UX, AIX) müssen überwacht werden - ebenso diverse Applikationen und Datenbanken. Vieles hat die Administrationsmannschaft von Wilken nach dem Motto "Learning by Doing" bewältigt.

Das Nagios-Testsystem lief über Wochen im Alltagsbetrieb. Dabei unterstützte ein externes Consulting-Team den internen Entwicklungsprozess bei ausgewählten Fragestellungen. Eine besondere Herausforderung bestand darin, Wilken-eigene Produkte (Wilken ERP, Applikations-Listener, Datenbankzugriffe) zu integrieren. Kritisch zu sehen sind Updates hinsichtlich neuer Softwareteile - sie müssen an Testsystemen erprobt werden. Als problematisch erwies sich zudem, dass zu viele Werkzeuge im Prinzip dasselbe tun (Beispiel: Graphen): Hier das jeweils Beste herauszusuchen ist ein mühsamer Prozess, der entsprechend Aufwand erfordert. Alles in allem läuft Nagios bei Wilken jedoch stabil und ohne besondere Vorkommnisse. (kf)