Hochverfügbarkeit

Airbags für Server-Systeme

30.01.2003
Von von Dirk
Die Verfügbarkeit lässt sich bereits mit relativ einfachen Maßnahmen entscheidend verbessern. Aber natürlich gilt auch hier: Je höher die Anforderungen, desto tiefer muss das Unternehmen in die Tasche greifen, um sie zu realisieren.

AUSFÄLLE kritischer Server sind das Horrorszenario jedes Unternehmens. Sie führen dazu, dass Kunden nicht bestellen, Wareneingänge nicht verbucht und Mitarbeiter schlichtweg nicht arbeiten können. Ihre Ursachen können unterschiedlich sein, aber fast immer kann man etwas dagegen tun.

Eine nicht unerhebliche Fehlerquelle stellt beispielsweise der Prozessor eines Servers dar. Fällt dieser aus, stürzt das System ab. Das gilt auch für die meisten Mehrprozessormaschinen. Einige Hersteller bieten hierfür Offline-Backup-Prozessoren an, die im Normalbetrieb abgeschaltet sind und im Fehlerfall für einen ausgefallenen Kollegen einspringen. Das geht zwar nicht ohne einen Server-Reboot, jedoch ist der damit verbundene Zeitverlust erheblich geringer als der Aufwand, der zum Austausch des Prozessors notwendig wäre. Eine weitere Fehlerquelle stellt der Systemspeicher dar. Hier hat sich inzwischen Error-Correction-Code (ECC) Memory etabliert, das einfache Fehler zu korrigieren vermag. Derzeit noch seltener im Gebrauch, aber sinnvoller ist das Advanced ECC Memory, da hierbei ein Speichermodul komplett ausfallen kann, ohne einen Server-Absturz zu provozieren. Server-Systeme der neuesten Generation gehen gar so weit, Speicherbänke komplett zu spiegeln. Dann dürfen

notfalls auch mehrere Module ausfallen, ohne dass der Betrieb beeinträchtigt ist. Häufig kann der Systemverwalter den defekten Speicher dann noch im laufenden Betrieb austauschen.

Alles doppelt

Zur soliden Basis eines ausfallsicheren Servers zählen natürlich auch eine unterbrechungsfreie Stromversorgung und redundante Lüfter. Zu beachten ist hierbei, dass die Lüfter im laufenden Betrieb getauscht werden können, ohne dass das Öffnen des Server-Gehäuses zum Abschalten des Rechners führt. Wichtige Beiträge zur Verfügbarkeit eines Servers leisten zudem die Netzwerkkarten. Redundante Ausführungen sind je nach Konfiguration in der Lage, einen Failover von einer defekten Karte auf eine noch funktionierende durchzuführen. Alternativ können zwei oder mehr Karten in einem Loadbalancing-Modus betrieben werden. Dieser sorgt für einen besseren Durchsatz und erhöht die Ausfallsicherheit.