Maßnahmen zum Vermeiden von Ausfällen

Wie Firmen Überlastung von Websites vorbeugen

01.10.1999
CW-Bericht, Frank Niemann Schlechte Antwortzeiten oder sogar der Ausfall einer Internet-Anwendung als Folge von Überlastung bringen eine Site schnell in Verruf. Durch kluge Planung und einige technische Tricks läßt sich die Crash-Gefahr verringern.

Wenn auf einer Website nichts mehr geht, ist der Ruf schnell ruiniert. Dies bekam das Internet-Auktionshaus Ebay zu spüren: Dessen Website fiel bereits mehrfach für einige Stunden aus, woraufhin so mancher Kunde zu Amazon. com oder Yahoo abwanderte, die ebenfalls Online-Versteigerungen veranstalten. Neben Ebay sahen sich auch andere Anbieter im Web mit diesem Problem konfrontiert, beispielsweise die Online-Broker E-Trade und Charles Schwab.

Gehen die Internet-Anwendungen aufgrund hoher Nutzerzahlen in die Knie, sind solche Pannen vermeidbar. Viele Sites verzeichnen ein atemberaubendes Wachstum - zur Freude der Geschäftsführung, doch zum Leidwesen der Systemverantwortlichen. Diese sind gezwungen, die Infrastruktur ständig anzupassen, um Ausfälle durch Überlastung zu verhindern.

Um dem Zorn der Surfer zu entgehen, sollten Betreiber von Websites zunächst ihre Infrastruktur großzügig dimensionieren, raten Experten. Doch es ist nicht so einfach, sich auf eine Obergrenze bei den Zugriffszahlen festzulegen. "Die genaue Anzahl der Besucher ergibt sich erst im laufenden Betrieb", stellt Sebastian Dröber fest. Er ist Geschäftsführer der auf Internet-Anwendungen spezialisierten Hamburger Firma Sinner + Schrader Interactive Software. "Das erste System muß ein guter Wurf sein", so sein Credo. Bei der Dimensionierung können Erfahrungswerte bei vergleichbaren Sites helfen. Eine Rolle spielt dabei auch, wieviel Werbung das Unternehmen für seine Website macht. Hat der Betreiber Anzeigen in Printmagazinen oder auch online geschaltet, dürfte sich auch die Zahl der Zugriffe erhöhen. Genaue Vorher- sagen, wieviel mehr Traffic eine Bannerwerbung bringt, gibt es allerdings nicht.

Ist die Initialzündung geglückt, dann kommt es darauf an, den Leistungsumfang des Systems entsprechend der Zunahme der Internet-Nutzer auszubauen. Skalierbarkeit zählt daher zu den wichtigsten Eigenschaften einer Web-Anwendung. Nach Ansicht des Software-Spezialisten Dröber können deshalb Internet-Systeme, die für den Ablauf auf einem einzigen Rechner konzipert sind, in eine technologische Sackgasse führen: Auch wenn sich die Betreiber ständig neue Hardware zulegen, stößt ihr System irgendwann doch an seine Grenzen. Abhilfe schaffen hier verteilte Systemarchitekturen, bei denen Datenbank-, Applikations- und Web-Server auf separaten Rechnern laufen. (siehe Kasten).

Nach diesem Prinzip arbeitet auch die Lufthansa-Website "Infoflyway" (www.lufthansa.de), die zu den meistbenutzten in Deutschland zählt. Drei Jahre existiert der Service für die Online-Buchung nun, er wurde während dieser Zeit ständig aus- und umgebaut.

Noch Anfang dieses Jahres bediente nur ein Web-Server die Kundschaft, mittlerweile nehmen zwei Server die Anfragen der Interessenten entgegen. Dabei verteilt ein Load-Balancer vom Typ "Local Director" aus dem Hause Cisco die Last gleichmäßig auf beide Rechner. Ebenfalls doppelt vorhanden sind die Reservierungs-Server. Dem an diese Systeme angeschlossenen Datenbank-Server steht ein "Kollege" im Cold-Standby-Modus zur Seite; der kann in kurzer Zeit einspringen, sollte das Hauptsystem Zicken machen. Über Schnittstellen tauschen diese Systeme Daten mit den Mainframes der Fluggesellschaft aus, auf denen das Buchungssystem läuft.

2500 Surfer zu Spitzenzeiten

Als Infoflyway vor drei Jahren online ging, war der Dienst lediglich für 100 gleichzeitige Nutzer ausgelegt. Inzwischen tummeln sich in Spitzenzeiten 2500 Surfer zeitgleich auf den Web-Seiten der Fluggesellschaft. Trotz des massiven Ausbaus reicht auch die jetzige Kapazität nicht aus, um alle Online-Anfragen mit optimalen Antwortszeiten abwickeln zu können. Der Skalierbarkeit des Systems sind Grenzen gesetzt. "Möglicherweise werden wir im nächsten Jahr ein komplett neues System aufsetzen", erläutert Reinhard Richtmann die Marschroute. Er leitet den Unternehmensbereich Multimedia-Technology und ist zudem verantwortlich für den Betrieb und die Entwicklung von Infoflyway.

Durch zusätzliche Hardware läßt sich zwar die Leistungskapazität einer Website ausbauen, doch wenn unerwartet ein Vielfaches der durchschnittlichen Anzahl an Surfern auf die Online-Präsenz zugreift, kann es doch zu Engpässen kommen. Dann helfen nur noch drastische Notfallmaßnahmen. Beispielsweise lassen sich nach den Erfahrungen des Software-Experten Dröber bestimmte Funktionen einer Internet-Anwendung stoppen. So könnten einige Systemjobs angehalten oder auch Teilfunktionen der Site vom Netz genommen werden, ohne den Betrieb der Anwendung zu beeinträchtigen.

Um überhaupt zu erkennen, wann Engpässe drohen, benötigen die Systemverantwortlichen Informationen über die Auslastung der Anwendungen und Netzverbindungen. Das Überwachen von Websites ist eines der Spezialgebiete der in München ansässigen Tiss GmbH. Die Firma verwendet dabei die "Internet Service Monitors" ihres Kooperationspartners Micromuse aus den USA. "Anhand von Berichten über Antwortzeiten sowie über die Anzahl der Benutzer können die System-Manager Überlastungssituationen frühzeitig erkennen", konstatiert Oliver Wörl, einer der Tiss-Geschäftsführer. Die dafür verwendete Technik ist von Mainframe- und Client-Server-Umgebungen her bekannt. Einige dieser Hersteller adaptierten ihre Verfahren auf das Web.

Über die Micromuse-Monitore läßt sich etwa testen, ob Web-Anwendungen noch zuverlässig arbeiten. Hierzu setzen die Testsysteme beispielsweise Transaktionen ab und messen, ob diese in der geforderten Zeit abgearbeitet werden. Kommt es zur Überschreitung bestimmter Grenzwerte, schlagen die elektronischen Wächter Alarm.

Die Monitore werden in die Netzwerke der Internet-Service-Provider (ISP) integriert. Uunet betreibt weltweit 5000 solcher Systeme. Darüber hinaus bietet Micromuse spezielle Überwachungs-Tools für Websites und Datenbanken an. Außerdem entwickelt Tiss gemeinsam mit dem Internet-Software-Anbieter Intershop ein Monitoring-System, das die Performance der E-Commerce-Lösung von Intershop überwachen soll.

Neckermann muß umdenken

Diesen Aufwand betreibt das Versandhaus Neckermann für seinen Online-Shop bisher noch nicht. "Wir errechnen den zu erwartenden Traffic und halten genügend Reserven vor, um auch Lastspitzen abzufangen", beschreibt Michael Sorg, verantwortlich für den Online-Bereich, die Situation bei Neckermann Versand Online (www.neckermann.de). Noch begnügt sich das Unternehmen mit einem Backup-Rechner, der in wenigen Stunden einsatzbereit ist. Dies war bisher ausreichend, doch inzwischen wuchs das Bestellvolumen derart stark, daß der Anbieter sich längere Ausfallzeiten nicht mehr leisten kann. Im letzten Jahr bestellten Konsumenten auf Neckermanns Website Waren im Wert von 19 Millionen Mark. Deshalb arbeiten Sorg und sein Team an einer neuen Infrastruktur. Zukünftig soll sich die Ausfallsicherheit erhöhen - Server-Spiegelung und Load-Balancing machen''s möglich. Bis zum Weihnachtsgeschäft will Neckermann das neue System betriebsbereit haben.

Überlastete Datenbanken, Applikations-Server und Web-Server verursachen am häufigsten Site-Ausfälle. Allerdings können auch Störungen bei der Netzanbindung zu solchen Problemen führen. Linotype Library, ein zu Heidelberg Druckmaschinen gehörender Spezialist für Schriften aus Bad Homburg, hat seine Website www.fonts.de über zwei Provider angebunden. Bei den ISPs Ecomp und Nacamar mietete das Unternehmen je eine Standleitung mit 2 Mbit/s Datenübertragungsrate. Hat einer der ISPs Probleme, sinkt zwar die Übertragungskapazität, doch die Online-Kunden werden auf die andere Netzverbindung umgeleitet. Allerdings dauert es etwa eineinhalb Minuten, bis die Router im Internet automatisch umkonfiguriert haben.

Einige ISPs bieten nicht nur sichere Netzanbindungen, sondern übernehmen auch die Überwachung der Rechner ihrer Hosting-Kundschaft. Mit dem Diensteanbieter Cable & Wireless ECRC aus München vereinbart der Kunde Service-Level-Agreements (SLAs). Damit verpflichtet sich der Provider, eine bestimmte Dienstgüte zu liefern. So kümmert sich der ISP darum, daß bei Ausfall eines Servers sofort ein Backup-System in die Bresche springt.

All diese Maßnahmen hätten der pannengeplagten Internet-Firma Ebay wenig genutzt: Nach Firmenangaben verursachte ein Softwarefehler die Schwierigkeiten.

Skalierbare Sites

Der Königsweg für skalierbare Websites ist nach Ansicht von Sebastian Dröber, Chef von Sinner + Schrader Interactive Software, die Dreiteilung in Web-, Datenbank- und Applikations-Server. Bei so gestalteten Anwendungen bleibe den Verantwortlichen genug Spielraum, um auf den einzelnen Schichten des Systems Maßnahmen zum Beseitigen von Engpässen ergreifen zu können. Dazu zählt etwa, die Datenbank zu partitionieren, sprich, auf mehrere Server zu verteilen. Nimmt die Nutzerzahl zu, lassen sich weitere Rechner hinzufügen, so daß sich die Arbeitslast auf mehrere Schultern verteilt. Allerdings ist es nicht einfach, solch vorbildliche Architekturen zu realisieren, wenn dabei Altsysteme integriert werden müssen, gibt Internet-Experte Dröber zu bedenken.

Um die Last zu verteilen, setzt Linotype Library aus Bad Homburg auf einen Cluster aus Linux-Rechnern. "Schließlich nutzen zwischen 300 und 700 Surfer unsere Website www.fonts.de gleichzeitig", bemerkt Markus Haut, Leiter der IT-Abteilung. Das System kann in der höchsten Ausbaustufe bis zu 5000 parallele Sessions verarbeiten. Auch das daran angeschlossene Datenbanksystem, es läuft auf einem Rechner vom Typ "Sun E 450", läßt sich durch zusätzliche Prozessorkarten erweitern. Das Netz des Schriftspezialisten schotten zwei Firewalls vor ungebetenen Gästen ab, wobei ein Load Balancer vom Typ "Fireproof" des israelischen Anbieters Radware die Arbeitslast zwischen den beiden Systemen verteilt.