IT im Automobilbau/Clustering, Snapshots und Backup

BMW: Gute Fahrt für den Dateiservice

14.09.2001
Eine wachsende, hochkomplexe CAx-Serverstruktur war bei der BMW AG zu verwalten. Überlegungen, einerseits diese Struktur zu vereinfachen und andererseits das Daten-Management zu automatisieren, machten eine Datenkonsolidierung notwendig. Ein zentralisierter File-Service trug entscheidend zur Problemlösung bei. Von Frauke Stautner*

CAD/CAM/CAE-Daten, kurz CAx, nehmen bei einem Automobilhersteller immer breiten Raum ein. Bei BMW sind im IT-Verbund der Zentrale in München und der Werke in Dingolfing, Regensburg und Landshut an die 2500 Cax-Clients unter Windows NT und Unix vernetzt. Die Mitarbeiter haben auf zirka 150 Applikationen, wie etwa die CAD/CAE-Software Catia oder Pro-Engineer, sowie auf die üblichen Office-Anwendungen Zugriff.

Überlegungen, einerseits die komplette Struktur zu vereinfachen und andererseits das Daten-Management zu automatisieren, führten zur Windows-NT-Datenkonsolidierung.

Um Redundanzen der Datenhaltung zu vermeiden, sollte eine multiprotokollfähige Lösung gefunden werden: Aus Gründen der Hochverfügbarkeit musste sie Cluster-Failover und Zugriff der Unix- und NT-User auf den gleichen Daten-Pool bieten, außerdem sollten die jeweiligen Schreib-/Lese-Berechtigungen der verschiedenen Betriebssysteme bestehen bleiben.

Nach erfolgreichem Test eines File-Servers von Network Appliance sprach sich die Abteilung IT Technology Consulting für diese Lösung aus und installierte vier Net App Filer, welche die bisherige Server-Landschaft ablösten. "Das Konzept kam uns sehr entgegen. Mit nur wenigen Befehlen sind die Systeme zu bedienen. Darüber hinaus zählten für uns Performance und Hochverfügbarkeit", erklärt Harald Raufer, IT-Technologieberatung bei der BMW AG.

BMW setzt die Filer so ein, dass einer als Master-Server dient und drei weitere als Replika-Server. Im 20-Sekunden-Takt werden die Änderungen, die auf dem Master stattfinden, über LAN und WAN mit Hilfe der Mirroring-Technologie von Network Appliance auf den drei anderen Systemen aktualisiert.

Dezentrale Aufgaben haben bei BMW sehr wohl ihre Berechtigung neben zentralen - der Grund dafür, dass auch der Dateiservice für Windows NT Sache der jeweiligen IT-Abteilung vor Ort ist. Im größten Kernbereich außerhalb Münchens, dem BMW-Werk in Dingolfing, standen die Verwaltung und Speicherung der Homeshares - der persönlichen, freigegebenen lokalen Speicher der Windows-Anwender - von 9000 Windows-NT-Anwendern sowie der Abteilungs- und Projektdaten zur Disposition. Einem Homeshare ist ein bestimmter Laufwerksname zugeordnet, der während des Log-On gemountet wird.

Die Homeshares, die ursprünglich auf zwei Standardservern mit Raid-Subsystemen lagen, hatten 1999 eine Datenkapazität von 220 Gigabyte, der 5500 Homeshares gegenüberstanden. Bis heute hat sich der Datenbestand bei zirka 550 Gigabyte weit mehr als verdoppelt.

Hohe Datenverfügbarkeit gefordertÄhnlich sah die Lage bei den Abteilungs- und Projektdaten aus. Es bestanden neun Windows-NT-Ressource-Domänen mit je einem Primär-Domänenkontroller (PDC) und Backup-Domänenkontroller (BDC). Hardwaretechnisch gesehen handelt es sich dabei um je zwei Windows-NT-Server.

Aus logischer Sicht gesehen realisieren PDC und BDC eine NT-Domäne, also eine Verwaltungseinheit von Windows-NT-Ressourcen wie etwa User, Gruppen, Computer etc. Bei neun Domänen mit 18 NT-Servern wird die Verwaltung und vor allem die Storage-Erweiterung der Systeme sehr aufwändig. Hinzu kommt, dass für die Anwender eine hohe Datenverfügbarkeit erreicht werden soll. Bei umfangreicheren Wartungsaufgaben oder auch bei unvorhergesehenen Serverausfällen ist dies jedoch nicht immer der Fall. Sind die Daten nicht verfügbar, entstehen Produktivitätsverluste, deren Höhe man sich angesichts der Größe des BMW-Werks in Dingolfing leicht vorstellen kann: Im Werk arbeiten zirka 21500 Beschäftigte. Täglich rollen 1250 Fahrzeuge der 3er-, 5er- und 7er-Baureihen vom Band.

Folglich sollte eine Lösung gefunden werden, die sämtliche NT-Dienste standardisiert und im Rechenzentrum zentralisiert, zudem einfach zu verwalten ist und mittels Clustering eine hohe Systemstabilität bietet. Peter Scheuer, im Werk Dingolfing für die NT-Infrastruktur verantwortlich, entschied sich für Net-App-Filer.

Administration über NT-ToolsDie Homeshares aller 9000 NT-Anwender wurden auf zwei, als Cluster ausgelegten F840-Filern abgelegt. Dieser Cluster verwaltet derzeit 550 Gigabyte. Der zweite Cluster, bestehend aus zwei F740-Filern, verwaltet die Abteilungs- und Projektdaten mit zirka 500 Gigabyte Daten, die vorher auf neun NT-Domänen aufgeteilt waren.

Das Aufsetzen der Cluster ging laut Peter Scheuer reibungslos: "Die Filer lassen sich im Prinzip wie ein NT-Member-Server auf sehr einfache Weise in eine NT-Domäne integrieren. Auch die Administration der Homeshares und des Dateiservice erfolgt wie bei Member-Servern über NT-Tools. Unsere beiden Cluster sind jetzt seit März 1999 beziehungsweise April 2000 produktiv und laufen stabil bei hoher Performance."

Hintergrund für die Nutzung verschiedener Server für Abteilungs- und Projektdaten war, dass die einzelnen Fachbereiche die nötigen Sektoren auf diesen Servern je nach Bedarf mieten können. Da auch die Administration entsprechend abgegrenzt sein musste, waren separate Projekt- und Abteilungsserver schlicht unumgänglich. Mit der Umstellung auf den NAS-Cluster erübrigte sich auch dies. Die Filer unterstützen Quotas - also die Zuteilung von Speicherbereichen -, so dass sich alles, einschließlich Filestruktur und Zugriffsrechten, auf ein und demselben Speichersystem regeln lässt.

In Dingolfing Snapshot-TechnologieFile-Service allein ist jedoch nicht alles. Es stellt sich die Frage nach Backup und Restore der Daten. Im Werk Dingolfing wird Snapshot-Technologie verwendet. "Schnappschüsse" werden täglich um 12 Uhr und 24 Uhr durchgeführt. Insgesamt stehen derzeit elf Generationen über einen Zeitraum von drei bis vier Wochen zur Verfügung. Dafür liegt der Speicherbedarf bei unter 20 Prozent für Homeshares und unter zehn Prozent für Abteilungs- und Projektdaten.

Ein solches Backup ist deutlich schneller als ein herkömmliches. Gesichert wird mit Veritas Netbackup über NDMP auf via Fibre-Channel angeschlossene Tapes einer Bandbibliothek. Snapshots ermöglichen zudem ein sehr schnelles Restore einzelner Dateien oder auch kompletter Volumina, was zu einer hohen Datenverfügbarkeit beiträgt. Sie können durch Anwender, IT-Beauftragte oder Helpdesk-Mitarbeiter durchgeführt werden.

Stefan Robitschko, verantwortlich für NT-Infrastruktur und File Server bei BMW im Werk Regensburg, sah sich einer ähnlichen Situation gegenüber. Neben einem hoch spezialisierten Unix-Netzwerk fährt das Werk Windows NT mit knapp 4600 Anwendern mit Zugriff auf Applikationsdaten wie MS Office und entsprechend vielen Homeshares. Ihre Verfügbarkeit hat auch hier oberste Priorität. Nach Gesprächen mit den Kollegen im Werk Dingolfing entschied sich auch Robitschko für diese Lösung.

Angesichts des raschen Wachstums der NT-Daten, für das laut Robitschko auch kein Ende in Sicht ist, entschied man sich im Frühjahr 2000 bereits für einen Net-App-F840-Cluster. Die Zeit bis zu dessen Markteinführung konnte BMW mit einem F760-Cluster überbrücken, der sämtliche Windows-Daten zentral konsolidierte. Im November folgte dann das Upgrade auf das damals größe Filer-Gespann.

"Die Zentralisierung des Dateidienstes entlastet die Administration und erhöht die Datenverfügbarkeit", erklärt der NT-Spezialist aus Regensburg. "Und auch die Snapshot-Technologie trägt dazu bei. Der Anwender kann seine Daten selbst wiederherzustellen, ohne das Helpdesk bemühen zu müssen."

Snapshots schaffen darüber hinaus neue Perspektiven für Backup und Restore. Abgesehen vom Restore ganzer Volumina erfordert die Rücksicherung einzelner Dateien Admin-Rechte, so dass nur eine sehr begrenzte Anzahl von Personen in der Lage ist, derartige Anfragen umzusetzen. Mit Snapshot-Technologie hat quasi jeder User für sein Homeshare Admin-Rechte für das Restore seiner Dateien, so dass der Helpdesk merklich entlastet ist. Das System ist so konfiguriert, dass zweimal pro Tag jeweils sechs Generationen per Snapshot gesichert werden. Zusätzlich kann man sieben Wochen-Backups vorhalten, so dass sich über einen Zeitraum von acht Wochen 19 gesicherte Generationen ergeben.

Tape-Technologie hat ausgedientSeit Stefan Robitschko im Werk Regensburg so arbeitet, hat sich in seinem Netzwerk die klassische Tape-Technologie überlebt. Der Grund dafür ist klar: Zeit. Bei einem Filesystem von 335 Gigabyte Größe dauert ein kompletter Restore zu lange. In dieser Zeit würde der Windows-NT-Betrieb stehen. Dies wiederum könnte für das Werk, das ausschließlich BMW-Modelle der 3er-Serie wie Coupé, Limousine, M3, Turing und Cabrio produziert, zu Produktionsbeeinträchtigungen führen. Die Snapshots werden derzeit per Copy-Befehl über NDMP (Network Data Management Protocol) und Gigabit Ethernet auf den Festplatten eines dritten F760-Filer gesichert, der ursprünglich aus dem BMW-internen Bestand stammte. Die inkrementelle Sicherung über NDMP dauerte zirka vier Stunden. Inzwischen hat sich BMW Regensburg teilweise für die elegantere Methode der Datensicherung, die Snape-Mirror-Technologie, entschieden.

Da Systemverfügbarkeit bei BMW eine der wichtigsten Anforderungen ist, sind die kompletten, produktiven Windows-NT-Daten nicht nur auf einem einzelnen Filer abgelegt, sondern auf einem Cluster mit einer Bruttospeicherkapazität von 3,5 Terabyte; derzeit ist 1 Terabyte in Benutzung. Er ist so konfiguriert, dass der zweite Filer ebenfalls produktiv ist.

Wie schnell das Cluster-Failover erfolgt, zeigte eine Probe aufs Exempel: Im laufenden Betrieb schaltete Stefan Robitschko einen der beiden Filer-Köpfe ab. Es dauerte genau zwei Minuten, der eine Filer im Cluster nahm den Betrieb des abgeschalteten hinzu, und 4600 User waren wieder online.

Die Sicherheit der Systeme selbst wird nicht nur durch redundant ausgelegte Stromversorgungen, batteriegepuffertes NVRAM (Non Volatile Random Access Memory) und Hot Spares, also freie Festplatten, erreicht, sondern auch durch die Möglichkeit eines V-LAN.

Mirroring im ProbebetriebDie Filer fassen mehrere Netzwerkkarten, so dass mithilfe mehrerer Ethernet-Kabel ein V-LAN entsteht. Robitschko setzt dafür zwei Datenleitungen ein, eine aktive und eine redundante. Sollte die aktive Leitung ausfallen, wird über einen Netzwerk-Switch sofort auf die redundante Leitung umgeschaltet - ebenfalls eine Form des Failover. Eine weitere Sicherheitsstufe, das Mirroring der Cluster-Daten, läuft derzeit im Probebetrieb auf dem F760. Sollte der Originaldatenbestand von netto knapp 1 Terabyte auf dem F840-Cluster tatsächlich ausfallen, werden User-Zugriffe sofort auf die gespiegelte Version der Daten umgeleitet.

*Frauke Stautner ist Journalistinin München.