Deutsches Krebsforschungszentrum entscheidet sich für Client-Server-Struktur

Unix: Geschichte einer schnellen Karriere vom Gast zum Hausherrn

17.07.1992

Mit immer differenzierteren Forschungsvorhaben wachsen die Ansprüche an die Leistungsfähigkeit von DV-Anlagen. Im deutschen Krebsforschungszentrum (DKFZ) in Heidelberg hat daher eine Umstellung von "dummen" Terminals auf multifunktionale, vernetzte Arbeitsplätze stattgefunden.

Dem Computereinsatz kommt im DKFZ eine entscheidende Bedeutung zu. Sehr schnell ist es deshalb zu einer völligen Auslastung der verfügbaren DV-Ressourcen, ja sogar zu einem Anwendungsstau gekommen. Die jetzt vorgenommene Fortschreibung des DV-Konzepts ist insoweit nicht nur eine Reaktion auf den raschen Wandel in der Informations Technologie, sondern auch auf die Bedarfsentwicklung im DKFZ. Hauptelemente des neuen Konzepts sind ein Convex-Vektorrechner, der als Rechenserver arbeitet, und ein IBM-Rechner, der unter VM das Gastbetriebssystem UTS von Amdahl implementiert hat und dadurch Fileserver-Aufgaben übernehmen kann.

DV-Topologie beim DKFZ gliedert sich in drei Ebenen

Zentrale Großrechner werden jetzt als Rechenserver für rechenintensive Anwendungen eingesetzt, deren Bedarf an CPU-Leistung und Datenvolumen die Dimension der Workstations übersteigt. Weitere Aufgaben, die über zentrale Rechner abgewickelt werden (dann als Fileserver, Kommunikationsserver usw.), sind die Haltung großer Datenbanken, der Betrieb allgemein genutzter Spezialperipherie, die zentrale Datenarchivierung, die Führung des hausinternen Rechnernetzes und die Kommunikation nach außen.

In der zweiten Hierarchie-Ebene finden sich in den Abteilungen leistungsfähige Workstations (meist in RISC-Architektur), die weitgehend autonom für abteilungsspezifische Anwendungen häufig im Realtimebetrieb eingesetzt werden. Sie sind untereinander und zu den zentralen Servern über das Rechnernetz verbunden. Auf ihnen werden Routineanwendungen, überwiegend im Zusammenhang mit Gerätesteuerungen, verarbeitet und entsprechende Anwendungsprogramme entwickelt. Insbesondere im Bereich der Bildverarbeitung und beim Einsatz von Spezialprozessoren (Parallelrechnern) sind Workstations unverzichtbar.

Die dritte Ebene der Rechnerhierarchie besteht aus der Vielfalt der PCs mit ihrem breiten Einsatzspektrum. Es reicht von der Gerätesteuerung über die Textverarbeitung bis zur arbeitsplatzspezifischen Datenhaltung. Zunehmend sind die PCs an PC-Netze und (über Ethernet) an die beiden höheren Rechnerebenen angeschlossen. Der Vorteil dieser Integration liegt in der Nutzung von Netzlizenzen für Software, ferner im Zugriff auf zentrale Daten oder auf besondere Peripheriegeräte sowie in der Kommunikationsfähigkeit.

Die Entwicklung zeigt (nicht nur im DKFZ), daß alle drei Hierarchie-Ebenen notwendig sind, daß ein ausgewogenes Wachstum ohne Verdrängung der Ebenen untereinander stattfindet, und daß eine Vernetzung zwischen diesen Ebenen unabdingbar ist. Gleichzeitig - auch wegen des Preis-Leistungs-Verhältnisses - hat der zentrale General-Purpose-Rechner an Bedeutung verloren. Jetzt kann innerhalb des DKFZ-Netzes jedes System, das Dienste anbietet, ein Server sein; und jedes System, das eine Dienstleistung anfordert, ist ein Client. Das Client-Server-Konzept definiert eine Systemstruktur, die jedem Benutzer den transparenten Zugriff auf DKFZ-weit angebotene Anwendungen, Daten und Ressourcen sowie deren effiziente Nutzung erlaubt.

An dieser Stelle sei in Erinnerung gerufen, was das Marktforschungsinstitut IDC zum Thema Client-Server-Struktur verlauten läßt (Marktspiegel 2190):

- Nach Expertenmeinung wird das Client-Server-Modell die generelle Grundlage für eine neue Generation von unternehmensweit verteilten Applikationen sein.

- In vernetzten Umgebungen, wie sie in den 90er Jahren üblich sein werden, hat das altbewährte Host-Terminal-Modell ausgedient: in diesen Umgebungen gibt es keinen zentralen Punkt ("Zentralgestirn") mehr, an dem alle Fäden zusammenlaufen.

- Das Standardmodell für die neue kooperative Verarbeitung in einem unternehmensweiten Netzwerkverbund ist das Client-Server-Prinzip mit verteilten Datenbeständen und verteilten Anwendungen.

Wer die Client-Server-Struktur praktisch verwirklichen will, muß anbietbare Dienste identifizieren und sie auf der Basis allgemein akzeptierter Standards für offene Systeme realisieren. Das DKFZ identifizierte folgende potentiellen Dienste:

- Rechenservice

- Programmentwicklung

- Fileservice

- Programmbibliotheken

- Datensicherung

- Textverarbeitung

- Archivierung

- PC-Service

- Spezialperipherie

- Statistik

- Operating zentraler Server

- Grafik

- Kommunikationsverbindungen

- Datenbanken

- Electronic Mail

- Bürokommunikation

Wegen ihrer Bedeutung für die Fortschreibung des DV-Konzepts des DKFZ sei auf die Aspekte Rechenservice und Fileservice näher eingegangen.

Im Bereich technisch-wissenschaftlicher Anwendungen wächst der Bedarf nach Rechenleistung seit einigen Jahren erheblich stärker als der Leistungszuwachs der marktgängigen Skalarrechner. Dies erklärt den Erfolg von Herstellern wie Convex und Cray, die eine speziell für die Verarbeitung von Vektoren und Matrizen geeignete Rechnerarchitektur einsetzen. Inzwischen bieten immer mehr Hersteller Computer an, die konventionelle Skalarrechner mit Vektorrechnern integrieren. In jedem Falle ist ein Trend zum Einsatz mehrerer, parallel arbeitender Prozessoren zu beobachten.

Ausreichend vektorisierte technisch-wissenschaftliche Anwendungen laufen auf einem Vektorrechner wesentlich wirtschaftlicher ab als auf einem Skalarrechner. Um aber die hohe Rechenkapazität eines Vektorrechners verfügbar zu haben, muß der Anwender geeignete Algorithmen entwickeln und spezielle, auf diesen Rechner ausgerichtete Programmiersprachen und Compiler (vektorisierende Compiler) verwenden.

Der hohe Bedarfszuwachs an Rechenleistung - besonders im Bereich des Biocomputing hat daß DKFZ dazu veranlaßt, neben Skalarrechnern auch Vektorrechner einzusetzen. Da sich außerdem die Workstations immer stärker durchsetzen und mehr und mehr Anwendungen unter Unix realisiert werden, hat sich das DKFZ für einen Rechenserver entschieden, der ebenfalls unter Unix läuft. Seine Aufgabe ist es, jedem Client ein Mehrfaches der lokal verfügbaren Rechenleistung zu bieten und bei numerisch intensiven Prozessen im Hintergrund als zentraler Server zu fungieren. Damit findet also kein unmittelbarer Benutzerbetrieb im Sinne des klassischen Host-Terminal-Modells statt. Online-Dialoge via Terminal sind über einen Front-end-Rechner unter Unix separat abzuwickeln.

Der unter VM laufende IBM-Rechner des DKFZ versorgt nach herkömmlichem Host-Terminal-Muster derzeit 800 Benutzer. Doch hat im Zuge des Ersatzes der "dummen" Terminals durch multifunktionale, vernetzte PCs und durch die Abwanderung ganzer Benutzergruppen zu den Unix-Rechnern bereits ein Wandel eingesetzt. Immerhin wird, das auf der Basis von VM/ESA "eingefrorene" Betriebsmodell noch weitere fünf Jahre erhalten bleiben.

Der IBM-Rechner eignet sich aufgrund seiner Kanalarchitektur gut zum Anschluß von Hochleistungsperipheriegeräten. Er verfügt bereits über eine umfangreiche Speicherperipherie, die - bedingt durch den Wettbewerbsdruck kompatibler Anbieter - auch preisgünstig ist. Außerdem bietet er mit VM eine geeignete Plattform für Unix als Gastbetriebssystem.

IBM-Rechner arbeitet über NFS und Unix als Fileserver

Alle genannten Voraussetzungen prädestinieren den IBM-Rechner für den Einsatz als Fileserver. Konkret: Das DKFZ hat das Network File System (NFS) von Sun zusammen mit dem Gastbetriebssystem UTS, dem Mainframe-Unix von Amdahl, auf dem IBM-Rechner erfolgreich erprobt. Da NFS zudem auf den verteilten Unix-Rechnern im Netz vorhanden ist, kann der IBM-Rechner als Fileserver die Unix-Workstations und -Rechner mit Plattenspeicher-Kapazitäten, bedienen, die über NFS nutzungstransparent angesprochen werden.

Die im zentralen Server gespeicherten Daten unterliegen automatisch einer regelmäßigen Datensicherung. Dies ist erforderlich, weil das Sichern von Daten auf den verteilten Rechnern aufgrund mangelnder Kapazität externer Speicher und wegen des fehlenden Operating nur unzureichend realisiert wird. Die Datensicherung der Convex-Rechner erfolgt jetzt bereits Kassettensystem des IBM-Rechners. Dieser Service soll auf die verteilten Rechner ausgedehnt werden.

Gleiches gilt für die Nutzung des optischen Speichersystems (OSS) am IBM-Rechner, das große Datenmengen - so etwa Bilddaten - archivieren und robotergestützt jederzeit wieder abrufen kann.

Das DKFZ ist davon überzeugt, mit dem geschilderten Ansatz richtig zu liegen: Ein System deckt den gemeinsamen Bedarf der Standardanwendungen unter VM und neuer Serverfunktionen unter UTS ab.

*Dr. Kurt Böhm ist Leiter der Zentralabteilung EDV im Deutschen Krebsforschungszentrum, Heidelberg.

Die Zentrale Datenverarbeitung des DKFZ

Von Terminals und vernetzten PCs sowie von Workstations aus nutzen Mitarbeiter fast aller Abteilungen des Deutschen Krebsforschungszentrums in Heidelberg den Service zentraler Computer. Das Spektrum der Anwendungen umfaßt schwerpunktmäßig

- die Erfassung von Labordaten,

- die Führung von Datenbanken,

- statistische Auswertungen,

- Bildverarbeitung, zum Beispiel für Zell- und Organschnitte,

- Simulationen,

- Präsentationsgrafiken.

Die Zentrale Datenverarbeitung (ZDV) unterstützt die Benutzer bei ihren DV-Anwendungen unter anderem durch die Anpassung von Geräteschnittstellen zur Erfassung von Labordaten mit Mikrocomputern,

durch den Transport von Daten zu einem geeigneten Auswertungsrechner oder Endgerät und durch die Bereitstellung von Programmen für Benutzergruppen.

Die ZDV übernimmt außerdem Aufgaben der Beratung, der

Programmiererausbildung und der Ergebnispräsentation. Benutzer, die PCs einsetzen wollen, können sich von der Auswahl bis zur Konfigurierung und zur Betriebsunterstützung ihrer Rechner an die ZDV wenden.

Die ZDV "fährt" im Zwei-Schichten-Betrieb Rechner des Typs IBM 3090 und 4341 unter den Betriebssystemen VM/CMS (mit Amdahls VTS) und TSS sowie zwei Unix-Rechner Convex C210. Angeschlossen sind über ein lokales Rechnernetz 30 verteilte Computer sowie rund 230 Terminals und PCs. Zum Rechenzentrum der Universität Heidelberg und zum Zentrum für Molekularbiologie bestehen unmittelbare Rechnerverbindungen.