DB-Altlasten gehören auf den Datenmüll:

Vorhandene Datenbestände ins neue System hinüberretten

22.07.1988

*Dr. Helmut Wilke ist Geschäftsführer der Relational Technology GmbH in Frankfurt.

Die Integration alter Datenbestände ist ein heikles Thema bei der Neuorganisation von datenbankgestützten Anwendungen. Doch im Zuge der Entwicklung neuer Datenbank-Managementsysteme könnte dieses Problem unter den Tisch fallen. Helmut Wilke* erläutert ein Konzept der verteilten Verarbeitung, mit dem "Insellösungen" vermieden werden sollen.

Schlagworte wie "Integration" oder "Connectivity" kennzeichnen das überall zu beobachtende Streben der Unternehmen nach umfassenden DV-Lösungen, die alle Teile der Informationstechnik in einer Organisation verknüpfen.

Einen Ansatz zur Integration von Datenbeständen und darauf basierenden Anwendungen stellen verteilte Datenbanksysteme (distributed database management systems, DDBMS) dar.

Ein verteiltes Datenbanksystem zeichnet sich dadurch aus, daß Datenbanken, die auf unterschiedlichen Rechnern installiert sind, zu einer einzigen logischen Datenbank

zusammengefaßt werden. Der Benutzer kann auf unternehmensweit verteilte Datenbestände zugreifen, als ob sie vor Ort gespeichert wären.

Ein Problem bei der Einführung eines verteilten Datenbanksystems und einer modernen Anwendungs-Entwicklungsumgebung war bislang die Integration von bereits exisitierenden Datenbeständen. Der Anwender mußte sich entscheiden: Verzichtet er auf die alten Daten, um eine neue Datenbankgeneration mit 4GL einzusetzen, oder macht er weiter wie bisher?

Integration besteht oft nur in Teilbereichen

Eine Neuerfassung der Daten kommt im allgemeinen nicht in Frage, weil auf den alten Datenbeständen oftmals kritische Applikationen basieren. Eine Manipulation am Datenbestand ist sehr riskant, da sie unter Umständen den Ausfall der gesamten Applikation verursachen kann. Die Folge des Dilemmas: Die Integration von Datenbeständen findet oftmals nur in Teilbereichen statt, kritische Daten und Anwendungen bleiben unverändert - und der Einsatz einer modernen Software-Entwicklungs-Umgebung wird auf unbestimmte Zeit verschoben.

Gateways stellen jedoch Brücken zwischen Datenbeständen und Datenbanken dar. Das DDBMS kann so auf Alt-Daten zugreifen, während gleichzeitig kritische Applikationen mit ein und derselben Datenbasis weiterarbeiten. Auf diese Weise werden nicht nur die Investitionen der Anwender geschätzt, sondern zugleich die Voraussetzungen für die verteilte Verarbeitung geschaffen. Koexistenz statt "Entweder-Oder" ist angesagt.

Außerdem dienen Gateways dazu, die Produktivität des Anwenders bei der Software-Entwicklung zu erhöhen So kann der DEC-VAX-Benutzer heute mit Hilfe eines RMS-Gateway in einer Entwicklungsumgebung der vierten Generation Applikationen entwickeln, die auf RMS-Dateien zugreifen.

Der Zugang zu den "Alt-Datenbeständen", zum Beispiel RMS-Dateien, erfolgt generell über die Standard-Abfragesprache SQL und ist für den Datenbankbenutzer transparent, das heißt unsichtbar. Der Anwender braucht bei der Formulierung seiner SQL-Abfragen keine Rücksicht darauf zu nehmen, daß auf einen Teil der Daten über Gateways zugegriffen wird. Das Gateway konvertiert die SQL-Anweisungen in RMS-Zugriffe.

Gateway-Funktionen sind für den User transparent

Die Vorteile des Gateway-Einsatzes kommen insbesondere in heterogenen Hardware- und Softwareumgebungen zum Tragen. So lassen sich Datenbestände eines PC sowie eines Mainframe zusammenfassen und auswerten.

Auch dieser Zugriff erfolgt transparent: Bei der Formulierung einer SQL-Abfrage spielt es keine Rolle, ob die Daten auf einem PC, einer VAX oder einer IBM 3090 gespeichert sind. Auf Daten, die nicht in Tabellen des DDBMS vorliegen, wird zugegriffen über entsprechende Gateways.

Ein Beispiel im Bereich CIM soll den Nutzen der Gateway-Technologie verdeutlichen: Die Fertigungsanlage des betreffenden Unternehmens ist rechnergesteuert, wobei als Host-System DEC-VAX-Rechner unter VMS zum Einsatz kommen. Die Daten für die unterschiedlichen Anwenderprogramme sind in RMS-Dateien gespeichert.

Angestoßen durch die CIM-Diskussion sollen die in der Fertigung anfallenden Daten nun einer weiteren Verwendung außerhalb der reinen Produktion zugeführt werden, etwa für Analysezwecke auf der Management-Ebene. Das Problem: Bei der Erstellung der Fertigungsapplikationen mit RMS-Dateien wurde ein Datenzugriff für andere Zwecke nicht eingeplant; wird er nachträglich eingebaut, besteht die Gefahr, daß die laufende Fertigungssteuerung eine Unterbrechung erfährt.

Die Lösung: Der Einsatz eines Gateway ermöglicht den transparenten, also ungefährlichen Zugang zu den RMS-Dateien, ohne die bestehenden ausfallkritischen Fertigungsapplikationen zu berühren. Darüber hinaus lassen sich mit einer Entwicklungsumgebung der vierten Generation Anwendungsprogramme erstellen, die neben den bisherigen Produktionsanwendungen laufen, beispielsweise für die Materialplanung oder die Qualitätskontrolle.

Alte und neue Software greifen auf denselben RMS-Datenbestand zu, ohne sich gegenseitig zu stören. Während die Fertigungsapplikationen die RMS-Dateien unverändert direkt ansprechen, erfolgt der Zugang der Datenbankanwendungen über ein RMS-Gateway.

Die in der Fertigung anfallenden Informationen können beispielsweise an einem PC für die Produktionsplanung ausgewertet werden, etwa um die Anlieferung der Rohwaren und den Abtransport der Fertigerzeugnisse zu steuern. Andere Daten aus der Fertigung lassen sich an einer Workstation zur Qualitätskontrolle heranziehen. Der für die Produktion verantwortliche Manager kann auf seinem Terminal jederzeit einen sekundengenauen Bericht über die Fertigung anfordern.

Alle Datenbankanwendungen greifen über ein und dasselbe Gateway auf die RMS-Dateien zu. Damit ist die Datenintegrität zu jedem Zeitpunkt gewährleistet. Für die Realisierung eines solchen unternehmensweit verteilten Informationsverarbeitungssystems sind allerdings vier Komponenten von entscheidender Bedeutung: Portabilität, Konnektivität, verteilte Datenverwaltung und Gateway-Technologie.

Die Portabilität ermöglicht die Übertragung von Anwendungen auf unterschiedliche Hardware- und Softwareumgebungen. Der Zugang zu einem verteilten Datenbanksystem sollte unter einer Vielzahl von Betriebssystemen und auf verschiedenen Rechnern möglich sein. Ein Anwendungsprogramm, das für eine Umgebung geschrieben ist, muß sich mit minimalem Aufwand in eine andere Umgebung 1 lassen.

Die Konnektivität ermöglicht den Datenaustausch zwischen verschiedenen Systemen. Dazu gehört die Unterstützung gängiger Netzwerkprotokolle wie etwa DECnet oder TCP/IP ebenso wie die Zugangsmöglichkeit zur Datenbank für populäre Softwarepakete.

Mit verteilter Datenverwaltung kann auf verteilte Datenbestände transparent zugegriffen werden. Entscheidend für die Performance der verteilten Zugriffe ist der "Query Optimizer" des DDBMS. Die Gateway-Technologie schließlich erlaubt die Integration existierender Datenbestände und Datenbanksysteme in die verteilte Verarbeitung.