US-Marktforscher formuliert Regeln für verteilte Datenbank-Management-Systeme:

Transparenz spielt sich auf sieben Ebenen ab

08.05.1987

STAMFORD (CW) - In einer verteilten Datenbankumgebung ist Transparenz das oberste Gebot. Dabei darf es keine Rolle spielen, an welcher Stelle im DB-Netz die Informationen geführt werden oder von wo aus der Zugriff erfolgt. Diese Forderung stellte jetzt das amerikanische Marktforschungsinstitut Gartner Group in seiner Studie "Rules for Distributed DBMS" auf.

Um als echtes verteiltes Datenbank-Management-System zu gelten, muß ein Produkt nach Ansicht der US-Analysten auf einem globalen Data Dictionary basieren und über verteilte Query-Optimierungsfunktionen verfügen. Dazu Michael Braude, Vizepräsident des Software Research Center bei der Gartner Group: "Die Dictionary-Fähigkeiten müssen über die verschiedenen Knoten des Netzwerks verteilt sein. Angesichts des heutigen State of the Art ist dies jedoch nicht möglich." Kein Anbieter, so Braude weiter, biete derzeit ein komplettes verteiltes DBMS-Produkt an; lediglich Teilkomponenten solcher Systeme seien verfügbar.

Vor diesem Hintergrund formulierte der amerikanische DB-Experte sieben Regeln, die als Bewertungsbasis für verteilte Datenbank-Management-Systeme dienen können:

- Transparenz beim Retrieval

Der Benutzer kann von jedem DB-Knoten aus auf Informationen zugreifen. Dabei spielt es keine Rolle, wo die Transaktion gestartet wurde. Das Ergebnis muß überall im Netzwerk dasselbe sein.

- Transparenz beim Update

Daten lassen sich von jedem Datenbank-Knoten aus aktualisieren. Es darf dabei nicht ins Gewicht fallen von welcher Stelle im Netzwerk der Update-Befehl ausging. Alle Benutzer müssen einen identischen Informationsstand haben.

- Transparenz des Schemas

Die User können von jedem Knoten aus das Schema der Datendefinitionssprache verändern. Diese Adaptionen werden überall im Netzwerk kenntlich gemacht.

- Transparenz der Performance

Die Ausführung eines Kommandos darf nicht davon abhängig sein, von wo aus es gegeben wurde. Um die Performance vergleichbar zu machen, muß das Datenbank-Management-System über einen verteilten Query-Optimizer verfügen, der eine Sicht auf das gesamte Netzwerk hat und einen Zugriffsplan für verteilte Kommandos aufstellt.

- Transparenz bei Transaktionen

Eine Transaktion kann in einer Zwei-Phasen-Commit-Sequenz mehrere Netzwerkknoten aktualisieren. Bevor ein Update in Kraft tritt, werden alle Zielknoten davon informiert. Darauf folgt ein Kommando, das den Update initialisiert. Das Zwei-Phasen-Commit ist eine Schlüsselkomponente verteilter Datenbank-Management-Systeme. Es wird benötigt, um die Datenintegrität zu gewährleisten.

- Transparenz beim Kopieren

Diese Forderung steht in engem Zusammenhang mit dem Postulat, daß ein Datenverlust im Bereich eines DB-Knotens keine Auswirkung auf das Gesamtsystem haben darf. Durch das Bereitstellen redundanter Kopien von Datenbank-Objekten gewährleistet das System ungeachtet eines potentiellen Informationsverlustes an einem oder mehreren Netzwerkknoten eine .hohe Verfügbarkeit von Daten.

- Transparenz der Tools

Alle Tools, die ein Anbieter für ein verteiltes DBMS-Produkt verfügbar macht, müssen an allen Knotenpunkten zum Einsatz kommen können. Der User sollte nicht durch die Überlegung belastet werden, welche SW-Werkzeuge er zur Manipulation von remote gespeicherten Daten einsetzen kann.

Ihren Portability Guide hat kürzlich die Unix-Herstellervereinigung X/Open in einer erweiterten und korrigierten Fassung herausgegeben. Wolfgang Raum, Leiter des Produktbereiches Dezentrale Systeme der Nixdorf Computer AG und Strategie-Manager der X/Open Group, gibt einen Überblick über den State of the Art dieser Richtlinie. Im Portability Guide sind die Interfaces der von der X/Open-Gruppe unterstützten einheitlichen Anwendungsumgebung für portable Software definiert. Ziel der ersten Ausgabe dieses Werks war es, Grundlagen für portable Applikationen festzulegen. Im einzelnen handelte es sich dabei um die Definition für Unix-System-Calls und Libraries, für die Sprachen C, Fortran und Cobol sowie die ISAM-Definition im Bereich Datenmanagement. Die wesentlichen Erweiterungen des neuen Portability Guide sind:

- Internationalisierung

Bedeutsam für den europäischen Markt ist das X/Open Native Language System (NLS). Unix basiert auf dem ASCII-7-Bit-Zeichensatz in einem amerikanischen Englisch mit eingeschränkten Möglichkeiten für andere Zeichensätze. Bei NLS handelt es sich um das erste Internationalisierungs-Interface für Unix, das beispielsweise Deutsch, Französisch, Holländisch und Italienisch unterstützt. Für die Entwicklung international ausgelegter Anwendungen einigte man sich auf die Verwendung von 8-Bit-Codes, wie sie durch die ISO festgelegt sind.

- Datenbank-Interface SQL

Die für Softwareentwickler wesentlichste Erweiterung ist die Festlegung von SQL als Datenbanksprache und Interface zu relationalen Datenbank-Management-Systemen.

Die SQL-Definition basiert auf dem ANSI-Standard und berücksichtigt ergänzend die Möglichkeiten führender relationaler DBMS-Produkte.

- Utilities

Die definierten Aufrufschnittstellen der Unix-Utilities, aufgeteilt in Standard-Utilities und Systeme für die Softwareentwicklung, entsprechen weitestgehend der System V Interface Definition (SVID) von AT&T.

- Interprozeß-Kommunikation

Für die Interprozeß-Kommunikation wurden als optionale Features die IPC-Funktionen von Unix aufgenommen. Sie sind allerdings maschinenabhängig und können nicht auf allen Hardware-Architekturen unterstützt werden. Die X/Open-Group geht davon aus, daß ein mehr genereller Ansatz für das gesamte Gebiet der Interprozeß-Kommunikation nötig ist.

Die bisher veröffentlichten Definitionen umfassen noch nicht sämtliche Komponenten, die für portable Anwendungen relevant sind. Deshalb ist die Fortschreibung des Portability Guide heute bereits auch für Bereiche wie Transaktionsverarbeitung, Netzwerke oder Kommunikation im Detail geplant.

Für Anwendungen im Bereich des Computer Aided Software Engineering hat die AEG-Tochter ATM, Frankfurt, ihr SW-System "Amdes II" ausgelegt. Das unter Unix System V lauffähige Produkt ist für die Realisierung komplexer Automatisierungssysteme gedacht. Neben Unix-Tools bietet es weitere Werkzeuge für Projektmanagement, Implementierung von Datenbanken sowie Textverarbeitungsfunktionen.