Datenbank-Konzepte in der Diskussion:

Kein DBMS kann schlechtes Design verhindern

27.05.1983

Der Verwaltungssoftware einer Datenbank, dem Datenbank-Managementsystem (DBMS) kommt eine besonders hohe Bedeutung zu. Ihre Leistungsfähigkeit entscheidet darüber, wie Flexibel und mit welchem Aufwand man sich zukünftigen Anforderungen an die Datenhaltung wird anpassen können. Entscheidend für die Entwicklungsfähigkeit eines DBMS aber ist die Konzeption, die ihm zugrunde liegt.

Drei Ansätze haben sich im Bereich der Datenbanktheorie für die Beschreibung von Datenmodellen, also logischen Datenstrukturen, herausgebildet:

- Hierarchie-Datenmodell,

- Netzwerk-Datenmodell und

- Relationen-Datenmodell.

Im Mittelpunkt der Beurteilung einer DB-Software stehen Fragen nach der Leistungsfähigkeit im Bereich der Datenorganisation.

Im einzelnen bedeutet dies:

- Welche Strukturierungssmöglichkeiten bietet das DBMS zur Abbildung logischer (konzeptioneller) Datenstrukturen?

- Welche Zugriffspfade werden angeboten, um Daten wiederzugewinnen?

- Welches Adressierungskonzept wird eingesetzt?

- Wie reorganisationsfähig ist das DB-System?

Wie unterschiedlich einzelne DBMS sich hierbei verhalten können, soll an drei beispielhaften Systemen erläutert werden:

Adabas als relational orientiertes System, IMS als hierarchisch orientiertes System und UDS als netzwerkorientiertes System.

Aus den Anforderungen der Anwendungssysteme beziehungsweise der Endbenutzer läßt sich eine konzeptionelle das heißt systemneutrale Datenstruktur methodisch ableiten (ANSI-Schichtenmodell). Diese Struktur hat den entscheidenden Vorteil, noch keine DB-spezifischen Restriktionen berücksichtigen zu müssen.

Adabas bietet zur Abbildung einer derartigen Struktur zwei Strukturierungsmöglichkeiten:

- relationale Koppelung durch Schlüsselredundanz

- multiple Felder und Periodenfeldgruppen.

Die Koppelung über Schlüsselredundanz ist in hohem Grade flexibel, da sie Datensätze über Feldinhalte verbindet und nicht über interne Adreßverweise. Allerdings muß dabei bedacht werden, daß die Pflege einer derartigen Koppelung dem Anwender obliegt und vom System nicht erzwungen wird.

Multiple Felder und Periodenfeldgruppen erlauben auch die Zusammenfassung mehrerer konzeptioneller Satztypen zu einem Adabas-Satztyp, da hierbei einzelne Felder oder Feldgruppen mehrfach vorkommen können. Allerdings müssen hier eine Reihe von Restriktionen (zum Beispiel Mengenangaben) berücksichtigt werden.

IMS unterstützt als hierarchisch orientiertes DBMS hauptsächlich Bausstrukturen. Diese streng hierarchische Strukturierung der Daten läßt sich allerdings durch die Verwendung sogenannter logischer Beziehungen zwischen einzelnen Baumstrukturen (IMS-Datenbanken) durchbrechen.

Zugleich wird aber der interne Verwaltungsaufwand in erheblichem Maße erhöht. Auch die Einschränkungen, daß der Einstieg in eine Baumstruktur nur über die "Wurzel" (Root-Segment) erfolgen kann, wird durch die Möglichkeit der Index-DB (Sekundärindizierung) im allgemeinen aufgehoben.

Schlüssel zu den Daten

UDS, ein Vertreter der Codasyl-DBMS, bietet als Basiselement der Strukturierung die Owner-Member-Zuordnung (SET). Aus diesem Basiselement lassen sich beliebig komplexe Netzwerke bilden, wobei auch mehrere SET-Beziehungen zwischen zwei UDS-Satztypen realisiert werden können. Das Navigieren in dieser Datenbank setzt allerdings die genaue Kenntnis der Struktur voraus.

Grundlage für die Ablage und das Wiederauffinden von Daten in einer Datenbank ist die Datenbankadresse. Sie indentifiziert einen Satz eindeutig in der Datenbank. Das der Adressierung zugrunde liegende Konzept hat daher entscheidenden Einfluß auf die Flexibilität und Reorganisationsanfälligkeit eines DB-Systems.

Adabas verwendet als DB-Adresse einen konstanten systhetischen Schlüssel. Das System vergibt für jeden neuen Satz quasi eine laufende Nummer (ISN, interne Satznummer), die sich während des Systembetriebes nicht mehr verändert. Die Zuordnung dieser Adresse zur physischen Position des Satzes wird in einer Tabelle (Adreßkonverter) vorgenommen.

UDA verfolgt ein ähnliches Konzept. Auch hier besteht die DB-Adresse zunächst aus einem synthetischen Schlüssel (log. Data-Base-Key), der in einer Tabelle (DBTT) in eine physische Adresse übersetzt wird.

Allerdings wird aus Gründen der schnelleren Adressierung der DB-Adresse auch die physische Adresse als "Portable Position Printer" (PPP) hinzugefügt.

IMS verwendet als DB-Adresse im allgemeinen die physische Position des Satzes. Damit wird der Verwaltungsaufwand einer Übersetzungstabelle vermieden und die Adressierung beschleunigt. Allerdings müssen bei einer Veränderung der physischen Position eines Satzes alle DB-Adressen, die auf diesen Satz verweisen, geändert werden.

Ausgefeilte Invertierungstechnik

Die Zugriffspfade eines DBMS sollen dem Anwender ein möglichst effektives Wiederauffinden von Daten einer Datenbank ermöglichen.

Für die Realisierung von Zugriffspfaden für Prämienschlüssel, also der eindeutigen Adressierung von Datensätzen, bieten die Systeme im wesentlichen die gleichen Möglichkeiten an. Neben einem Random-Zugriff über ein Hash-Verfahren kann der Zugriff auch über eine Indextabelle realisiert werden.

Adabas - Adams Deskriptor

UDS - Calc, Painter-Array

IMS - HDAM, HIDAM

Für IMS gilt allerdings die Einschränkung, daß diese Zugriffspfade nur für das Root-Segment realisiert werden können. Diese Annäherung der Techniken und Verfahren ist auch bei den Zugriffspfaden für Sekundärschlüssel zu beobachten. Während bisher vor allem Adabas mit einer ausgefeilten Invertierungstechnik beeindruckte, ermöglicht jetzt auch das UDS - also ein Netzwerk-DBMS - eine Auswertung komplexer Auswahlbedingungen allein durch Tabellenbearbeitung (Pointer-Array, Search-key) bevor auf die eigentlichen Datensätze zugegriffen wird.

Bedeutsame Unterschiede ergeben sich allerdings bei der Betrachtung der Verbindungszugriffspfade.

Die Realisierung einer Verbindung zweier Satztypen durch physisch zusammenhängende Speicherung bieten noch alle drei Systeme:

- Adabas Periodenfeldgruppen

- IMS HISAM

- UDS LIST

Die Verkettungstechnik wird nur von IMS HIDAM/HDAM) und von UDS (CHAIN) angeboten. Allerdings müssen hier die oben beschriebenen unterschiedlichen Adressierungstechniken bei der Beurteilung dieses Zugriffspfades berücksichtigt werden.

Dem Vorteil der schnelleren sequentiellen Abarbeitung einer "Kette" steht hier der Nachteil gegenüber, daß sich der Zugriffspfad direkt in den Datensätzen befindet. Die Folge ist, daß bei Adreßänderungen die Datensätze immer bewegt werden müssen. Aus den Datensätzen ausgelagerte Verbindungszugriffspfade kennen die Systeme Adabas (Deskriptoren, Dateikoppelung) und UDS (Pointer-Array).

Reorganisation ist das Damoklesschwert

Das Leistungsverhalten der Zugriffspfade eines DB-Systems ist aufgrund der Datenbewegung während des Systembetriebes nicht konstant.

Tritt eine erhebliche Verschlechterung des Zeitverhaltens ein, so muß eine Reorganisation, also eine Optimierung der Zugriffspfade vorgenommen werden. Wichtige Fragen in diesem Zusammenhang sind demnach:

- Welche Mittel bietet das DBMS, den Zeitpunkt der Reorganisation möglichst weit hinauszuschieben ?

- Wodurch wird der Aufwand einer Reorganisation verringert beziehungsweise erhöht?

Bestimmt wird der Aufwand für die Reorganisation entscheidend durch das jeweilige Adressierungskonzept. Hier wirkt sich eine konstante DB-Adresse wie bei Adabas und UDS positiv aus, während die physische DB-Adresse bei IMS die meisten Probleme bereitet.

Aufwandsverringernd wirkt sich auch die Trennung der Systemdaten (Zugriffspfade) von den Anwenderdaten aus, wie es bei Adabas und UDS (Pointer-Array) der Fall ist. Letztlich sollte die Möglichkeit einer partiellen Reorganisation für Teile der Datenbank gegeben sein. Das Multi-File-Konzept von Adabas bietet hier die meiste Flexibilität.

Der Zeitpunkt einer notwendigen Reorganisation kann das DBMS durch dynamische Maßnahmen hinausschieben. So verhindert eine dynamische Freispeicherverwaltung bei Adabas und UDS (Page-Konzept) eine Zerstückelung des freien Speicherraumes (Speicherfragmentation). Das setzt allerdings ein adressierungskonzept mit einer Konstanten DB-Adresse voraus. Da dies bei IMS nicht gegeben ist kann es hier hingegen zu einer Speicherfragmentation kommen.

Abgesehen von allen Unterschieden zwischen den einzelnen DBMS ist für den optimalen Einsatz eines DB-Systems eine Voraussetzung unerläßlich: Die exakte Beschreibung der Anforderung an die Datenhaltung in Form einer systemneutralen konzeptionellen Datenstruktur bildet die Basis für den gezielten Einsatz der jeweiligen Systemmöglichkeiten.

*Hartmut Skubch ist Bereichsleiter DB/DC-Systeme bei EDV Studio Ploenzke, Wiesbaden.