Datenbankkonzepte der 80er Jahre:

Koexistenz von Codasyl und Relation

18.07.1980

ln den letzten zehn Jahren ist die Anzahl der Datenbankinstallationen sprunghaft angestiegen. Dies ist auf zwei Faktoren zurückzuführen: die rasch zunehmende Akzeptanz durch die Anwender und den technischen Fortschritt auf logischer, physikalischer und architektonischer Ebene. Die enorme Preisreduktion für Direktzugriffsspeicher und die Weiterentwicklung der Datenbanksysteme ermöglicht es auch kleineren und mittleren DV-Anwendern, Datenbanken einzusetzen.

Eine vor einiger Zeit durchgeführte Umfrage hat ergeben, daß etwa die Hälfte der mittleren und großen Systeme, die neu installiert werden, für Datenbankanwendungen vorgesehen sind. Es kann daher davon ausgegangen werden, daß sich der Trend zum Datenbankeinsatz fortsetzen wird und die Anforderungen der Benutzer weiter zunehmen.

Aus der Kenntnis dieser Zusammenhänge heraus ist es nur zu verständlich, daß die Entwicklung von Computer-Architekturen vorangetrieben wird, die eine größere Leistung bei der Datenspeicherung und -wiederauffindung ermöglichen. Gleichzeitig werden Anstrengungen unternommen, die Leistung der Datenbanksysteme den gestiegenen Anforderungen anzupassen. Andererseits muß jedoch die Sicherung der bisher von den Anwendern getätigten Investitionen beim Einsatz neuer Computer-Architekturen und veränderter Datenbanksysteme gewährleistet sein.

Bezogen auf den Datenbankeinsatz sind technische Neuerungen auf den folgenden Gebieten von Bedeutung:

þAnwenderschnittstellen,

þDatenbankcomputer,

þMassenspeicher-Hardware,

þverteilte Datenbanksysteme.

Dieser Artikel beschränkt sich auf die Betrachtung der Entwicklungstendenzen im Bereich der Anwenderschnittstellen und der Datenbankcomputer.

Langjährige Entwicklungen im Bereich der Anwenderschnittstellen führten zu eigenen Schnittstellen für kommerzielle Dateien und die verschiedenen Datenmodelle der gebräuchlichsten Datenbanksysteme die untereinander nicht kompatibel sind. Bei den Datenmodellen liegt das Schwergewicht beim Netzdatenmodell und dem relationalen Modell. Das Netzdatenmodell, das durch die Codasyl-Datenbankarbeitsgruppe spezifiziert wurde, ist ausgereifter und zeichnet sich durch eine relativ hohe Leistungsfähigkeit aus. Es verlangt aber vom Anwender detaillierte Angaben über Speicherstrukturen, Zugriffswege und Datenstrukturen. Dadurch wird die Flexibilität in starkem Maße eingeschränkt, denn die Zugriffswege müssen bereits zum Zeitpunkt der Datenbankladung beschrieben sein. Nachträgliche Veränderungen können nur durch Reorganisation der Datenbank, verbunden mit neuem Laden, realisiert werden. Bei der Datenspeicherung werden die Datensätze mit Zeigern (Datenbankadressen) nach den vordefinierten Datenstrukturen miteinander verbunden.

Im Gegensatz zum Netzdatenmodell ist beim relationalen Datenmodell keine Vordefinition der Zugriffswege notwendig. Der Anwender braucht auch keine Kenntnisse über die Daten- und Speicherstrukturen, wenn er mit der Datenbank arbeitet. Die Datenspeicherung und -wiederauffindung wird mittels einer hochentwickelten Datenauffindungs- und -manipulationssprache durchgeführt. Dies ist jedoch nur möglich, wenn die Datenbank jeweils umfassend wertorientiert abgesucht werden kann, um die gewünschten Informationen zu finden. Dieser Vorgang läuft bei herkömmlichen Computern, die auf vordefinierte und unter Verwendung physischer Adressen aufbauende Datenzugriffswege ausgerichtet sind, entsprechend langsam ab. Deshalb werden oft auch beim Einsatz relationaler Systeme Zugriffswege vordefiniert, um so das Tabellensuchen zu beschleunigen. Aus den genannten Gründen werden verstärkt Anstrengungen unternommen, spezielle Verarbeitungshardware zu entwickeln, die assoziative (wertorientierte) Datenspeicherung und -wiederauffindung ermöglicht.

Seit einiger Zeit wird an einer Lösung gearbeitet, die zu einer Vereinheitlichung der verschiedenen Datenbanksysteme und der Anwenderschnittstellen führen wird. Das angestrebte Ziel ist eine gemeinsame Datenbank-Architektur (siehe Abbildung 1), die eine einheitliche Verständigungs- und Beschreibungsbasis für die gebräuchlichsten Datenmodelle und die herkömmlichen Dateien darstellt. Neben einer einheitlichen Verständigungs- und Beschreibungsbasis wird mit der gemeinsamen Datenbank-Architektur noch folgendes angestrebt:

þÜbersetzung von Datendefinitionen und -manipulationen von einem Modell in ein anderes

þUnterstützung der verschiedenen Datenstrukturen in einem System,

þÜbersetzung der verschiedenen Datenmanipulationsbefehle in einem heterogen verteilten System.

Untersuchungen haben gezeigt, daß die genannten Ziele erreichbar sind. Es ist durchaus möglich, ein Netzdatenmodell in ein relationales Datenmodell zu überführen und umgekehrt. Beim Netzdatenmodell erfolgen Verbindungen zwischen den Sätzen über Zeiger. Beim relationalen Modell hingegen über Schlüsselwerte, die in den verschiedenen Datensätzen gespeichert sind. Hierzu ein Beispiel: Im Netzdatenmodell werden alle Mitarbeitersätze über Zeiger mit dem Abteilungssatz verbunden, während beim relationalen Modell die Mitarbeitersätze jeweils die Abteilungsnummer zusätzlich enthalten. Praktisch enthalten die Zeiger und die Schlüsselwerte gleiche Informationen nämlich die Verbindung Abteitung-Mitarbeiter. Somit sind sie jederzeit austauschbar.

Desweiteren ist es denkbar, herkömmliche Dateien durch Datenbank-Software zu unterstützen. Die in den Programmen enthaltenen Dateidefintionen werden vom System in eine Datenbeschreibung (zum Beispiel Subschema) umgeformt und die enthaltenen Schreib-/Lesebefehle in Datenmanipulationsbefehle umgewandelt.

Zugriff über den Wert

Der Vorteil des Konzeptes einer gemeinsamen Datenbank-Architektur besteht darin, daß die existierenden Anwendungen weiterhin genutzt und neue Anwendungen den jeweiligen Benutzerbedürfnissen entsprechend entwickelt werden können. Zwischen der gemeinsamen Datenbank-Architektur und dem Datenbankcomputer besteht ein enger Zusammenhang. Ein Datenbankcomputer bringt nur dann Vorteile, wenn er die verschiedenen Datenmodelle, insbesondere das Codasyl- und das relationale Modell, unterstützt.

Die wünschenswerte Zugriffsart auf nichtnumerische Daten ist die über den Wert. Die Architektur des Von-Neumann-Rechners ist dafür nicht geeignet. Deshalb werden die Werte jeweils in Adressen umgewandelt. Diese Technik ist, sieht man von einigen frühen Entwicklungen ab (zum Beispiel Univac File Computer, 1954), von Anfang an bei den Dateizugriffssystemen benutzt worden und wird auch bei den Datenbanksystemen verwendet. Um jedoch die vollen Möglichkeiten einer hochentwickelten Datenauffindungs- und manipulationssprache zu nutzen, wie sie beim relationalen Datenmodell Verwendung finden soll, ist es unerläßlich, die Dateizugriffe nach Wert statt nach Position zu realisieren. Es ist deshalb nicht verwunderlich, daß seit Anfang der 70er Jahre neue Architekturen entworfen wurden, die die Adressierung nach Schlüsselwerten statt nach Speicherplätzen ermöglichen sollen. Diese Entwicklungen lassen sich, wie folgt gruppieren:

- Backend-System mit konventionellen Minicomputern,

- Speicherhierarchien

- Intelligente Steuerungen,

- Datenbankcomputer.

In neuerer Zeit wurden die Bemühungen auf die Entwicklung eines Datenbankcomputers gerichtet, der die Unterstützung der unterschiedlichen Datenmodelle ermöglicht und sehr große Datenbanken bedient. In Abbildung 2 ist die Architektur eines Datenbankcomputers dargestellt, der folgende Hauptkomponenten umfaßt:

þDatenbank-Steuergerät (DBC)

þVerarbeitungselemente (P)

þSpeichermoduln (M)

þSchlüsselprozessor (Key Processor)

þParallelübertragungsplatten-Steuergerät

þParallelübertragungsplatten

Der Datenbankcomputer führt zu einer deutlichen Effizienzsteigerung hinsichtlich Datenzugriff und Verarbeitung von Datenbank-lnformationen. Die Überlegenheit des Datenbankcomputers gegenüber anderen Architekturen kommt aber erst dann zum Tragen, wenn die Datenbankanwendung einen sehr hohen Teil der Systembelastung (50 Prozent und mehr) ausmacht und viele Zugriffe auf mehrere Massendatenspeicher erfordert. Es ist auch durchaus denkbar, daß bei kleineren Systemen die Funktionen des Datenbank-Steuergerätes in Form von Software direkt im Hauptspeicher zur Verfügung gestellt wird. Dies kommt dann wiederum dem Konzept der gemeinsamen Datenbank-Architektur sehr nahe.

Zusammengefaßt kann gesagt werden, daß sowohl durch die gemeinsame Datenbank-Architektur als auch durch den Einsatz eines Datenbankcomputers wesentliche Kosten-/Leistungsverbesserungen erzielt werden können. Die angestrebten Lösungen sind auf die Bedürfnisse unterschiedlicher Anwender ausgerichtet. Besonderes Augenmerk wird dabei auf die Notwendigkeit des weiteren Einsatzes der bisherigen Anwendungen und damit der Möglichkeit zur Investitionssicherung gerichtet Ferner kann festgestellt werden, daß die Entwicklungen das Ziel verfolgen, den Anwendern die Möglichkeiten des Datenbankeinsatzes zu erleichtern.

òJohann Eichhorn ist Abteilungsleiter Anwendungen und Management-Training, Sperry GmbH, GmbH Geschäftsbereich Sperry Univac, Sulzbach/Taunus