Mit Relationen-Modell in schönere Datenbank-Zukunft?

28.11.1975

- Das Relations-Modell wird seit kurzem in der Diskussion über künftige Datenbank-Software immer wieder angesprochen. Können Sie in wenigen Sätzen erklären, was ein relationales Datenbanksystem ist?

Das Relationen-Modell nach E. S. Codd - einem IBM-Wissenschaftler - ist ein vollständiges Datenmodell - man könnte auch Datendarstellungsmodell sagen - das im Gegensatz zu bisherigen Datenmodellen unabhängig von allen Überlegungen zur Speicherungsstruktur und Zugriffsstrategie ist. Es erlaubt dem Anwender eine besonders einfache Sicht auf seine Daten, die er sah als Sammlung von Tabellen vorstellen kann im Gegensatz zur Netzverknüpfung. Diese Tabellen heißen "normalisierte Relationen" und entsprechen in der Terminologie der herkömmlichen DV der "Datei". Der Benutzer kann sich beim Lösen seiner Aufgaben auf die problemspezifischen Aspekte beschränken und ist nicht mit Implementierungsdetails befaßt. Für den Einsatz des Relationenmodells sind deskriptive Datenmanipulationssprachen hohen Auswahlvermögens vorgesehen, mit denen der Anwender die gesuchten Mengen von Daten verarbeiten kann. Die gesuchten Daten werden, aufgrund ihres Inhaltes in vorgegebenen Tabellenspalten gefunden und nicht aufgrund ihrer relativen Position innerhalb einer Speicherungsstruktur.

- Welches sind die wichtigsten Unterschiede des Relationen-Modells zu bekannten Datenbank-Systemen wie Adabas oder IMS?

Adabas kann man, großzügig interpretiert, als ein Relationen-Modell ansehen. Wenn man in Adabas auf die Einführung von Perioden, Gruppen und mutigen Feldern verzichtet, hat man einen Satzaufbau, der dem der normalisierten Relationen entspricht. IMS hingegen hat einen hierarchischen Satzaufbau, das heißt ein Satz beinhaltet im allgemeinen neben den eigentlichen Informationen über Objekt der realen Welt auch Zugriffsinformationen zu diesem Objekt. Im Relationen-Modell hingegen ist die Zugriffsinformation vollkommen eliminiert. Zugriffsinformationen werden in tieferen System-Ebenen vollkommen unabhängig vom Datenmodell eingeführt. Für die Leistung - oder "Performance" - ist ausschließlich das DB-System einschließlich Datenmanipulationssprache, nicht die Datendarstellung verantwortlich. Wesentlich ist beim Relationen-Modell, daß mit einem Befehl immer alle Sätze einer gesuchten Menge auf einmal - also beispielsweise alle grünen Autos aus einer Kfz-Datei - angesprochen werden und nicht die einzelnen Sätze nacheinander.

- Für welche praktischen Anwendungsfälle kommen Relationale Datenbank-Systeme in Betracht?

Das Relationen-Modell ist zunächst vollkommen neutral gegenüber geplanten Anwendungen. Es wurde vor allem entworfen, um dem Benutzer unnötige Systemkenntnisse zu ersparen. Der Anwender braucht nur die Informationen über seine speziellen Anwendungen zu wissen. Es eignet sich deshalb besonders für den Nicht-Spezialisten, das heißt für Angestellte oder Laien ohne tiefere Systemkenntnisse.

- Erfordert das relationale System eine bestimmte Hardware oder eine bestimmte Mindestausstattung?

Das Relationen-Modell ist unabhängig von Hardware-Überlegungen entworfen worden. Es wurde vor allem initiiert durch die Forderung nach einem hohen Grad an Datenunabhängigkeit. An keiner Stelle wird auf bestimmte Hardware-Details Bezug genommen.

- Ist diese neue Konzeption mit allen Betriebssystemen und TP-Steuerungen, zumindest prinzipiell verträglich?

Prinzipiell ist in dem Modell, das als Schnittstelle zum Benutzer gesehen werden kann, keinerlei Information über darunterliegende Systemschichten eingeführt. Deshalb ist es prinzipiell mit allen vorhandenen Betriebssystemen kompatibel - im Einzelfall kommt es auf die genaue Implementierung an.

- Sind Ihnen schon Beispiele bekannt, daß ein Relationen-Modell irgendwo installiert ist?

Das erste mir bekannte Relationen-Modell wurde unter dem Namen RDMS von General Motors implementiert. Es ist seit einigen Jahren in der Praxis eingeführt. Darüber hinaus gibt es eine ganze Reihe von Pilot-Versionen an amerikanischen Hochschulen und Forschungsinstituten. Ein bekanntes System ist das "System R" vom IBM Research Lab in San José oder das System ZETA der Hochschule Toronto/Kanada.

- Es sind ja viele Hoffnungen auf die Codasyl-DB-Spezifikationen gesetzt worden. Dieses System hat sich nicht so schnell wie ursprünglich angenommen durchsetzen können. Ist denkbar, daß es nun übersprungen wird - in dem Sinn, daß neue Tendenzen gleich auf einem Relationen-Modell hingehen?

In der Praxis gibt es eine ganze Reihe von implementierten Codasyl-Versionen entsprechend dem Data-Base-Task-Group-Vorschlag von 1971. Dieser Vorschlag ist vom wissenschaftlichen Standpunkt einer Entwurfs-Methodologie von Datenbank-Systemen unbefriedigend. Deshalb wird er auch laufend weiterentwickelt, und zwar in Zusammenarbeit eines Codasyl-Komitees mit dem ANS-Komitee, das in den USA für entsprechende Normierungen zuständig ist. Dabei wurden viele Gesichtspunkte berücksichtigt, die sich in der Diskussion um das Relationen-Modell ergaben. Ein wesentlicher Gesichtspunkt ist die Aufteilung der Entwurfs, Informationen auf verschiedene Ebenen, ein sogenannter Mehrschichten-Entwurf.

- Glauben Sie, daß es zu einer Koexistenz der bisher bekannten und der neuen, Relationen-Modelle kommen wird oder daß sich im Laufe der nächsten Jahre aus den verschiedenen Konzeptionen neue, sozusagen gemischt Systeme ergeben werden?

Es gibt in der Forschung verschiedene Ansätze, die auf Systeme hinauslaufen, die mehrere Datenmodelle unterstützen. Es gibt jetzt schon Beispiele, wo ein Relationen-Interface über ein Datenbanksystem nach dem Codasyl-DBTG-Vorschlag gebaut wird, etwa die Kombination des rein relationalen Dokumentationssystems Feldok mit dem TK-440-Datenbanksystem nach Codasyl-Modell.

- Wo können sich denn heute Interessenten informieren, die sich mit dem Relationen-Modell beschäftigen wollen? Gibt es beispielsweise ein besonders empfehlenswertes Buch?

An Literatur existiert im, deutschen Sprachraum ein zusammenfassendes Buch "Datenbanksysteme I" von Professor Dr. Wedekind (Verlag Bibliografisches Instituts Mannheim). Ein anderes empfehlenswertes Lehrbuch ist, kürzlich von Chris Date erschienen: "An introduction to Data Base Systems" (Systems Programming Series, Verlag Addison-Wesley Reading Mass).

Dr.-Ing. Theo Härder, (30)

ist wissenschaftlicher Mitarbeiter in der Forschungsgruppe Datenverwaltungssysteme im Fachbereich Informatik der Technischen Hochschule Darmstadt. Er beschäftigt sich seit zweieinhalb Jahren speziell mit Datenbanksystemen und arbeitet zur Zeit an Entwurfsfragen zu DB-Systemen nach dem Relationen-Modell. Sein Hauptkummer: die Implementierung eines funktionsfähigen Modells ist an einer Hochschule wie Darmstadt nicht möglich, weil die Fluktuation der Studenten zu groß ist, als daß Arbeiten größeren Umfangs mit ihnen in Angriff genommen werden könnten. Er wird deswegen 1976 zum IBM-Forschungslabor nach San José gehen, um dort an der Implementierung des DB-Systems "R" (nach dem Coddschen Relationen-Modell) mitzuarbeiten - ein Modell, von dem IBM bisher stets betonte, daß es rein wissenschaftlichen Zwecken diene und daß daraus keine Schlüsse auf künftige kommerzielle Produkte gezogen werden könnten.