Konzepte für Datenbank-Software

Was ist denn nun eigentlich das Relationenmodell?

27.08.1976
Von Gerhard Maurer
CW-Chefredakteur Dr. Gerhard Maurer sprach mit Dr. Hartmut Döringer, Universität Mannheim

CW: Durch die Fachzeitschriften,insbesondere durch die amerikanische Literatur, geistert mit zunehmender Häufigkeit der neue Begriff "Relationenmodell" als theoretisches Konzept für neue Datenbank-Software. Was ist denn nun eigentlich das Relationenmodell?

Döringer: Der Begriff "Relationenmodell" wurde von E. F. Codd Anfang der 70er Jahre in einer Abhandlung über Datenbank-Strukturen eingeführt. Codd ist IBM-Fellow, also einer der freischwebenden IBM-Wissenschaftler, und arbeitet in IBM-Labors mit einem großen Stab von Wissenschaftlern daran, diese seine Theorie in praxis-relevante Software umzusetzen. Das Relationenmodell dient zur Beschreibung von Datenbanken auf einer logischen Betrachtungsebene, und zwar aus der Sicht des Anwenders.

CW: Das klingt noch arg theoretisch. Gegen welche Begriffe muß man dieses neue Konzept abgrenzen?

Döringer: Das Relationenmodell wurde entwickelt als Alternative zu dem hierarchischen Datenbankmodell, das in der Praxis derzeit weit verbreitet ist - etwa durch IMS oder Codasylorientiertes Datenbanksystem. Wir kennen ja bei Datenbanksystemen die logische Ebene - die allein den Anwender interessiert - und die physische Ebene der computerinternen Speicherung. Vereinfacht gesägt wird das hierarchische Modell auf der physischen Ebene vorwiegend durch Verkettungen realisiert, während das Relationenmodell durch die Speicherungstechnik des Inverted File gekennzeichnet ist. Ein solcher invertierter Datenbestand arbeitet mit Indextabellen, in denen Ordnungsbegriffen beziehungsweise Schlüsseln physische Adressen zugeordnet werden.

CW: Aber auch die hierarchischen Modelle arbeiten doch mit Indextabellen - zumindest für die Kopfsegmente der Datensätze.

Döringer: Das ist richtig, kennzeichnet zugleich aber auch den Unterschied, denn beim hierarchischen System wird man durch Indextabellen zum Kopfsegment geführt und zu den weiteren Segmenten dann durch Verkettung. Beim Relationenmodell hingegen findet der Zugriff zu allen Segmenten über eine oder mehrere Indextabellen statt.

CW: Das ist doch gar nicht so neu. Diese Zugriffsmethode ist seit langem beispielsweise im System Adabas oder im Siemens-System Sesam realisiert.

Döringer: Richtig, aber vermutlich wurde diese Methode intuitiv genutzt, ohne daß eine geschlossene Theorie dahinter stand.

Foto: alphaspirit, Fotolia.com

CW: Ist denn das so wichtig?

Döringer: Generall beschreiben Datenbankmodelle einmal die Segmentierung der Datenbank, das heißt, welche Felder beziehungsweise Attribute zu Segmenten zusammengefaßt sind. Zum anderen wird die Beziehung zwischen den Segmenten aufgezeigt, das heißt letztlich, wie zu diesen zugegriffen werden kann. Das Relationenmodell kennt nur , unabhängige Segmenttypen, das heißt letztlich, es erlaubt den Zugriff ohne Umweg über andere Segmenttypen, wohingegen solche Verkettungen das hierarchische Modell kennzeichnen. Daß nunmehr eine geschlossene Theorie des Relationenmodells vorliegt, ist deshalb wichtig, weil jetzt die optimale Strukturierung von Datenbeständen programmierbar wird.

CW: Was heißt hier "Programmierung der Datenbankstruktur"?

Döringer: Das ist zunächst noch ein Ausblick auf die Zukunft. In einem solchen logisch widerspruchsfreien Modell ist es theoretisch möglich - basierend auf einer Sammlung vorliegender Wiedergewinnungs-Anforderungen an die Datenbank -, deren optimale Strukturierung abzuleiten. Heute ist das - zumeist am Einzelfall ausgerichtet - dem Einfallsreichtum des Systemanalytikers überlassen.

CW: Zurück zur heutigen Praxis: Gibt es eine Regel dafür, wann Relationenmodell-orientierte oder Hierarchie- orientierte Datenbanksysteme angewendet werden sollten? Wo liegen jeweils deren spezielle Vorteile?

Döringer: Beide Systemarten haben spezifische Stärken und Schwächen. Hierachieorientierte Systeme werden immer dann vorteilhaft eingesetzt werden, wenn die Beziehungen zwischen den Segmenten über einen längeren Zeitraum konstant bleiben, denn in der Regel sind Zugriffe über Verkettungen schneller als Zugriffe über Indextabellen. Andererseits ist der enorme Änderungsaufwand bei Errichtung neuer Beziehungen ein erheblicher Nachteil. Gerade hier liegt die Stärke der Relationenmodell-orientierten Systeme. Neue Beziehungen können dort leicht durch Hinzufügen neuer Indextabellen realisiert werden , ohne daß die bestehenden Datenbestände reorganisiert werden müssen. Durch diesen Vorteil der leichten Anpassungsfähigkeit sind Datenbanksysteme nach dem Konzept des Relationenmodell immer dann sinnvoll, wenn mit der Datenbank sehr lebendige Anwendungen unterstützt werden.

CW: Heißt das, daß gerade für Informationssysteme im kommerziellen Bereich - um den verpönten Begriff Management-Informationssysteme zu vermeiden - Datenbank-Software nach dem Relationenmodell besser geeignet wäre?

Döringer: Von der Theorie her ist diese Frage zu bejahen. Nur so kann ich mir die rasche Verbreitung des Systems Adabas in den USA erklären. Ich vermute zudem, daß auch IBM in naher Zukunft Datenbanksoftware auf der Basis des Relationenmodells anbieten wird - als Ergebnis der Arbeiten von Codd und seinen Mitarbeitern.

CW: Welchem Konzept geben Sie für die Zukunft die größeren Chancen?

Döringer: Wie oben ausgeführt, haben auf die jeweilige Anwendung ausgerichtet, beide Arten von Datenbanken ihre Berechtigung. Die Zukunft wird wohl bringen, daß beide Konzepte zunehmend vereinigt werden, so wie es bereits in dem System NIMS geschehen ist, das - wie auch in der Computerwoche zu lesen war - in der Bundesrepublik als ein hierzulande entwickeltes Standard-Softwarepaket angeboten wird. Andererseits weiß wohl jeder, daß solche Konzepte erst dann breite Anwendung finden, wenn der Marktführer sie einsegnet.