Alte Hüte und ausgetretene Pfade - wo bleibt die Kritik?

07.02.1992

Hans J. Drucks, Logos Ges. für Wissensbasierte Systeme, Seebarn, Österreich

Jedermann in der Computerwelt besitzt heute Wissen über relationale Datenbankmanagement-Systeme (RDBMS). 20 Jahre nach Codds Arbeit über das relationale Datenmodell (RDM) sind relationale DBMS zum Handwerkszeug eines jeden Designers geworden. Diese Werkzeuge sichern die Portabilität der Applikation auf jeder wichtigen Plattform.

Aussagen über die Elemente von relationalen DBMS bringen kaum noch etwas Neues. Man läuft auf eingetretenen Wegen. SQL ist eine Public-domain-Definition des Coddschen Datenmodells. Jeder hat sie oder wird sie haben.

Einige Leute sind mit SQL, sehr reich geworden. Sie haben uns portable Datenbanksysteme gebracht. Doch auch das Geschäft dieser SQL-Pioniere läuft nicht mehr so wie früher. Es fehlt das Neue, das ihnen in jedem Jahr die Umsätze zu verdoppeln half Ihr Problem ist, daß sie nicht mehr die Bedürfnisse des Marktes treffen. SQL-Benutzer leiden an den Defiziten des RDM. Aber die Hersteller machen immer noch Business as usual: Sie führen weiterhin inkrementelle Verfeinerungen ein. Neue Versionen sind gut für das Geschäft.

Darum ist es an der Zeit, den Verstand zu gebrauchen. Das RDM beruht auf einer halbseitig gelähmten Relationentheorie. Der alte "sales pitch", das RDM baut auf Mengenlehre und Prädikatenlogik, sagt nur die halbe Wahrheit. Wahr ist, es schränkt sowohl Mengenlehre wie Logik drastisch ein.

Relationen sind bekanntlich Teilmengen von Cartesischen Produkträumen. Was soll man von einem Datenmodell halten, das zwar auf solchen Teilmengen aufbaut, aber den Begriff "Teilmenge" gar nicht kennt? Das ist so, als erkläre man den Begriff "Wald" als eine Menge von Bäumen, ohne zu sagen, was ein "Baum" ist. Oder man definiert die "Vereinten Nationen" ohne den Begriff "Nation".

Eine Reihe innovativer Unternehmen hat sich über Venturecapitalists die Finanzierung neuer Produkte im Datenbankbereich gesichert. Das ist an sich nichts Neues. Auch die Relational Technology Inc. (RTI) hatte ihr Ingres so finanziert. Weil aber Stonebraker und Genossen sich nicht von alten Zöpfen trennen konnten, ging ihnen schließlich die Luft aus.

Neu dagegen ist, daß Banker die Defizite des RDM einsehen und ihr Geld in die Entwicklung von objektorientierten DBMS stecken. Die SQL-Benutzergruppen hatten da viel weniger Erfolg. Ihre Bemühungen waren bisher vergeblich, die Hersteller von den Mängeln ihrer Produkte zu überzeugen. Die traditionellen RDBMS-Hersteller machen weiter eine Vogel Strauß-Politik. Man tut so, als gebe es die Defizite des RDM überhaupt nicht.

Die traditionellen RDBMS beschränken die Ausdruckskraft der Relationentheorie auf symmetrische Relationen. Wenn man einen elementaren Sachverhalt mit SQL definiert, dann spielt bekanntlich die Reihenfolge der Attribute keine Rolle. Die Spalten lassen sich beliebig vertauschen. Für diese Bequemlichkeit ist allerdings ein hoher Preis zu zahlen. Man kann nämlich keine Strukturen definieren. Ohne Strukturen aber, insbesondere ohne Ordnungsstrukturen, hätten wir keine moderne Mathematik, keine formale Logik und weder Physik noch Ingenieurwissenschaften.

"Ordnung" ist ein Begriff, den die Relationentheorie erklärt. Die heutigen RDBMS kennen aber keine Definition von Ordnung. Das Ganze und seine Teile, ein Früher und Später oder auch eine Frage-und-Antwort-Beziehung lassen sich nicht definieren. Der große deutsche Mathematiker David Hilbert hat einmal gesagt: "Wenn sich der Horizont eines Menschen auf einen Punkt zusammengezogen hat", dann sagt er: "Ich stehe auf dem Standpunkt, daß...". Codds RDM steht auf dem Standpunkt, daß die Welt mit symmetrischen Relationen dargestellt werden kann. Diese groteske Annahme stellt das zentrale Problem des Coddschen Datenmodells dar.

Die Annahme schließt die Definition einer "logischen Folgebeziehung" aus. SQL-Benutzer können zwar große Mengen von Tatsachenwissen in Tabellen sammeln, aber was aus diesen Tatsachen folgt, bleibt ihnen verschlossen. Die Welt des Relationenmodells kennt keine logischen Schlüsse.

Logische Schlüsse sind aber nichts anderes als binäre antisymmetrische Relationen. Diese lassen sich in dein RDM nicht definieren. Das RDM ist ein Relationenmodell mit mangelhaften Kenntnissen der Relationentheorie.

Das RDM benutzt Begriffe der Mengenlehre, kennt aber die wichtigsten, Grundbegriffe der Mengenlehre nicht. SQL erlaubt weder eine Definition der Elementbeziehung noch die der Teilmengenbeziehung oder der Gleichheit von Mengen. Unsere Schulanfänger wissen mehr über Mengenlehre als relationale DBMS.

Die Folge dieser Unwissenheit ist ein Mangel an Ausdrucksfähigkeit. Dem Designer fehlen einfach die richtigen Begriffe, um die Welt darzustellen. Neue Konzepte für Datenbanksysteme erweitern die sprachliche Enge und Blindheit des RDM:

- Objektorientierte DBMS erweitern die Ausdrucksfähigkeit, um strukturierte Entitäten darzustellen und zu manipulieren;

- Deduktive DBMS oder Expert-Datenbanksysteme implementieren die logische Folgebeziehung.

- Knowledge Base Management Systems (KBMS) unterstützen beliebige Wissensdarstellungen und stellen dazu passende Inferenzmechanismen bereit.

Die notwendigen Grundlagen für verbesserte DBMS hat die Forschung in Mathematik und Logik seit Jahrzehnten bereitgestellt. Zwei große Mathematiker und Logiker sind besonders zu erwähnen: Charles Sanders Peirce (1839-1914) und Gerhard Genzen (1909-1945). Peirce verdanken wir die Grundlagen der Relationentheorie. Seine "Logic of Relatives" hat uns eine grafische Beweismethode von überraschender Einfachheit geliefert. Peirces "Existentielle Grafen" sind gute Hilfsmittel, um die heutigen CASE-Methoden mit Inferenztechniken zu bereichern. Gentzen hat ein logisches System geschaffen, das die Grundlagen für die Entwicklung von allgemeinen wissensbasierten Systemen bereitstellt. Die traditionelle Datendefinition der RDBMS ist nur ein trivialer Sonderfall der Gentzen-Formeln.

Auf internationalen Konferenzen führt die Industrie Klage über die Unzulänglichkeiten der heutigen KI-Methoden. Es fehlt eine wirksame KI/DBMS-Integration. Die Volkswagen AG hat aus Mangel an brauchbaren Werkzeugen für wissensbasierte Anwendungen das "Gentzen-Institut" an der TU München großzügig gefördert. Wenn das einen Anstoß zu einer Erweiterung des Relationenmodells auf der Grundlage von Gentzen-Formeln gäbe, dann würde das eine neue Epoche von relationalen DBMS einleiten. Nach den enttäuschenden 30 Jahren der KI-Forschung wäre eine solche Initiative nichts Geringeres als der Beginn einer praxisnahen Entwicklung von intelligenten Systemen.

"Aufklärung ist der Ausgang des Menschen aus seiner selbstverschuldeten Unmündigkeit. ... Habe Mut,

deines Verstandes zu bedienen. "

Immanuel Kant, in " Was ist Aufklärung? ", 1785