Zukunftssichere Dateikonzipierung in der Diskussion:

Von der Datenkompression zum Datenbanksystem

07.10.1977

DORTMUND (uk) - "Offene Türen" rannte Alldata-Mitarbeiter R. Schilling mit seinem Konzept der platzsparenden und zukunftssicheren Dateikonzipierung bei den CW-Lesern ein (CW-Nr. 37 vom 9. September 1977 "Datenkompression und virtuelle Datensätze"). So sieht beispielsweise auch Dipl.-Informatiker Horst Pollmann in der totalen Mißachtung von Feldgrenzen auf der physischen Speicherebene und der daraus resultierenden Möglichkeit, Datensätze mit Reserve-"Fillern" zu "virtuellen Datensätzen" auszubauen, eine vernünftige Methode, die Kosten bei der Datenspeicherung zu senken. Er meint sogar, daß sich bei konsequenter Weiterführung des Ansatzes die Maßnahmen in der logischen Ebene, das heißt im Anwendungsprogramm, zu einem kompletten Datei-Verwaltungssystem ausweiten, dessen Möglichkeiten hinsichtlich logischer Zugriffe im Prinzip unbeschränkt seien. Genau diese Techniken werden seiner Meinung nach sogar schon in einem existierenden Datenbanksystem erfolgreich angewendet.

Und so stellt Pollmann die Verbindung zwischen den sehr weit entfernten Begriffen Datenkompression und Datenbank-System her:

R. Schilling hat das zentrale Kriterium einer wirksamen und schnellen Datenkompression klar erkannt: Die totale Mißachtung von Feldgrenzen auf der physischen Ebene - dem Speicher. Er hat weiterhin recht, wenn er als Vorteil der Datenkompression die Möglichkeit sieht, Felder beliebig groß und Tabellen beliebig mächtig zu machen. Die von ihm vorgeschlagenen Filler-Felder als Reserve sind eine vernünftige Methode, mit den gegebenen Möglichkeiten die physischen Vorteile auch auf der logischen Ebene der Satzstrukturen zu nutzen. Jedoch drängt sich hier der Vergleich auf mit Redefines-Strukturen zur Platzersparnis Beides sind Methoden, die verschiedene Aspekte vermengen, um Kosten zu senken.

Strukturunabhängigkeit auch im Anwendungsprogramm.

Verfolgt man den Gedanken der Datenkompression konsequent zu Ende, erkennt man die Notwendigkeit einiger logischer Erweiterungen, die im Endeffekt die erzielten physischen Vorurteile auch auf der logischen Ebene von verfügbar machen, ohne daß die Anwendungsprogramme hierzu einen Overhead benötigen: Aus der strukturunabhängigen Speicherung folgt, daß die Strukturunabhängigkeit auch ohne große Erweiterung auf die logische Ebene ausgedehnt werden kann. Dies bedeutet für die Anwendungsprogramme:

- nur angesprochene Felder müssen genannt werden

- die Reihenfolge der Felder im Anwendungsprogramm ist beliebig

- die Vertauschung von Feldern im Speicher ist jederzeit möglich

- die Erweiterung der Struktur um ein Feld ist jederzeit möglich, wobei der Platz des neuen Feldes im Satz hierauf keinen Einfluß nimmt.

Basiskonzept fürs File-Handling

Aus der permant variablen Satzlänge folgt, daß dem File-Handling vernünftigerweise ein Basiskonzept zugrunde zu legen ist, welches dem System gegenüber mit konstanten Werten und Parametern auftritt, das heißt, Files bestehen für das System aus Sätzen fester Länge, jeder dieser Sätze beziehungsweise Blöcke enthält eine variable Anzahl der komprimierten Sätze, wie sie vom Programm her verstanden werden. Dies bedeutet für die Anwendungsprogramme:

- die bislang aus dem File-Handling bekannten Restriktionen bezüglich Adressierung können aufgegeben werden, Fragen der Eindeutigkeit von Schlüsseln sind nun ebenso offen wie Möglichkeiten des mehrfachen Zugriffs über solche Schlüsselwerte

- Overflow-Probleme beim Einfügen neuer Sätze können in wesentlich flexiblerer Weise gelöst werden als beim normalen beziehungsweise direkten File-Handling, welches einen Satz vom logischen Inhalt heran physische Parameter wie Spurnummer etc. kettet.

Man sieht, daß die logisch flankierenden Maßnahmen schnell und zielsicher sich zu einem Datenverwaltungs-System ausweiten, dessen Möglichkeiten hinsichtlich logischer Zugriffe im Prinzip unbeschränkt sind das heißt zu einem Datenbank-System, das hinsichtlich logischer Strukturen sehr flexibel ist. Wiewohl der Sprung am Ende dieser Gedanken-Kette sehr weit zu sein scheint, sind doch die Folgerungen und ihre Begründungen - wie angeführt - sehr direkt und ohne Umwege.

* Dipl.-Informatiker Horst Pollmann ist Mitarbeiter der Gesellschaft für elektronische Informationsverarbeitung (GEI).