Das Zeitalter der alphanumerischen Datenverarbeitung geht zu Ende

Im Trend der 90er Jahre Videoclips aus der Datenbank

29.06.1990

Bis heute waren Datenbanken hinsichtlich der Datentypen, die sie bearbeiten konnten, stark eingeschränkt. Datenfelder blieben auf kurze Buchstaben oder Zahlenketten beschränkt, jetzt kommt eine neue Generation von Datenbanken auf den Markt, die in der Lage ist, alle Typen computergestützter Daten zu speichern und abzufragen - von langen Textdokumenten bis zu grafischen und akustischen Informationen.

Betrachtet man die jüngere Geschichte der Datenbank-Management-Technologie, beeindrucken die erreichten Fortschritte. Mächtige OLTP-Anwendungen - einige versorgen hunderte von Benutzern - sind nicht mehr an große Mainframes gebunden, sondern können vielfach durch preiswerte Midrange-Systeme verwaltet werden.

Die Ausbreitung von Standard-Betriebssystemen, etwa Unix, hat die Welt des Informations-Managements demokratisiert. Eigenschaften wie hohe Leistung, Fehlertoleranz, hohe Datenintegrität und Sicherheit stehen nun kleinen und mittleren Unternehmen, Arbeitsgruppen sowie Zweigniederlassungen großer Unternehmen zur Verfügung.

Den Weg für neue Anwendungen geebnet

Das Preis-Leistungs-Verhältnis Unix-basierter Datenbanksysteme wurde stetig verbessert. Die Mainframe-Mächtigkeit von vor zehn Jahren ist heute zu einem Preis zu haben, der in ein Abteilungsbudget paßt. Außerdem haben 4GLs, ausgefeilte relationale Datenbanken und Schnittstellen mit Fenstertechnik den Weg für neue Anwendungen geebnet.

Trotz dieser Fortschritte leiden die meisten heutigen Datenbankwerkzeuge unter einem erheblichen Nachteil. Bei all ihrer Ausgefeiltheit sind sie lediglich dazu bestimmt, Bits zu verwalten - Text, Zahlen, knappe Fakten, die gespeichert, sortiert und wiederaufgefunden werden können. So brauchbar diese alphanumerischen Fakten sind - sie stellen doch nur einen Bruchteil der Informationen dar, mit denen wir tagtäglich konfrontiert werden.

Die typische Bürolandschaft

Ein kurzer Blick in ein typisches Büro zeigt die Verschiedenheit der Informationen, mit denen wir umgehen. Dort wandern Bücher und Artikel, Memos und Berichte über die Schreibtische. Viele von ihnen enthalten Tabellen, Diagramme, Grafiken und Bilder. Da wird über Telefon oder den Anrufbeantworter kommuniziert. Vielleicht existiert auch noch eine Faksimile-Maschiene oder ein Kopierer, um visuelle Informationen zu verwalten.

Diese Illustration gibt die zukünftige Richtung der Datenbankevolution quasi vor. Die Entwicklung der Datenverarbeitung im Büro war bis heute ein Prozeß der Automatisierung von Funktionen, die vorher mittels traditioneller Werkzeuge - Schreibmaschine, Papier und Bleistift, Tischrechner - erledigt wurden. Wenn weiterhin Fortschritte zu verzeichnen sein sollen, müssen neue Datenbankprodukte den gesamten Bereich nützlicher Informationsquellen abdecken, von kompletten Texten über Fotos bis hin zu Tondokumenten. Kurz: Benötigt wird eine multimediale Datenbank.

Hardwarebeschränkungen von einst sind heute kein Thema mehr. Die jüngsten Desktop- und Multiuser-Bürosysteme verfügen über Einrichtungen wie große Speicherkapazitäten, exzellente Grafik- und Audio-Funktionen. Heute existiert eine Vielzahl von Peripheriegeräten zur Dateneingabe, Dokumenten-Scanner ebenso wie Video-Interfaces. Es ist nun an der Datenbanksoftware, diese Quellen zu nutzen und die Büroautomation auf die nächste Stufe zu heben.

Die Möglichkeiten sind unbegrenzt. Man kann sich kaum ein Gebiet vorstellen, das nicht von der multimedialen Technologie profitieren könnte. Einzel- und Großhändler könnten Lagerhaltungssoftware einsetzen, bei der nicht nur Teilenummern und -namen, sondern auch Bilder der betreffenden Produkte dargestellt werden.

Immobilienmakler könnten interaktive Programme einsetzen, die den Kunden nicht nur eine Liste der zum Verkauf anstehenden Häuser anbieten, sondern auch farbige Fotos von Einrichtungen, Etagengrundrisse und deren geographischer Lage präsentieren. Kunden werden sogar per Video-Spaziergang durch ausgewählte Objekte geführt, alles vom Stuhl vor dem Desktop-Computer aus.

Trainingssoftware für Flugzeugmechaniker könnte nicht nur schriftliche Erklärungen liefern, sondern auch anschauliche Diagramme von Triebwerken und wirklichkeitsgetreue Geräusche erzeugen, die für Diagnose-Entscheidungen nützlich wären.

Man benötigt eine vollständige Datenbank, um Anwendungen wie die eben geschilderten zu verwirklichen. Mit anderen Worten, eine multimediale Datenbank ist kein computerisierter Karteikasten und nicht nur ein Stellvertreter für die Dateiorganisation eines Betriebssystems. Solche Dateisysteme bieten eine elementare Methode für die Speicherung nicht-alphanumerischer Informationen. Ein Benutzer kann den digitalisierten Zeichnungen einen Dateinamen zuordnen, diese abspeichern und später auf sie zugreifen, indem er die richtige Datei aus einer Namensliste selektiert, vorausgesetzt er weiß, wie die Datei heißt.

Die multimediale Datenbank geht viel weiter, indem sie Informationen schnell und effizient auffindet - mit Hilfe einer ganzen Reihe von Cross-Referenz und Sortierungsmöglichkeiten. Zeichnungen, digitalisierte Fotos und Tonaufzeichnungen sind alle als Felder in Datenbank-Records gespeichert. Als solche sind sie mit anderen Feldern und Records verbunden. Diese Verbindungen nutzt die Datenbank, um komplexe Abfragen seitens der Benutzer zu beantworten.

In dem oben beschriebenen Immobilien-Beispiel könnte der Benutzer damit beginnen, die Suche mittels einer Liste aller Häuser in einer bestimmten Gegend, die unter 500000 Mark kosten, zu starten. Der Anwender erhält eine Zusammenstellung mit den Adressen, Preisen und Kurzbeschreibungen erschiedener Häuser.

Via "Point-and-click" mit Hilfe einer Maus kann der Benutzer nach weiteren Informationen hinsichtlich spezifischer Eigenschaften fragen. Die Antwort des Computers könnte darin bestehen, daß er ein farbiges Bild von der Außenansicht des Hauses wiedergibt, zusammen mit einem Etagenplan. Durch weiteres "Point-and-click" auf verschiedene Teile des Etagenplans könnte der potentielle Käufer digitalisierte Fotos verschiedener Räume aufrufen.

Neben Such- und Retrieve-Funktionen muß eine multimediale Datenbank ihre vielfältigen Informationstypen mit all den herkömmlichen Möglichkeiten ausstatten, die auf alphanumerische Daten Anwendung finden. Die Antwortzeit der Datenbank, ein kritischer Faktor in Mehrfachbenutzer-OLTP-Umgebungen, muß kurz bleiben.

Datensicherheit bleibt eine zentrale Forderung

Die Datenbank hat ihre Daten gegen unsachgemäße Bedienung, unautorisierten Zugriff oder Datenverlust durch technische Fehler zu schützen. Die Informationen, die in Datenbanken gehalten werden, sind oft geschäftsentscheidend für ein Unternehmen. Firmen brauchen daher die Garantie, daß ihre Daten jederzeit sicher und verfügbar sind.

Datenbanksoftware muß also alles unterstützen, was als "ACID"-Eigenschaft bekannt ist: Atomicity, Consistency, Integrity und Durability. Atomicity meint, daß entweder alle oder keine Änderungen im Verlauf einer Transaktion Berücksichtigung zu finden haben. Es dürfen also keine partiellen Transaktionen ihren Weg bis in permanente Records fortsetzen.

Ereignet sich während einer Transaktion ein Systemzusamrnenbruch, darf keine der Änderungen, die während der Transaktion gemacht wurden, Eingang in die wiederangelaufene Datenbank gefunden haben. Konsistenz bedeutet, daß die Transaktionsverarbeitung eine Datenbank jeweils von einem konsistenten Zustand in den nächsten überführt. Eine nicht vollendete Transaktion darf dem Benutzer niemals "sichtbar" gemacht werden, bevor sie nicht vollständig abgeschlossen wurde.

Isolation (Durability) bedeutet, daß die Arbeit eines Benutzers sich nicht mit der Arbeit eines anderen überschneiden darf. Die Benutzer werden deshalb davon abgehalten, Records zu lesen oder zu verändern, die gerade von einem anderen Benutzer bearbeitet werden. In der Praxis erreicht man das mit Hilfe einer Reihe von Sperrprotokollen. Das Überdauern bezieht sich auf Rettung wichtiger Informationen, selbst im Falle eines System- oder Peripheriefehlers. Wiederalaufverfahren müssen so entworfen sein, daß die Resultate vollständig durchgeführter Transaktionen, die im Verlauf eines Systemabsturzes verloren gingen wieder rekonstruierbar sind. Auf das Thema Datenintegrität muß hier sicherlich nicht besonders hingewiesen werden.

DBMS anerkannte Plattformen

Schließlich sollte die multimediale Datenbank über all die Möglichkeiten verfügen, die sowohl Benutzer als auch Programmierer benötigen. Mit anderen Worten: Programmierer müssen in der Lage sein, zur Manipulation nicht -alphanumerischer Daten SQL (Structured Query Language) einsetzen zu können.

SQL ist die Standard-Abfragesprache, mit der Anwendungsprogramme und Datenbanken kommunizieren. Mit ihr verfügt der Programmierer über ein einfaches Mittel, um Datenbankfunktionen wie das Einfügen oder Löschen von Informationen aufzurufen. SQL-basierte relationale Datenbank-Management-Systeme sind heute eine allgemein anerkannte Plattform, auf der neue kommerzielle Anwendungen entwickelt werden. Darum muß eine multimediale Datenbank für SQL zugänglich sein.

Alle Daten in ihrer Gesamtheit - alphanumerische, Volltext-, grafische oder akustische Informationen - müssen zu einem integralen Bestandteil innerhalb des errichteten Datenbank-Management-Rahmens gemacht werden. Das ist leichter gesagt, als getan. Die Herausforderung, der sich eine multimediale Datenbank stellen muß, ist die außerordentliche Größe der Datenobjekte, die sie verwalten muß. Im Kontrast zu den wenigen Bytes, die benötigt werden, um konventionelle Datenfelder zu beschreiben, verbraucht ein Kalkulationsblatt, ein Textdokument oder eine farbige Grafik zwischen 50 KB und mehreren MB.

Das Zauberwort der Technik heißt "BLOB"

Elemente dieser Größenordnung sind zu unhandlich, als daß konventionelle Datenbankmechanismen damit umgehen könnten. Neue Techniken sind erforderlich, wenn effiziente Operationen sichergestellt werden sollen.

Heute gibt es eine neue Kategorie von Datentypen, genannt Binary Large Objects (große Binär-Objekte) oder kurz: "BLOBs", um Felder zu definieren, die multimediale Objekte beinhalten sollen. Ein BLOB kann eine Bit-Abbildung digitalisierter Fotos oder eine Menge ASCII-Zeichen -etwa ein langes Dokument repräsentierend übertragen. Aus der Sicht der Datenbankmaschine ist der Inhalt der BLOBs irrelevant. Die Datenbank behandelt das BLOB als integrale Einheit, genau wie andere Felder auch - ohne Rücksicht auf seine innere Struktur.

Die objektorientierten Datenbanken tragen dagegen in ihren Datenobjekten eine Vielzahl inhärenter Eigenschaften. Objektorientierte Daten sind zu komplex, um sie hier besprechen zu können. Es genügt zu bemerken, daß solche Produkte primär in technisch-wissenschaftlichen Umgebungen angetroffen werden und für kommerzielle Geschäftsanwendungen weniger geeignet sind. Der Grund: Obiektorientierte Datenbanken erfordern den Einsatz objektorientierter Programmiersprachen, mit denen die Mehrzahl der kommerziellen Software-Entwickler nichts anzufangen wissen.

Leistung und Speicherverbrauch

Wesentliche Herausforderung beim Design multimedialer Datenbanken ist die Verwaltung von BLOBs, ohne daß Leitung oder Speicherkapazität in Mitleidenschaft gezogen werden. Bei konventionellen Multiuser-Datenbanken werden Informationen im Speicher gehalten, um Plattenein- und -ausgaben zu reduzieren und die Leistung zu verbessern.

Wenn ein Benutzer ein Record anfordert, wird ein Block von der Platte ins RAM kopiert, wo die Datenbank vollständig vorhanden ist. Das RAM ist verteilt; zusätzliche Benutzer, die Zugriff auf das Record nehmen wollen, arbeiten mit demselben Record, das der anfängliche Benutzer in Gebrauch hatte.

Das macht mehr Sinn, als für jeden Benutzer eine extra redundante Kopie anzufertigen, was unnötig RAM verbrauchen und letztendlich die Leistung herabsetzen würde (da das Lesen und Beschreiben von Platten - ein wesentlicher Leistungshemmer - viel öfter durchgeführt werden müßte). Dieses Verfahren mußte bei multimedialen Datenbanken jedoch modifiziert werden, da ein BLOB so groß sein kann, daß es ohne weiteres den geteilten Speicher ausfüllt und somit wenig Raum für andere Daten übrig ließe.

Viele Möglichkeiten eröffnen sich, um Technologien für multimediale Datenbanken in neue Richtungen zu erweitern. Zukunftsvisionen weisen auf fortgeschrittene Merkmale wie Volltext-Recherche hin, mit der Benutzer Text-BLOBs auffinden, die über kombinierte Schlüsselwörter, welche in diesen enthalten sind, selektiert werden können.