Datenbanken/Eine neue Generation von Front-end-Werkzeugen fuer Decision-Support-Systeme Olap: Praezisere Information durch mehrdimensionale Sicht

13.10.1995

Von Tiemo Winterkamp*

Eine neue Sicht auf die Daten erlaubt schnellere und flexiblere Antwort auf Anfragen zur Unterstuetzung von Entscheidungen. Decision-Support-Systeme (DSS) werden effizienter durch sogenannte Dimensionen im Zusammenhang mit dem Online Analytical Processing (Olap).

Am Beispiel Umsatz laesst sich verdeutlichen, was der Begriff Dimension meint. Der Umsatz hat in der Regel einen Bezug zu einem Produkt sowie zu einem Verkaufsgebiet und einem bestimmten Zeitraum. Weitere Bezugsgroessen sind denkbar, und auch der Umsatz selbst setzt sich aus Einzelwerten zusammen, was aber hier ausgeblendet werden soll. Die drei Bezugsgroessen Produkt, Verkaufsgebiet und Zeit stellen nun die sogenannten Dimensionen dar. Jeder Umsatzwert ergibt sich aus einer besonderen Kombination der drei Dimensionen.

Seit jeher hat jedes Attribut seine Dimensionen. Allerdings hat die Normalisierung von Datenmodellen fuer relationale Datenbank- Management-Systeme (RDBMS) die Dimensionen in den Hintergrund gedraengt. Dimensionen bedeuten in diesen Systemen Redundanz. Man konnte durch die Normalisierung zum einen Speicherplatz einsparen und zum anderen durch Redundanz verursachte Probleme bei der Datensynchronisation und Leistungseinbussen vermeiden.

Wer sein Augenmerk bei der Modellierung aber wieder auf die Dimensionen richtet, wird feststellen, dass ein logischer Denkprozess eher dieser Struktur folgt als der eines normalisierten Datenmodells. Dimensionen sind im Prinzip die natuerliche Umsetzung der realen Welt. Der Vorteil dabei ist, gleichzeitig in mehreren Dimensionen denken zu koennen.

Die Umsetzung von Daten in eine relationale Tabelle ohne Normalisierung erfolgt durch die Definition aller Kombinationen - Dimensionen, die jetzt die Rolle der Schluesselattribute fuer die Tabelle uebernehmen. Der Umsatz, um bei dem gewaehlten Beispiel zu bleiben, ist dabei ein weiteres Attribut mit der eigentlichen Information.

Genau diesem Ansatz folgen neue Werkzeuge, die die mehrdimensionale Analyse ermoeglichen und diese mit Hilfe eines grafischen Front-ends praesentieren. Die Anwender koennen dabei schnell und ohne umstaendliche SQL-Programmierung neue Sichten auf die gleichen Daten erhalten. Bei richtiger Definition beziehungsweise Kombination der Dimensionen lassen sich somit auch bisher unscheinbare Zusammenhaenge erkennen und erklaeren.

Dabei werden Funktionalitaeten wie Drill-down oder Drill-up verwendet, um beispielsweise beim Umsatz die einzelnen Werte zu betrachten, die zur Gesamtsumme gefuehrt haben. Mit diesen Olap- Werkzeugen lassen sich Applikationen zur Entscheidungsfindung erstellen, die auf mehrdimensionaler Modellierung beruhen.

Zwei Haupttypen von Werkzeugen sind dabei zu unterscheiden. Zum einen gibt es die Moeglichkeit der physischen und zum anderen die der virtuellen mehrdimensionalen Datenhaltung. Erstere ist in der Regel das Feld proprietaerer Datenbanksysteme, die auch die Bezeichnung Olap-Server oder mehrdimensionales Datenbank- Management-System (MDBMS) tragen. Die virtuelle mehrdimensionale Datenhaltung hingegen nutzt die Faehigkeiten eines RDBMS in Verbindung mit speziellen Werkzeugen, die die Olap-Anforderungen (siehe Kasten "Die zwoelf Regeln...") durch das Front-end erfuellen.

Wie das Beispiel mit dem Attribut Umsatz zeigt, lassen sich durchaus Dimensionen in Form relationaler Tabellen abbilden. Fuer die Technik, Dimensionen in Form von Tabellen zu speichern, hat sich der Begriff Star-Join etabliert. In beiden Faellen, der physischen wie der virtuellen Datenhaltung, ergibt sich aber die Notwendigkeit, einen fuer diese Analysetechnik speziell aufbereiteten Daten-Pool zu schaffen.

Gerade wenn es um die Anwendung solcher Olap-Werkzeuge zur Datenanalyse geht, rueckt die Frage der Performanz und der Beeintraechtigung der operativen Datenhaltungssysteme in den Vordergrund, denn die typischen Anforderungen eines Systems fuer Online Transaktion Processing (OLTP) unterscheiden sich erheblich von denen eines Olap-Systems. Bei einer Anfrage oder Analyse, die mit einem Olap-Werkzeug beispielsweise mehrere Geschaeftsjahre betrachtet, koennen erhebliche Datenmengen betroffen sein. Beim direkten Zugriff auf die operativen Datenbestaende wuerde sich eine Behinderung der Anwender nicht vermeiden lassen. Daher ist ein spezieller, den Analyseanforderungen entsprechender Datenpool die Voraussetzung fuer ein optimales Ergebnis.

Hierfuer bietet sich ein Data-Warehouse an. Es ist die zentrale Informationsbasis eines Unternehmens. In ihm sind die Daten aus den unterschiedlichen operativen Systemen zusammengefuehrt und stehen zur Analyse zur Verfuegung. Entscheidend ist dabei die Integration der Daten der operativen Systeme, wobei sogenannte Warehouse-Management-Software zum Einsatz kommt.

Die Modellierung fuer ein Data- Warehouse folgt nicht den Regeln der klassischen Datennormalisierung, sondern orientiert sich am Informationsbedarf der Anwender. Es ist durchaus wuenschenswert, auch die mehrdimensionale Modellierung einfliessen zu lassen. Wer dies ausschliesslich wuenscht, kann auf einen Olap-Server (physische Mehrdimensionalitaet) als Datenbanksystem ausweichen. In anderen Faellen, bei gemischten Datenmodellen, erweist sich aber ein RDBMS (virtuelle Mehrdimensionalitaet) als die bessere Basis fuer ein Data- Warehouse. Fuer beide Faelle gibt es Olap-Front-ends.

Zwischen diesen zwei Ansaetzen ist bei der Realisierung eines Data- Warehouse zu waehlen. Olap-Server finden durch ihre proprietaere Speicherungsstruktur, ihren erhoehten Aufwand fuer spezielle Indizierungsmechanismen und ihre eingeschraenkte Skalierbarkeit auf den unterschiedlichen Hardware-Architekturen schnell ihre Grenzen. Haeufig ist ein Data-Warehouse auf schnelles Wachstum durch immer neue Daten ausgelegt. Dann eignen sich nur leistungsfaehige RDBMS als Plattform. Sie sorgen fuer die Skalierbarkeit und Parallelisierung, auf denen die geforderte Leistung des Data- Warehouse und der dazugehoerigen Olap-Werkzeuge beruht. Gerade diese Faehigkeiten sind es, wegen derer Analysten etwa von der Gartner Group oder der Meta Group die RDBMS-Anbieter als die zukuenftig dominierenden Anbieter im Data-Warehouse-Markt sehen. Der Vorteil fuer ein Unternehmen liegt dabei klar auf der Hand:

Es ist kein neues, proprietaeres Datenbanksystem einzufuehren, sondern bestehendes RDBMS-Know-how laesst sich weiterverwenden.

*Tiemo Winterkamp ist Consultant Data-Warehousing bei der Garmhausen und Partner GmbH in Eschborn.