Datenhaltung in BI-Systemen

Würfeln Sie noch oder wissen Sie schon?

07.07.2010
Von Thomas Recke

Szene 6: Beziehungsnetz sichtbar machen

Im relationalen Modell gibt es keine starren Hierarchien. Sollen auch Vertriebsgebiete analysiert werden, wird in der Daten-Sicht in der dargestellten Tabelle 2 einfach eine weitere Spalte ergänzt, die den Vertriebsmitarbeiter enthält, der in dem dargestellten Jahr für den jeweiligen Kunden zuständig war. Um zu sehen, wer für Kunde A wann zuständig war, würde in SQL folgendes Statement ausreichen:

SELECT DISTINCT Jahr, Vertriebsmitarbeiter

FROM Kundendaten

WHERE Kunde = "Kunde A";

Auf diese Art lassen sich auch komplexe Beziehungsnetzwerke in der Daten-Sicht abbilden und in der Analyse-Sicht aufschlüsseln.

Damit eine interaktive Datenanalyse möglich ist, müssen die zu analysierenden Daten möglichst schnell zur Verfügung stehen. Im Bereich der relationalen Datenbanken kann eine wie oben beschriebene Abfrage gerade bei großen Datenmengen einige Zeit in Anspruch nehmen. Genau aus diesem Grund wurde das OLAP-Modell mit der Würfelwelt einst entwickelt. Alle Werte in den Cubes sind darauf vorbereitet, genau in der gedachten Weise in der Analyse-Sicht dargestellt zu werden. Gerade weil die Daten in der Daten-Sicht so gut auf die konkreten Analyse-Anforderungen abgestimmt sind, kann eine performante Datenanalyse gewährleistet werden.

Eine Möglichkeit, um das relationale Modell performant nutzen zu können, bietet die so genannte In-Memory-Technik. Dabei wird das gesamte Datenmodell zur Laufzeit in den Arbeitsspeicher geladen, wo sich auch komplexe Berechnungen in Sekundenschnelle abwickeln lassen. Hierbei ist allerdings ein gutes Komprimierungsverfahren notwendig, das die Datenmenge und damit den erforderlichen Arbeitsspeicher ohne Verlust von Funktionalität um ein erhebliches Maß reduzieren kann.

Warum aber nicht auch die Würfel vollständig in den Arbeitsspeicher laden? Tatsächlich gibt es einige BI-Systeme, die genau dies selektiv ermöglichen. Dann bringt aber die aufwändige Strukturierung der Daten in Würfelform keinen Mehrwert im Vergleich zum relationalen Modell, da der Geschwindigkeitsunterschied bei einer Berechnung im Arbeitsspeicher gering sein wird.