Datenhaltung in BI-Systemen

Würfeln Sie noch oder wissen Sie schon?

07.07.2010
Von Thomas Recke

Szene 5: Beziehungen knüpfen

In einem zweiten Szenario stellen Sie sich vor, Sie haben mehrere Vertriebsmitarbeiter, die jeweils eine bestimmte Anzahl von Kunden betreuen. In der Welt der Würfel würde man nun eine Hierarchie definieren, das heißt jedem Kunden würde man genau einen Vertriebsmitarbeiter zuordnen. So ließe sich mit Hilfe des oben definierten Umsatzwürfels auch der Umsatz je Vertriebsmitarbeiter analysieren.

In dynamisch wachsenden Unternehmen werden die Vertriebsgebiete von Zeit zu Zeit reorganisiert, das heißt es passiert häufiger, dass ein Kunde im Laufe seines Kundenlebenszyklus von unterschiedlichen Vertriebsmitarbeitern betreut wird. Was passiert nun aber mit den zuvor definierten Hierarchien? Eine solche Dynamik lässt sich mit einer starren Hierarchie nicht abbilden. Auch eine indirekte Ableitung der Zugehörigkeit eines Kunden zu einem Vertriebsmitarbeiter zum Zeitpunkt der Umsatzgenerierung ist im Würfelkonzept nicht vorgesehen. Also müsste man eine weitere Dimension für den Umsatzwürfel definieren, um im Würfel den Umsatz eines Kunden zu einem Zeitpunkt für einen Vertriebsmitarbeiter zu einem Produkt ablegen zu können.

Tabelle 2: Vollständiges Datenmodell im relationalen Modell.
Tabelle 2: Vollständiges Datenmodell im relationalen Modell.

Als Alternative zur Würfelwelt bietet sich an dieser Stelle das relationale Modell. Es orientiert sich an der Struktur relationaler Datenbanken, das bedeutet die Daten-Sicht wird durch zweidimensionale Tabellen gebildet, die über Schlüsselfelder miteinander verknüpft sind. Im einfachsten Fall besteht das Datenmodell aus einer einzigen Tabelle, so auch in diesem Szenario (Tabelle 2).

Für Analysezwecke lassen sich prinzipiell alle aus dem Umfeld von relationalen Datenbanken bekannten Abfragemechanismen verwenden. Zur besseren Veranschaulichung werden diese Abfragen hier in Form von SQL-Statements dargestellt. Im relationalen Modell wird nicht zwischen Dimensionen und Fakten unterschieden. Daher lässt sich im Prinzip jede Ergebnisspalte solch einer Abfrage gleichermaßen als Dimension als auch als darzustellender Fakt in einem Diagramm verwenden.

Soll die Umsatzentwicklung der Kunden im Zeitverlauf dargestellt werden, wird die Summe des Umsatzes selektiert, gruppiert nach den Spalten "Kunde" und "Jahr". In SQL würde man schreiben:

SELECT Kunde, Jahr, SUM(Umsatz)

FROM Kundendaten

GROUP BY (Kunde, Jahr);

Soll die Umsatzverteilung der Kunden dargestellt werden, wird nach der gerundeten Summe des Umsatzes gruppiert. In SQL:

SELECT ROUND(Umsatz, 50000), COUNT(DISTINCT Kunde)

FROM Kundendaten

GROUP BY (ROUND(Umsatz, 50000));

Der entscheidende Unterschied zum Würfelansatz liegt darin, dass diese Abfragen in der Analyse-Sicht definiert werden und nicht in der Daten-Sicht. Wenn also der Vertrieb feststellt, dass eine Umsatzaufteilung in 20.000 Euro-Schritten günstiger wäre, ist dafür keine Änderung des Datenmodells notwendig. Allein in der Abfrage muss ein Parameter angepasst werden. Da sich die Abfragen zur Laufzeit des BI-Tools verarbeiten lassen, ist es hier sogar denkbar, die Schrittweite dynamisch zum Beispiel durch ein Eingabefeld an der Oberfläche) festzulegen. Auf diese Art können die Kundendaten wirklich interaktiv analysiert werden.