Oracle Senior IT

Top down oder Bottom up

Welche Daten gehören ins Data Warehouse?

27.01.2012
Von 
Dr. Klaus Manhart hat an der LMU München Logik/Wissenschaftstheorie studiert. Seit 1999 ist er freier Fachautor für IT und Wissenschaft und seit 2005 Lehrbeauftragter an der Uni München für Computersimulation. Schwerpunkte im Bereich IT-Journalismus sind Internet, Business-Computing, Linux und Mobilanwendungen.
In vielen BI-Projekten stellt sich die Frage, welche Informationen im Data Warehouse gespeichert werden sollen und wie dieser Datenumfang festgelegt werden soll. Dazu gibt es unterschiedliche Vorgehensweisen - deren Wahl hat einen wesentlichen Einfluss auf das Datenmodell des Data Warehouses.

Ein Data Warehouse (DWH) ist die Datenbasis für Business Intelligence (BI) und stellt Informationen für verschiedene Auswertungen und BI-Applikationen zur Verfügung. Die Daten können aus einem oder mehreren Quellsystemen stammen. Typischerweise werden alle Daten in einem zentralen Core gespeichert, das für die Integration und Historisierung der Quelldaten verwendet wird. Aus dem Core werden dann die Data Marts für die unterschiedlichen BI-Anwendungen beliefert.

Bottom up Modellierung: Die Datenmodelle der Quellsysteme weden analysiert und daraus ermittelt, welche Tabellen und Attribute für das Data Warehouse relevant sind.
Bottom up Modellierung: Die Datenmodelle der Quellsysteme weden analysiert und daraus ermittelt, welche Tabellen und Attribute für das Data Warehouse relevant sind.
Foto: Trivadis

Vor allem bei Data Warehouses, die von Grund auf neu erstellt werden, ist während der Planungs- und Konzeptphase oft noch ziemlich unklar, wie die Datenmodelle von Core und Data Marts aussehen werden und welche Datenbestände darin gespeichert werden sollen. Je nach Zusammensetzung und Wissensstand des Projektteams sowie nach vorhandenen fachlichen Anforderungen für die einzelnen Data Marts werden dabei zwei grundsätzlich verschiedene Vorgehensweisen gewählt: Die DWH-Datenmodelle werden basierend auf den Quellsystemen (Bottom-up) oder basierend auf den Anforderungen an die BI-Applikationen (Top-down) erstellt.

Beide Ansätze haben Vor- und Nachteile, die sorgfältig gegeneinander abgewogen werden müssen. In der Regel ist ein Top-down-Ansatz basierend auf den fachlichen Anforderungen zweckmäßig, aber in vielen Fällen ist eine kombinierte Lösung aus Top-down und Bottom-up zu empfehlen. Welche Lösung in welchen Fällen die richtige ist wird genauer in dem Trivadis-PDF Welche Daten gehören ins Data Warehouse diskutiert, wo Sie auch weiterführende Literatur finden.