Data Warehouse 2.0

04.05.2009

CW: Was ist von dem Slogan Data Warehouse 2.0 zu halten?

Brobst: Von Data Warehouse 2.0 sprechen Experten, wenn es um den Umbau älterer Data-Warehouse-Systeme geht, die im Wesentlichen für Reporting und einfache multidimensional aufbereitete Analysen (Olap) entworfen wurden. Da Firmen heute auch operative Daten einbeziehen wollen, sind stärker normalisierte Datenstrukturen nötig. Auf diese Weise lassen sich betriebliche Beziehungen zwischen den Daten schneller aktualisieren und verwalten. Ferner wird die Nutzung oder Koexistenz strukturierter und unstrukturierter Daten im Zusammenhang mit Data Warehouse 2.0 genannt. Auch hier könnte eine stärkere Normalisierung des Datenbankdesigns beide Datentypen vereinen.

CW: War dieses Designproblem abzusehen?

Brobst: Vor allem Datenbanken ohne spezielle Optimierungstechnik und ausgefeiltes Dateisystem haben Anwender dazu verführt, ihr Data Warehouse anders als heute benötigt aufzubauen. Manche versuchen nun, sich über eine Hub-and-spoke-Architektur zu helfen, in der ein Data Warehouse mit stärker normalisierten Daten abhängige Data Marts versorgt.

CW: Wie können Firmen die Leistung ihres Data Warehouse steigern?

Brobst: Vor allem eine manuelle Partitionierung der Daten in der Datenbank kann gegen die wachsenden Datenmengen helfen. Denkbar ist auch ein Tuning des Datenbank-Optimizers. Allerdings ist es auf Dauer keine Lösung, wenn der Administrator das System für neue Anforderungen ständig anpassen muss. Bei Oracle brauchen sie heute schon einen Administrator pro Terabyte. Besser wäre es, wenn sich das System selber verwalten könnte.