Data Warehousing

Die Datenverwaltung und Auswahl der richtigen Datenbank geraten zur Wissenschaft

28.04.2008
Von 


Sascha Alexander ist seit vielen Jahren als Redakteur, Fachautor, Pressesprecher und Experte für Content-Strategien im Markt für Business Intelligence, Big Data und Advanced Analytics tätig. Stationen waren unter anderem das Marktforschungs- und Beratungshaus BARC, die "Computerwoche" sowie das von ihm gegründete Portal und Magazin für Finanzvorstände CFOWORLD. Seine Themenschwerpunkte sind: Business Intelligence, Data Warehousing, Datenmanagement, Big Data, Advanced Analytics und BI Organisation.
Die Datenverwaltung und neue Basistechnologien für Data Warehousing stellen Unternehmen vor wachsende Herausforderungen, warnt Philip Howard, Research Director bei Bloor Research im Gespräch mit der COMPUTERWOCHE.

CW: Bisher lagern Unternehmensdaten oft verteilt und unkoordiniert in diversen Datenhaltungen. Doch immer mehr Anwender zeigen aus strategischen und wirtschaftlichen Gründen Interesse an einer systematischen und übergreifenden Datenverwaltung. Gehört einem Enterprise Data Management (EDM) die Zukunft?

Howard: Es gibt erste Unternehmen, die Projekte für Data Governance gestartet und Data Stewards für die Datenqualität benannt haben. Wichtig ist, dass IT und Business dabei zusammenarbeiten und sich schnell Erfolge aufzeigen lassen. Ein Beispiel ist der Pharmakonzern GlaxoSmithKline. Ein Jahr nach Start der Initiative konnten die Projektverantwortlichen dem Vorstand erste wirtschaftliche Vorteile durch Data Governance präsentieren. Das schafft Vertrauen. Ein umfassendes EDM habe ich aber bisher nicht gesehen. Es gibt einfach zu viele Probleme im Daten Management, wie beispielsweise die Verwaltung von Excel-Spreadsheets. Oft weiß die IT gar nicht, dass es in den Fachabteilungen Daten gibt. Ein klares Verständnis für die im Unternehmen befindlichen Daten fehlt, Tools für Data Discovery kommen nicht zum Einsatz, und bei Datenintegrations- und -migrationsprojekten findet nur selten ein Profiling der Daten statt (siehe auch wie sich Datenqualität steigern lässt).

CW: Dann stecken vermutlich auch Ansätze zu einem übergreifenden Datenmodell noch in den Kinderschuhen? Die Idee ist ja, mit dessen Hilfe die Beziehungen zwischen den Daten zu strukturieren. Ebenso ließen sich solche Modelle beispielsweise für den Aufbau von Data Services verwenden, die als zentrale Bausteine Service-orientierter Architekturen (SOA) diskutiert werden (zum Thema SOA und SOA Services siehe auch den SOA Expertenrat der Computerwoche).

Vom Datenmodell zum SOA-Service

Howard: Das Interesse an solchen Modellen steigt. Am Anfang hatten Unternehmen sich bei SOA nur um die Anwendungen gekümmert und nicht über die Daten nachgedacht. Mittlerweile sieht man in Projekten, dass Data Services und ein gemeinsames Datenmodell nötig sind, um die Daten über Web Services zu integrieren. Aber insgesamt steht das Thema noch am Anfang.

Datenbankexperte Philip Howard sieht die relationalen Datenbanken als Basis für Data Warehousing ins Hintertreffen geraten.
Datenbankexperte Philip Howard sieht die relationalen Datenbanken als Basis für Data Warehousing ins Hintertreffen geraten.
Foto:

CW: Wie sehen Lösungen für ein übergreifendes Daten-Management aus? Wo sollten Stammdaten und Metadaten verwaltet werden? Im Data Warehouse oder in einer eigenen Lösung?

Howard: Geht es nur um die Datenbasis für Datenanalysen und Reporting, ist das Data Warehouse der beste Ort. Sind hingegen beispielsweise CRM-Anwendungen zu synchronisieren (Transaktionsdaten), sollte dies mit Hilfe einer OLTP-Datenbank geschehen. Werden diese Daten zugleich im Data Warehouse gebraucht, müssen sie sich entweder föderieren oder replizieren lassen. Bei Stammdatenverwaltung zeigt sich ein Wandel: War bisher das Data Warehouse das "System of Record", etablieren sich nun auch eigene Lösungen für die Stammdatenverwaltung (Siehe auch "Stammdaten - der Business Case für SOA"). Manche Unternehmen fragen sich daher, ob sie überhaupt noch ein zentrales "Enterprise Data Warehouse" (EDW) brauchen oder ob nicht föderierte Data Marts ausreichen.