Reverse Engineering für das Data Warehouse

29.04.2004
Von 
Bernd Seidel ist freier Journalist und Coach in München.

Ferner bewertete das Team die Kosten und den zu erwartenden Nutzen aller Beschreibungstypen. "Jedes Dokument muss sich wirtschaftlich rechnen", stellt die Projektleiterin klar.

In diesem Zusammenhang fragte sich das Team auch jedes Mal, wie realistisch die Annahme sei, dass das Dokument später gepflegt werde. "Mit abnehmendem Nutzen und zunehmendem Aufwand sinkt die Motivation, dies sorgfältig zu tun", so die Erfahrung der Projektleiterin. Folglich wurden Geld-, Zeit- und Ressourcenaufwand den zu erwartenden Kosteneinsparungen, Synergien, Qualitäts- und Zeitgewinnen gegenübergestellt.

Der höchste Nutzen, das ergab die Analyse, war von der Dokumentation des Fachkonzepts sowie von den Datenfluss-, Objekt- und Datenmodellen zu erwarten. Das Fachkonzept beschreibt - gegliedert nach Themen- oder Auswertebereichen -, welche Berichte den Anwendern in welcher Form angeboten werden. Darüber hinaus enthält es eine Spezifikation der Kennzahlen für die jeweiligen Berichte mit einer detaillierten fachlichen Herleitung. Dieser Dokumententyp lässt sich nicht automatisch erzeugen. In enger Absprache mit den Anwendern entstand für das erste Frontend ein mehr als 100 Seiten starkes Dokument.

In das Fachkonzept integriert wurde das Objektmodell. Es hält fest, in welchen Dimensionen und welcher Granularität die einzelnen Kennzahlen abfragbar sind. Hinzu kamen Teile des Datenflussmodells, beispielsweise die wichtigsten Aggregationsvorgänge im Data Warehouse und in den Data Marts sowie einige Berechnungsvorgänge auf dem Weg von den Quellsystemen bis zum Analyse-Frontend. Das war ebenfalls weitgehend manuell zu erledigen.

Als größtenteils maschinell zu erzeugen erwies sich die Beschreibung der Betriebs- und Ladeprozesse. Die Strukturen ließen sich zum Teil direkt aus dem Extraktions-, Transformations- und Lade-(ETL-)Werkzeug "Datastage" von Ascential Software auslesen. Mit Hilfe dieser Daten soll nun die intern entwickelte Glossaranwendung "Aurora" erweitert werden, welche die Data-Warehouse-Inhalte auf fachlicher Ebene ablegt und miteinander konsolidiert. Auch der Einsatz eines Metadaten-Management-Systems ist derzeit in der Evaluierung.