Das Data-Warehouse

03.03.1995

Fuer viele Firmen ist die Schnelligkeit, mit der Informationen zur Entscheidungsfindung bereitgestellt werden koennen, zum unternehmenskritischen Erfolgsfaktor geworden. Doch im immer dichteren Geflecht oft internationaler Witschaftsbeziehungen sind die noetigen Informationen kaum mehr in einer angemessenen Zeit aufzuspueren.

In zentralistischen Grosssystemen verbieten sich Ad-hoc-Abfragen mit analytischem Inhalt, wie sie Manager gern stellen, schon deshalb, weil sie zuviel Rechnerleistung von den Online- Transaktionssystemen abziehen wuerden. Das Data-Warehouse ist ein Softwarekonzept, das sich die benoetigten Daten holt, ohne die operativen Systeme zu belasten und sie zur qualitativen Auswertung fuer die "Knowledge Worker" bereitstellt. Sie, die Entscheider und Entscheidungsvorbereiter, brauchen themenorientierte Informationen, die sie auf einfache Art und Weise aus den operativen Daten gewinnen koennen.

Die Manager wollen zum Beispiel wissen, welchen Einfluss der Einsatz verschiedener Marketing-Instrumente innerhalb von zwei Jahren auf die Marktchancen bestimmter Produkte haben koennte. Wuenschenswert ist dabei, dass sich der Anwender mit Hilfe eines Navigationssystems bis zur gewuenschten Information vortasten kann.

Nach dem Data-Warehouse-Konzept werden Daten anders strukturiert als in einer operativen Datenbank. Denkbar ist eine Ordnung nach laufenden Detaildaten, aelteren Detaildaten, grob oder stark zusammengefassten Daten.

Von zentraler Bedeutung sind die Metadaten. Sie dienen als eine Art Wegweiser dafuer, wo sich die Daten und deren Zusammenfassungs- Algorithmen im Warehouse befinden. Die Buendelung der Daten macht den Zugriff auf sie wesentlich schneller und vereinfacht ihre Indizierung. Die Metadaten enthalten also Informationen ueber die benoetigten Daten und sind damit das Data-Dictionary des Data- Warehouse. Bei der Selektion der Daten auf dem Desktop darf es fuer den Anwender keine Rolle spielen, ob sich die gewuenschten Informationen auf seinem PC, einem Unix-Server, einem Mainframe oder in einem entfernt liegenden Local Area Network (LAN) befinden.

Ein komplettes Data-Warehouse hat immer etwas mit verteilt liegenden Ressourcen zu tun. Eine Anfrage loest dabei die Suche nicht nur auf einem, sondern auf verschiedenen Servern aus, je nachdem, wo die benoetigten Daten sich befinden. Das setzt eine komplexe Technik fuer den plattformuebergreifenden Datenzugriff sowie fuer die Konsolidierung in ein einheitliches Datenformat voraus. Nur jene Daten, die der Entscheider braucht, werden aus der operativen Umgebung herausgefiltert.

Es geht also sowohl um Informationslogistik als auch um Informationsbereitstellung, Bearbeitungsmethoden und Praesentation der Ergebnisse. Die Aufgabe eines Data Warhouse besteht demnach aus folgenden Schritten:

- Datenzugriff (universell auf alle elektronisch verfuegbaren Daten),

- Daten-Management (Verwaltung und Organisation der Daten) sowie

- Datenanalyse (abhaengig von der Art der Anwendung).

Technisch gesehen bedarf es zur Realisierung des kompletten Data- Warehouse eines Softwaresystems, das verschiedene Voraussetzungen erfuellt.

Es muss:

- ein offenes System sein, das ueber Schnittstellen zu Datenquellen aller Unternehmensbereiche verfuegt,

- in der Lage sein, trotz der verschiedenen Datenformate zwischen den erhaltenen Daten Verknuepfungen und Relationen zu erstellen (diese muessen mehrdimensional sein koennen und unterschiedliche logische Sichten zulassen),

- die zur gewuenschten Information benoetigten Daten auswerten ("analysieren", Online Analytical Processing = OLAP)) koennen und

- die Ergebnisse in ansprechender, informativer Form fuer EIS-, MIS- oder aehnliche Informationssysteme visualisieren koennen (als Texte, Tabellen, Grafiken, Landkarten etc.).

Da es Managern nicht zuzumuten ist, die schwierige SQL-Syntax fuer die Datenbankabfrage zu erlernen - geschweige denn das Abap-System der SAP-Pakete - muessen sich viele User ihre Reports immer noch von der DV-Abteilung erstellen lassen. Das dauert und macht den Report als Hilfsmittel fuer schnell zu treffende Entscheidungen oft untauglich.

Abhilfe schafften die vor drei, vier Jahren eingefuehrten, auch fuer Endanwender "intuitiv" zu bedienenden, grafisch orientierten Query-Tools. Sie ermoeglichen es, ohne Wissen ueber Datenbanken oder SQL auch komplizierte Reports zu generieren, wobei Fehlererkennungsroutinen logisch falsche Abfragen sofort melden.