Data-Warehouse-Ersatz

Operational Datastores sind einfacher und billiger

26.10.2011
Von Johannes Ahrends
Ein schnell replizierender Operational Datastore erlaubt Business Intelligence auf Basis aktueller Daten, ohne die operative Datenbank zu belasten und in gewohnter Umgebung wie etwa Excel.

Seit den 90er Jahren werden in vielen Unternehmen Data Warehouses mit nachgelagerten Data Marts aufgebaut. Hierfür werden Daten aus unterschiedlichen operationalen Datenbanken meist einmal täglich extrahiert, transformiert und entsprechend bereinigt in das Data Warehouse über unterschiedliche Mechanismen übertragen beziehungsweise repliziert. Auf der Grundlage dieser tagesaktuellen Daten erstellen Unternehmen Auswertungen und Reports aller Art, die in strategische Entscheidungen einfließen. Doch reicht es heute noch aus, Entscheidungen auf Basis "alter" Daten zu treffen? Sicher sind tagesaktuelle Daten nicht wirklich "alt", doch wenn es um unternehmenskritische Analysen geht, ist es erforderlich, auf die operativen Daten zuzugreifen. Dies kann entweder direkt oder über einen Operational Datastore (ODS) erfolgen.

Der pragmatische Ansatz

Quick-Guide zur Datenanalyse mit Toad.
Quick-Guide zur Datenanalyse mit Toad.

Viele Unternehmen setzen bereits auf ODS in ihrer einfachsten Form: als Excel-Tabellen. Dabei werden die Daten aus den OLTP-Datenbanken (Online Transaction Processing) gelesen und um weitere Informationen ergänzt. Die Abfragen, die an die operative Datenbank gestellt werden, finden zu dem Zeitpunkt statt, zu dem sie gebraucht werden, um die größtmögliche Aktualität zu gewährleisten.

Aus datenbanktechnischer Sicht ist eine solche Vorgehensweise jedoch sehr problematisch. Operative Datenbanken sind für die schnelle Verarbeitung von Transaktionen eingerichtet. Ständige unkontrollierte Abfragen können den operativen Betrieb stark beeinträchtigen. Zudem sind die Daten in den Datenbanken oft wenig "sprechend" abgelegt - ein unbedarfter Anwender ist meist nicht in der Lage, sofort von Tabellen auf Inhalte zu schließen. Erschwerend kommt hinzu, dass die Daten in der Regel nicht konsolidiert sind. Eine Abfrage, die den aktuellen Ersatzteilbestand in Bezug zum Verbrauch des letzten Monats setzen soll, dauert im operativen System unter Umständen Stunden und blockiert dabei viele Ressourcen.

Aus den genannten Gründen ist es erforderlich, ein Replikat der wichtigen Produktionsdaten zur Verfügung zu stellen. Doch entspricht das nicht einem Data Warehouse? Wo also liegt der Unterschied?

Die Antwort ist einfach: Durch eine permanente Replikation stehen die aktuellen Daten im ODS sofort zur Verfügung, sind aber nicht bereinigt (Transformation). Einzig zusätzliche Verdichtungsstufen sowie spezielle Indizierungen, Views oder zusätzliche Tabellen helfen, die geforderten Informationen für den Anwender transparenter und schneller zugänglich zu machen.