Neue Datenbank sorgt für schnellere Analysen

Vorteile und Perspektiven von BW-on-HANA

Dr. Matthias Merz ist Diplom-Wirtschaftsinformatiker und seit über zehn Jahren im SAP-Umfeld tätig. Bei Camelot ITLab leitet er das Center of Excellence HANA mit Fokus auf SAP BW-auf-HANA. Neben Kundenprojekten widmet er sich vorrangig der Evaluierung neuer Softwaretechnologien. Zuvor war Herr Merz langjährig an einem Rechenzentrum tätig und beschäftigte sich dort unter anderem mit den Themen High-Performance-Computing und SAP Basis-Administration.
Matthias Merz hat gemeinsam mit Dr. Torben Hügens und Steve Blum zum Thema "BW auf HANA" ein Buch veröffentlicht, das erstmals einen Überblick über die notwendigen Schritte zur Migration von SAP BW auf HANA bietet und erläutert, wie BW durch den Einsatz von HANA beschleunigt werden kann.


 
Torben Hügens ist Head of Center of Excellence BusinessObjects bei Cametol ITLab.
Steve Blum ist Center of Excellence HANA, Consultant bei Camelot ITLab.
Die aktuellen Entwicklungen hin zu Big Data und Industrie 4.0 stellen SAP Business Warehouse (BW) vor neue Herausforderungen. Mit SAP HANA können sie gemeistert werden.

Seit vielen Jahren setzen Unternehmen SAP Business Warehouse (BW) erfolgreich für ihr Reporting ein. Durch aktuelle Trends wie Big Data und Industrie 4.0 wächst jedoch die Notwendigkeit, Massendaten flexibel und in Echtzeit auszuwerten. Da SAP HANA die dafür benötigte Technologie zur Verfügung stellt, empfiehlt sich den Unternehmen eine BW-on-HANA-Migration, die Verbesserungen im Bereich der Datenhaltung, Datenmodellierung und Architektur möglich macht.

SAP HANA vereint zahlreiche innovative Datenbanktechnologien.
SAP HANA vereint zahlreiche innovative Datenbanktechnologien.
Foto: Melpomene-shutterstock.com

SAP HANA als Innovationsmotor

Die Plattform macht viele bisherige Maßnahmen zur Performancesteigerung in BW-Systemen obsolet, ist aber die Voraussetzung für neue Funktionen, die daher ausschließlich für BW-on-HANA-Systeme verfügbar sind.

Die Leistung von SAP HANA basiert im Wesentlichen auf 4 Prinzipien:

  1. In-Memory steht für das Vorhalten aller Daten im Arbeitsspeicher, das - im Gegensatz zum Business Warehouse Accelerator (BWA) - das Reporting für alle BW-Daten beschleunigt. Damit kann auf die aufwändige Cache-Verwaltung verzichtet und eine konstant geringe Zugriffszeit für Lese- und Schreibvorgänge garantiert werden. Der Arbeitsspeicher wird nicht wie üblich vom Betriebssystem, sondern von SAP HANA direkt verwaltet.

  2. Spaltenorientierte Datenhaltung bedeutet, dass die Daten einer Tabelle spaltenweise gespeichert werden. Gegenüber der immer noch üblichen zeilenbasierten Datenhaltung ist damit eine erheblich bessere Datenkomprimierung möglich, da Inhalt und Datentyp in einer Spalte sehr ähnlich sind. Auch Berechnungen innerhalb einer Spalte sind performanter, wodurch auf das Voraggregieren von Daten im BW verzichtet werden kann. Bei allen Vorteilen beherrscht SAP HANA dennoch auch die zeilenorientierte Datenhaltung.

  3. Insert-Only ist ein Konzept, das Schreiboperationen an Datensätzen für spaltenbasierte Tabellen performanter durchführt. Neue oder geänderte Datensätze werden zunächst in eine zeilenbasierte Delta-Tabelle geschrieben. Die entsprechend aufwändigen Änderungen der spaltenbasierten Tabellen ("Delta Merge") wird in regelmäßigen Abständen gesammelt durchgeführt.

  4. Appliance ist die Bezeichnung dafür, dass die Software gemeinsam mit einem zertifizierten Server und optimierten Betriebssystem ausgeliefert wird. Es stehen mehrere Konfigurationsvarianten zur Auswahl, um die optimale Unterstützung von Hardware und Software zu garantieren.

HANA bietet für BW-Systeme jedoch nicht nur eine hohe Performance, sondern umfasst zahlreiche zusätzliche Funktionen, man spricht daher von der SAP HANA-Plattform. Dazu gehören unter anderem die Advanced Function Libraries (AFL), die komplexe Algorithmen unter direkter Nutzung der internen HANA-Komponenten ausführen. Sie werden unter anderem für Vorhersagemodelle verwendet. Eine Auswahl können BW-on-HANA- Kunden als SAP HANA Analysis Process direkt im BW verwenden. Die Ausführung erfolgt direkt auf Datenbankebene.

Die In-Memory-Plattform verfügt zudem über einen eigenen Anwendungsserver, der die Entwicklung und den Betrieb von Anwendungen direkt auf Datenbankebene erlaubt. SAP nutzt diese Möglichkeit selbst und bietet zahlreiche dieser sogenannten XS-Anwendungen an. Sie können oft parallel zu BW-on-HANA betrieben werden. Eine weitere zentrale Funktion ist die Erstellung von SAP HANA Views, das sind BW-ähnliche Objekte, die aus Datenbanktabellen entwickelt werden. Sie können zum Beispiel über SAP Reporting Tools, wie Lumira, ausgewertet werden und ergänzen das SAP BW um eine weitere Modellierungsmöglichkeit.

Besonderheiten in der Datenmodellierung für BW-on-HANA

Während es bisher im SAP BW meist erforderlich war, zur Beschleunigung von Analysen und Berichten Daten in einem InfoCube vorzuhalten, entfällt unter BW-on-HANA diese Notwendigkeit. Queries, die auf einem DataStore-Object (DSO) basieren, können nun genauso schnell ausgeführt werden. Daher ist der Einsatz von InfoCubes unter BW-on-HANA häufig sogar komplett überflüssig.

Soll allerdings ein bestehendes BW-System auf SAP HANA migriert werden, können bestehende Datenmodelle meist nicht alle angepasst werden, nur um InfoCubes zu eliminieren. In diesem Fall lohnt es sich, deren Konvertierung in SAP HANA-optimierte InfoCubes durchzuführen. Dadurch werden die Tabellen der InfoCubes für die Plattform optimiert, was die Ladevorgänge deutlich beschleunigt.

Bei der Entwicklung von Datenflüssen in BW galt bisher das Prinzip, BEx-Queries nicht direkt auf InfoProvidern, sondern auf MultiProvidern aufzusetzen. Ausschlaggebend dafür war, dass sich auf diese Weise Datenmodelle im Zeitverlauf flexibel an neue Anforderungen anpassen lassen, etwa wenn neue InfoProvider in ein bestehendes Datenmodell integriert werden sollen. Mit dem Einsatz von BW-on-HANA empfiehlt es sich jedoch, anstelle eines MultiProviders dafür den neuen, SAP HANA-spezifischen CompositeProvider zu verwenden. Dieser macht sowohl die Modellierung flexibler als auch die Zusammenführung der Daten zur Laufzeit schneller.

BW-Prozesse mit längeren Laufzeiten, wie das Aktivieren von DSO-Requests, werden auf die SAP HANA-Datenbank verlagert. Zum einen beschleunigt dies die Ausführung der Prozesse und zum anderen müssen weniger Daten zwischen BW-Server und Datenbank ausgetauscht werden. Dieser Ansatz wird auch als "Code Push-Down"-Prinzip bezeichnet. Analog werden in neueren BW-on-HANA-Versionen auch bestimmte BW-Transformationen direkt in der SAP HANA-Datenbank ausgeführt. Weil die Daten dann ausschließlich SAP HANA-intern verarbeitet werden, können so nicht nur hohe Geschwindigkeitssteigerungen erzielt, sondern es kann auch der BW-Server entlastet werden.

Die Datenmodellierung im BW war bislang häufig recht zeitaufwändig und umfangreich. Um eine verlässliche Datenbasis zu schaffen, war die Erstellung von zahlreichen BW-Objekten wie InfoObjekte, Transformationen und InfoProvidern, notwendig. Unter BW-on-HANA stehen nun besonders "schlanke" InfoProvider, sogenannte "Open ODS Views" zur Verfügung. Diese können direkt auf Datenbanktabellen zugreifen, setzen keine InfoObjekte voraus und führen notwendige Berechnungen zur Laufzeit direkt in SAP-HANA durch.

Auch der Umgang mit Prozessketten wird verbessert. Nicht länger benötigt werden beispielsweise die Prozessschritte zum Aufbau und Löschen von Indizes für InfoCubes, zum Aktualisieren von Datenbankstatistiken oder zum Hochrollen gefüllter Aggregate. Enthalten bestehende Prozessketten noch diese obsoleten Prozessschritte, werden diese bei der Ausführung unter BW-on-HANA einfach übersprungen.