BI-Appliances im Data Warehouse

Auswertungen im Handumdrehen

26.08.2009 von Wolfgang Miedl
Die immense Datenmenge von Geschäftsauswertungen zwingen nicht selten auch ambitionierte Systeme in die Knie. Hans-Ulrich Schaller von HP Deutschland erklärt, wie BI-Abfragen dennoch nur Sekunden dauern.

Moderne BI-Anwendungen sind prinzipiell in der Lage, innerhalb kürzester Zeit beim Erstellen von komplexen Geschäftsberichten oder Verkaufsanalysen zu helfen. Nicht selten zwingen die rechen- und datenintensiven Routinen aber die Systeme in die Knie. Statt Sekunden vergehen oft genug Stunden oder gar Tage bis zur Fertigstellung des Berichts.

Neue Hardware hilft, BI-Abfragen dramatisch zu beschleunigen, meint Hans-Ulrich Schaller, bei HP Deutschland für SAP-BI-Appliances verantwortlich.

Hans-Ulrich Schaller, bei HP weltweit verantwortlich für SAP-BI-Appliances, erklärt im Gespräch mit der Computerwoche, wie BI-Abfragen mit neuen Hardware-Technologien die Wartezeit dramatisch verkürzen helfen und wie die Suchmaschinenkultur den Wandel zum Echtzeitunternehmen einleitet.

Computerwoche: Herr Schaller, Business Intelligence bringt heute bereits viel Transparenz in geschäftliche Abläufe und ermöglicht auch nichttechnischen Anwender das Erstellen von Analysen und Berichten. Ihrer Ansicht nach gelingt der Durchbruch zur Massenanwendung aber erst dann, wenn die Systeme deutlich schneller werden. Was sind denn heute die Barrieren für schnelles BI?

Hans-Ulrich Schaller: Bei der Anwenderfreundlichkeit haben wir bereits heute einen hohen Entwicklungsstand erreicht, beispielsweise mit Produkten wie dem SAP BusinessObjects Explorer. Wo früher der BI-Spezialist gefragt war, reicht heute eine intuitiv zu bedienende Anwendungsoberfläche, mit der auch Fachanwender ihre Analysen fahren können. Das Manko all dieser Tools ist allerdings, dass sich ab einer gewissen Datenmenge die Antwortzeiten sehr in die Länge ziehen. Hier zeichnet sich nun das Dilemma für Unternehmen ab, dass man einerseits mit wachsender BI-Nutzung sein Geschäft voran bringt, gleichzeitig aber die heute schon am Limit fahrenden Data-Warehouses mit neuen Aufgaben überfrachtet.

Computerwoche: Warum sind denn Data-Warehouse-Ressourcen so notorisch knapp?

Schaller: Das Datawarehouse bildet das Gehirn eines Unternehmens, deshalb muss es perfekt administriert werden. Dazu gehören beispielsweise laufende Backup- und Restore-Routinen. Alleine damit geht aber bereits etwa ein Drittel der effektiv nutzbaren Zeit verloren. Hinzu kommt die enorme Rechen- sowie die Daten-Ein- und -Ausgabelast. Selbst BW-Systeme mit 64 Multicore-Prozessoren arbeiten sich Tag und Nacht ununterbrochen an Geschäftsberichten, Logistik- oder Vertriebsinformationen ab.

Die Nutzer stehen also in einem Zielkonflikt mit der IT: Der Fachanwender wünscht sich immer detailliertere Analysen, um beispielsweise den Vertrieb anhand möglichst vieler Parameter zu optimieren. Die IT hingegen muss aufgrund der beschränkten Ressourcen darauf achten, dass vorrangige BI-Aufgaben wie etwa die Berichte für die Geschäftsleitung Priorität haben.

Appliances verkürzen Auswertungen auf wenige Sekunden

Computerwoche: Und welche Möglichkeiten gibt es nun, BI-Systeme zu beschleunigen?

Schaller: Die Geschwindigkeit beim Erstellen von Berichten und Tabellen hängt von der Zugriffsgeschwindigkeit auf die Daten ab, weniger von der Rechenleistung. Ein SAP BW-Systemverwalter kann also mittels Tuning von Plattenspeicher, geschickter Reorganisation der Daten und vorausschauende Bereitstellung häufig nachgefragter Tabellen eine deutliche Beschleunigung erzielen. Allerdings wird er bei diesen Optimierungen schnell an Grenzen stoßen.

HP BI-Accelerator: Das Verlagern von Daten von der Festplatte in den Arbeitsspeicher sorgt für einen Turboeffekt bei der Auswertung.

Im Vergleich dazu lässt sich ein regelrechter Turboeffekt erreichen, wenn die Daten von den herkömmlichen Festplattenspeichern in den Hauptspeicher der Rechner verlagert werden. SAP hat sich diesen Effekt zunutze gemacht, indem der Business Warehouse Accelerator den theoretisch beliebig erweiterbaren Hauptspeicher eines preisgünstigen Serverclusters nutzt. Idealerweise setzt man dabei aufeinander abgestimmte Systemkomponenten ein. Aus diesem Grund haben wir bei HP eine BI-Appliance auf Basis eines Linux-Clusters entwickelt, die mit SAP-Software als vorinstalliertes Paket ausgeliefert wird.

Computerwoche: Wie funktioniert eine solche BI-Appliance?

Schaller: Die BI-Appliance wird zunächst über ein Hochgeschwindigkeitsnetzwerk mit dem BI-System verbunden. Im nächsten Schritt werden im BW-System diejenigen Datenpakete markiert, die die Anwender zu Auswertungen im SAP BusinessObjects Explorer benötigen. Danach werden diese Datensätze auf das Storagesystem der Appliance kopiert und im RAM der Clusterserver verteilt. Eine zusätzliche Komprimierung der Daten im ZIP-Fomat steigert die Datendichte im RAM um bis zu Faktor Zehn. Bei Suchanfragen holt sich das BW-System die für die Beschleunigung markierten Daten automatisch von der Appliance. Da der SAP BO Explorer direkt mit der Appliance verbunden wird, belastet er das SAP Businesswarehouse nicht weiter.

Computerwoche: Wie aufwändig ist denn die Implementierung einer solchen Lösung?

Schaller: Da es sich technisch lediglich um eine Erweiterung eines bestehenden Business-Warehouse durch ein beigestelltes, in sich unabhängiges Rechnersystem handelt, hält sich der Projektaufwand in Grenzen - innerhalb einer Woche nach Anlieferung des vorinstallierten BWA-Systems ist eine Accelerator-Appliance mit allen Anpassungen und Indizierungsregeln implementiert.

Supermarkt-Auswertung nicht mehr pro Tag, sondern pro Einkaufswagen

Computerwoche: Schnellere Berichte möchte ja wohl jeder Mitarbeiter erhalten. Wie wird sich dieser Trend denn auf die Unternehmen insgesamt auswirken?

Schaller: Das Thema entwickelt eine gewisse Eigendynamik. Die Anwender sind ja jetzt schon verwöhnt von der schnellen Suche im Web, und sie wollen das zunehmend auch für Geschäftsdaten haben. Mitarbeiter, die mit dem BO Explorer arbeiten, werden sich nicht mit wenigen Abfragen begnügen, es wird also ein Druck auf die IT entstehen, immer mehr Daten im Data-Warehouse bereitzustellen, um immer exaktere Analysen fahren zu können.

Computerwoche: Können Sie schon Beispiele aus der Praxis nennen, an denen die Vorteile dieser neuen Technologie anschaulich werden?

Schaller: Die Schweizer Handelskette Coop setzt zum Beispiel den BW Accelerator in einem Cluster mit 32 Blade-Servern ein. Damit erreicht man dort eine weitaus detailliertere Datenanalyse über die verkauften Produkte. Während früher beispielsweise nur ermittelt werden konnte, wie oft Waschmittel X pro Tag in einem Markt verkauft wurde, kann man heute für jeden einzelnen Einkaufswagen errechnen, in welcher Menge Waschmittel X abgesetzt wurde. Das zu analysierende Datenvolumen ist dabei von zwei auf elf Terabyte angewachsen, trotzdem läuft das System hinreichend schnell.

Computerwoche: Vielen Dank für das Gespräch.