Blick in die Zukunft

SAP Predictive Analysis: Neue Einblicke auf Basis vorhandener Daten

Torben Hügens ist Head of Center of Excellence BusinessObjects bei Cametol ITLab.
Tomas Kumpikas ist SAP Business Objects Architect bei Camelot ITLab
Im Bereich der statistischen Datenanalyse hat SAP ein neues Produkt entwickelt: SAP Predictive Analysis. Zusammen mit dem Zukauf SAP Infinite Insight will der Softwarehersteller eine ganzheitliche Lösung schaffen, die es unter anderem mit IBM SPSS Statistics und SAS aufnehmen soll.

Insgesamt betrachtet ist die statistische Analyse von Daten kein neues Anwendungsgebiet im SAP-Umfeld. Statistische Analysen werden derzeit schon von verschiedenen anderen SAP-Produkten unterstützt - SAP Data Mining, SAP Business Planning and Consolidation, SAP SCM etc. Im Vergleich dazu ist SAP Predictive Analysis jedoch umfassender und folgt einem anderen Ansatz. Der Softwareanbieter stellt damit eine Desktop-Applikation zur Verfügung, die versteckte Informationen aus historischen Daten ermittelt und damit schnelle Ergebnisse ermöglicht. Unterstützt wird der gesamte statistische Analyse-Prozess.

SAP hat verschiedene statistische Algorithmen ausgewählt, die einen Mehrwert für Unternehmen schaffen können, und diese in SAP Predictive Analysis implementiert. Anwendungsbeispiele sind:

  • Apriori (Assoziations)-Algorithmen: Identifizierung von Kombinationen zwischen Einträgen. Nutzbar für die Analyse von Transaktionsdaten, um festzustellen, welche Produkte zusammen gekauft werden, so dass sich Cross-Marketing-Potenziale identifizieren lassen.

  • K-Means (Clusterungs)-Algorithmen: Identifizierung von Gruppen von Einträgen anhand von verschiedenen Attributen. Nutzbar zum Beispiel, um Kunden zu kategorisieren. Das soll helfen, die Kundenansprache zu individualisieren.

  • Zeitreihen-Algorithmen: Vorhersage von künftigen Werten, basierend auf historischen Daten, Trends und Saisonalitäten. Nutzbar für die Vorhersage von Verkäufen in der Zukunft, basierend auf historischen Verkaufsdaten unter Berücksichtigung der existierenden Werte, Trends und Saisonalitäten.

  • Ausreißer-Algorithmen: Identifizierung von Anomalien in Daten. Nutzbar für die Identifizierung von Betrügereien, Risiko-Einschätzungen etc.

  • Regressionsanalysen: Identifizierung von Beziehungen zwischen verschiedenen Variablen. Nutzbar, um den Beziehungsgrad festzustellen und andere Werten vorherzusagen - unter Verwendung des Beziehungsgrades.

Dies sind nur einige ausgewählte Anwendungsbeispiele. Darüber hinaus sind die statistischen Methoden in weiteren Anwendungsfällen einsetzbar und sollen auch hier Wettbewerbsvorteile generieren.

Foto: Camelot IT Lab

Überblick über den Prozess der statistischen Analyse

Der gesamte statistische Analyseprozess besteht aus verschiedenen Schritten, die in ihrer Bedeutung gleichgewichtet sind. Wie üblich beginnt der Prozess mit den Geschäftsanforderungen. Beispiele dafür sind:

  • Vorhersage der Verkaufszahlen für das nächste Quartal unter Berücksichtigung von historischen Verkaufszahlen, Saisonalitäten, Trends etc.

  • Identifizierung der Produkte, die zusammen verkauft werden.

  • Kategorisierung der Kunden, um sie individuell ansprechen zu können.

Der nächste Schritt ist die Prüfung, welche Basisdaten (Datenzugriff) bereits verfügbar sind (zum Beispiel historische Transaktionen, Stammdaten mit Attributen, unstrukturierte Daten aus sozialen Netzwerken etc.). Dieser Schritt bildet zusammen mit den Anforderungen aus dem Business die Voraussetzung, die passende statistische Methode auszusuchen. Um den Datenzugriff zu vereinfachen, bietet SAP Predictive Analysis Schnittstellen zu anderen SAP-Produkten, wodurch SAP-basierte Daten nahtlos verwendet werden können.

Daraufhin erfolgt die Modellierung oder - in anderen Worten - die Selektion der statistischen Methode, die Konfiguration und Anpassung der Parameter. Dies wird gewöhnlich in iterativen Schritten durchgeführt. Um eine statistische Funktion auswählen und den Ergebnissen vertrauen zu können, ist es notwendig, die Parameter mehrere Male anzupassen und dabei jedes Mal die Testergebnisse zu prüfen. Die Modellierung erfolgt normalerweise mit Beispieldaten, um eine ausreichende Performance zu erreichen.

Den nächsten Schritt bildet die Ausführung der Berechnungen auf Echtdaten. Zusammen mit SAP HANA genutzt, stellt SAP Predictive Analysis eine hohe Performance sicher. Dies wird gewährleistet durch die in HANA verwendete In-Memory-Technologie. Da SAP Predictive Analysis die Funktionen der SAP HANA Predictive Analysis Library (PAL) verwendet, lassen sich die statistischen Kalkulationen auf dem SAP HANA-Server durchgeführen.

Im abschließenden Schritt werden die Ergebnisse grafisch dargestellt und verteilt. SAP Predictive Analysis hat dazu die Funktionen von SAP Lumira integriert, die eine ansprechende grafische Visualisierung ermöglichen. Darüber hinaus können die Daten auch in den anderen SAP BusinessObjects BI-Tools verwendet werden.