Insgesamt betrachtet ist die statistische Analyse von Daten kein neues Anwendungsgebiet im SAP-Umfeld. Statistische Analysen werden derzeit schon von verschiedenen anderen SAP-Produkten unterstützt - SAP Data Mining, SAP Business Planning and Consolidation, SAP SCM etc. Im Vergleich dazu ist SAP Predictive Analysis jedoch umfassender und folgt einem anderen Ansatz. Der Softwareanbieter stellt damit eine Desktop-Applikation zur Verfügung, die versteckte Informationen aus historischen Daten ermittelt und damit schnelle Ergebnisse ermöglicht. Unterstützt wird der gesamte statistische Analyse-Prozess.
SAP hat verschiedene statistische Algorithmen ausgewählt, die einen Mehrwert für Unternehmen schaffen können, und diese in SAP Predictive Analysis implementiert. Anwendungsbeispiele sind:
-
Apriori (Assoziations)-Algorithmen: Identifizierung von Kombinationen zwischen Einträgen. Nutzbar für die Analyse von Transaktionsdaten, um festzustellen, welche Produkte zusammen gekauft werden, so dass sich Cross-Marketing-Potenziale identifizieren lassen.
-
K-Means (Clusterungs)-Algorithmen: Identifizierung von Gruppen von Einträgen anhand von verschiedenen Attributen. Nutzbar zum Beispiel, um Kunden zu kategorisieren. Das soll helfen, die Kundenansprache zu individualisieren.
-
Zeitreihen-Algorithmen: Vorhersage von künftigen Werten, basierend auf historischen Daten, Trends und Saisonalitäten. Nutzbar für die Vorhersage von Verkäufen in der Zukunft, basierend auf historischen Verkaufsdaten unter Berücksichtigung der existierenden Werte, Trends und Saisonalitäten.
-
Ausreißer-Algorithmen: Identifizierung von Anomalien in Daten. Nutzbar für die Identifizierung von Betrügereien, Risiko-Einschätzungen etc.
-
Regressionsanalysen: Identifizierung von Beziehungen zwischen verschiedenen Variablen. Nutzbar, um den Beziehungsgrad festzustellen und andere Werten vorherzusagen - unter Verwendung des Beziehungsgrades.
Dies sind nur einige ausgewählte Anwendungsbeispiele. Darüber hinaus sind die statistischen Methoden in weiteren Anwendungsfällen einsetzbar und sollen auch hier Wettbewerbsvorteile generieren.
Überblick über den Prozess der statistischen Analyse
Der gesamte statistische Analyseprozess besteht aus verschiedenen Schritten, die in ihrer Bedeutung gleichgewichtet sind. Wie üblich beginnt der Prozess mit den Geschäftsanforderungen. Beispiele dafür sind:
-
Vorhersage der Verkaufszahlen für das nächste Quartal unter Berücksichtigung von historischen Verkaufszahlen, Saisonalitäten, Trends etc.
-
Identifizierung der Produkte, die zusammen verkauft werden.
-
Kategorisierung der Kunden, um sie individuell ansprechen zu können.
Der nächste Schritt ist die Prüfung, welche Basisdaten (Datenzugriff) bereits verfügbar sind (zum Beispiel historische Transaktionen, Stammdaten mit Attributen, unstrukturierte Daten aus sozialen Netzwerken etc.). Dieser Schritt bildet zusammen mit den Anforderungen aus dem Business die Voraussetzung, die passende statistische Methode auszusuchen. Um den Datenzugriff zu vereinfachen, bietet SAP Predictive Analysis Schnittstellen zu anderen SAP-Produkten, wodurch SAP-basierte Daten nahtlos verwendet werden können.
Daraufhin erfolgt die Modellierung oder - in anderen Worten - die Selektion der statistischen Methode, die Konfiguration und Anpassung der Parameter. Dies wird gewöhnlich in iterativen Schritten durchgeführt. Um eine statistische Funktion auswählen und den Ergebnissen vertrauen zu können, ist es notwendig, die Parameter mehrere Male anzupassen und dabei jedes Mal die Testergebnisse zu prüfen. Die Modellierung erfolgt normalerweise mit Beispieldaten, um eine ausreichende Performance zu erreichen.
Den nächsten Schritt bildet die Ausführung der Berechnungen auf Echtdaten. Zusammen mit SAP HANA genutzt, stellt SAP Predictive Analysis eine hohe Performance sicher. Dies wird gewährleistet durch die in HANA verwendete In-Memory-Technologie. Da SAP Predictive Analysis die Funktionen der SAP HANA Predictive Analysis Library (PAL) verwendet, lassen sich die statistischen Kalkulationen auf dem SAP HANA-Server durchgeführen.
Im abschließenden Schritt werden die Ergebnisse grafisch dargestellt und verteilt. SAP Predictive Analysis hat dazu die Funktionen von SAP Lumira integriert, die eine ansprechende grafische Visualisierung ermöglichen. Darüber hinaus können die Daten auch in den anderen SAP BusinessObjects BI-Tools verwendet werden.
Szenarien für die Implementierung
Es gibt verschiedene Möglichkeiten, die Predictive (statistischen)- Lösungen von SAP zu implementieren. Der einfachste Weg ist die Installation von SAP Predictive Analysis lokal auf dem PC des Datenanalysten oder Statistikers, so dass die Analysen basierend auf lokalen Excel-Files oder über die Verbindung zu einer unterstützten Datenquelle ablaufen können. Diese Methode erfordert wenig Zeit für die Implementierung. Da die Installation von SAP Predictive Analysis einfach funktioniert, liegt der Hauptaufwand im Training der Datenanalysten oder Statistiker. Diese Methode erlaubt derzeit aber noch nicht, automatische Berechnungen ohne Benutzereingriff einzuplanen.
Unternehmen, die SAP HANA in ihrer IT-Infrastruktur bereits nutzen oder künftig nutzen wollen, haben zusätzlich die Möglichkeit, die Predictive Analysis Library (PAL) zu verwenden. Diese Methode erlaubt die Modellierung mit SAP Predictive Analysis und zusätzlich erweiterte Rechenszenarien, die auf SAP HANA ausgeführt werden. Zudem besteht die Möglichkeit, darüber statistische Berechnungen in andere Geschäftsanwendungen zu integrieren. Diese Berechnungen können eingeplant werden und somit auf regelmäßiger Basis erfolgen. Die Performance ist durch die verwendete In-Memory Technologie und entsprechende Datenmodelle sowie Berechnungsformeln überzeugend.
Gründe für Predictive Analysis in Unternehmen
Obwohl die statistische Datenanalyse große Vorteile für Industrieunternehmen bieten kann, wird sie bisher nur begrenzt oder gar nicht eingesetzt. Gründe dafür sich die hohe Komplexität der Modelle sowie die anfallenden Kosten. Im Gegensatz dazu ist bei Banken, Versicherungen und Telekommunikationsanbietern die Verwendung von statistischen Analysen und entsprechenden Tools bereits weit verbreitet. Die Investitionen in diesen Bereich wurden nicht zum Selbstzweck durchgeführt, sondern erzeugen einen tatsächlichen Return on Investment, da die Vorhersage der Zukunft (mit allen geltenden Einschränkungen) zum Beispiel für die Einschätzung eines Kreditausfallrisikos sehr relevant ist.
SAP Predictive Analysis unterstützt den Trend im Umfeld statistischer Analysen, indem verbesserte Ergebnisse einfacher und zu geringeren Kosten erreicht werden können, wenn auch Nicht-Statistiker über ein Tool statistische Methoden und Analysen einsetzen können. Dies ermöglicht auch den Einsatz von SAP Predictive Analysis in mittelständischen Unternehmen, besonders durch die Integration der KXEN-Technologie, die unter dem Namen SAP Infinite Insight vermarktet wird. Auch für Großunternehmen ermöglicht SAP Predictive Analysis einen beschleunigten und effektiveren Einsatz von statischen Analysen durch die vereinfachten Modellierungsmöglichkeiten und die bessere Performance.
Die Benutzungsoberfläche von SAP Predictive Analysis ist intuitiv und einfach bedienbar. Für die statistische Analyse von Daten wird keine Code programmiert, sondern eine grafische Modellierung verwendet (ausgenommen davon sind Modelle, die die SAP HANA PAL verwenden). Dies stellt sicher, dass Analysten einen Großteil der Arbeiten selbst durchführen können, ohne Unterstützung von der IT-Abteilung anfordern zu müssen. Da der Modellierungsprozess in vielen Fällen iterativ durchlaufen wird, kann der Analyst effizienter und schneller arbeiten. (mb)