Mit SAP HANA, SAP IQ und Co.

Wie SAP Big-Data-Initiativen unterstützt

23.04.2014 von Andreas Schaffry
Aus großen Datenmengen neue Einsichten gewinnen oder verborgene Zusammenhänge erkennen ist für Unternehmen wettbewerbsrelevant. SAP unterstützt Big-Data-Strategien mit der SAP HANA Plattform mit Big-Data-Anwendungen und Werkzeugen für die Analyse sowie mit Beratungs-, Entwicklungs- und Implementierungsservices.
SAP HG Subnet 2014, SAP HANA
Foto: SAP Deutschland

In fast jedem Unternehmen fallen heute neben einer großen Zahl an strukturierten auch unstrukturierte Daten, zum Beispiel aus sozialen Medien, Videos, Texten, Sensoren an Maschinen, Barcodes, RFID-Chips oder Geo-Systemen an. Diese Datenmengen steigen stetig. Knapp die Hälfte der IT-Chefs in Deutschland schätzt, dass das jährliche Datenwachstum in den kommenden zwei Jahren zwischen 15 und 25 Prozent liegen soll. Das geht aus der Studie "Big Data Analytics in Deutschland 2013" hervor, für die der Marktforscher IDC mehr als 280 IT-Leiter und Geschäftsentscheider aus Unternehmen mit mindestens 100 Mitarbeitern befragte. Rund 15 Prozent der Umfrageteilnehmer rechnen damit, dass die Datenmenge sich sogar um mehr als 25 Prozent erhöht. Da Daten auch zunehmend zu einem "Produktionsfaktor" werden, empfiehlt die Studie Unternehmen, sich zeitnah mit Big Data zu beschäftigen, um daraus geschäftlichen Nutzen zu ziehen.

Verborgene Zusammenhänge aufdecken

Mark von Kopp, SAP Deutschland
Foto: SAP Deutschland

"Big Data ist in erster Linie von der fachlichen Seite her zu betrachten und erst dann aus IT-Sicht", erläutert Dr. Mark von Kopp, Business Development Manager für Big Data bei SAP. Ein Unternehmen müsse zunächst herausfinden, welche neuen, innovativen und wettbewerbsdifferenzierenden Prozesse und Geschäftsmodelle durch Big Data möglich sind. Eine erfolgreiche Big-Data-Strategie zeichnet sich laut von Kopp durch die vier Kerneigenschaften Volume, Velocity, Variety und Value aus. Das bedeutet: Große und fragmentierte Mengen von Daten müssen nahezu in Echtzeit gesammelt, verarbeitet, validiert sowie sinnvoll miteinander verknüpft, in Beziehung gesetzt und analysiert werden. Nur so lassen sich aus einer Vielzahl an Daten neue Einsichten gewinnen oder darin verborgene Zusammenhänge erkennen.

Das ist zum Beispiel der Fall, wenn Handelsunternehmen die Daten aus Interaktionen von Kunden auf den verschiedenen Kontaktkanälen mit Kundenäußerungen auf sozialen Netzwerken wie Facebook oder Twitter in Verbindung bringen, explorieren und auswerten. Die gewonnenen Erkenntnisse lassen sich nutzen, um die Kundensegmentierung feinmaschiger zu gestalten oder Marketingkampagnen bedarfsgerechter aufzusetzen und präziser zu planen und durchzuführen. Auch die Preisfindung und Bestandsverwaltung kann zielgerichteter gestaltet werden.

Unternehmen können durch eine Analyse von Massendaten aus vielen unterschiedlichen Quellen auch Verdachtsfälle auf Betrug, Unterschlagung und Diebstahl untersuchen und diese verhindern noch bevor sie geschehen. Dadurch werden finanzielle Verluste und geschäftliche Risiken minimiert. Transportdienstleister, die mithilfe von Geoanalysen die Routenführung optimieren und durch sensorische Messungen immer für den richtigen Reifendruck bei ihren Fahrzeugen sorgen, senken den Benzinverbrauch ebenso wie die CO2-Emmissionen und erzielen so erhebliche Kosteneinsparungen.

Die IT als Enabler

Im Rahmen von Big-Data-Projekten übernimmt die IT die Rolle des Enablers. Sie muss für die geeigneten IT-Lösungen sorgen, mit denen aus der unübersichtlichen Datenmasse geschäftlich relevantes Wissen erschlossen und nahezu in Echtzeit analysiert werden kann. SAP unterstützt Kunden bei der Umsetzung von Big-Data-Vorhaben mit einem ganzheitlichen Leistungsportfolio, das von der Beratung über die Entwicklung individueller Big-Data-Lösungen und deren Implementierung reicht. Zunächst werden im Rahmen eines Assessments zusammen mit dem Kunden potenzielle Business-Szenarien identifiziert und priorisiert, in denen Big Data geschäftliche Vorteile bringt. "Wir bedienen uns hierzu des ‚Design Thinking‘ als kreativer Methode", sagt von Kopp. Danach werden die Anforderungen an die spätere Big-Data-Architektur und -Anwendung detailliert in einer Big-Data-Transformation-Map festgelegt und diese Schritt für Schritt umgesetzt.

SAP HANA Plattform für Big Data

Die technische Basis zur Realisierung der Big-Data-Initiative bildet die SAP HANA Plattform in deren Zentrum die In-Memory-Lösung SAP HANA steht. Die SAP-HANA-Plattform kann bei Bedarf mit weiteren Produkten wie dem Analyse-Server SAP IQ für die Nearline-Storage riesiger Mengen an Analysedaten, dem Datenbanksystem SAP Adaptive Server Enterprise (SAP ASE) oder mit Hadoop verknüpft werden. Um nahezu in Echtzeit auf veränderte Ereignisse reagieren zu können, lassen sich in der Big-Data-Architektur mit dem SAP Event Stream Processor große Datenströme quasi zum Zeitpunkt ihres Entstehens prozessieren, verarbeiten und auswerten. "Angesichts der sprunghaft steigenden Datenmengen sind ein effizientes Datenmanagement und eine hohe Datenqualität wichtige Voraussetzungen, um die Aussagekraft von Datenauswertungen zu verbessern", erklärt von Kopp. Die Pflege, Konsolidierung und Validierung der Stammdaten sowie die Dokumentation von Änderungen können mit den Lösungen SAP Master Data Management und SAP Master Data Governance durchgeführt werden.

Einen weiteren zentralen Baustein im Big-Data-Angebot bilden die SAP Data Services. Damit können beliebige Daten aus unterschiedlichen Datenspeichern extrahiert, transformiert und dann für Analysezwecke in SAP HANA oder SAP IQ geladen werden. Mit SAP HANA lassen sich strukturierte Daten wie etwa Absatzzahlen sowie unstrukturierte Informationen wie Twitter-Feeds gleichzeitig und nahezu in Echtzeit analysieren, mit dem Ziel verborgene Korrelationen aufzudecken. Dabei ist ein extrem schneller Zugriff auf diese Daten möglich, weil sie spaltenorientiert und persistent im Arbeitsspeicher der In-Memory-Anwendung vorgehalten werden. Große Datenmengen, die selten für Analysen benötigt werden und daher in Hadoop, SAP ASE, SAP IQ oder anderen Systemen gespeichert sind, lassen sich über SAP HANA Smart Data Access, einer Technologie zur Datenvisualisierung, dynamisch abfragen. Mithilfe von Algorithmen kann zudem festgelegt werden, dass bestimmte Daten zu einem festgelegten Zeitpunkt automatisch aus dem SAP-HANA-Arbeitsspeicher in ein Hadoop-Cluster oder in SAP IQ verschoben werden. Um die In-Memory-Plattform besser mit dem Hadoop-Framework zu integrieren, unterhält SAP Partnerschaften mit Cloudera, Intel sowie Hortonworks, die jeweils eigene Hadoop-Distributionen anbieten.

Big-Data-Analysen mit "R", NoSQL und Predictive Analysis Library

Die analytischen Fähigkeiten von SAP HANA werden durch die Einbindung von "R" und von NoSQL-Elementen zur Auswertung geografischer Daten zusätzlich erweitert. Die In-Memory-Lösung beinhaltet außerdem eine Predictive Analysis Library (PAL), die vordefinierte Algorithmen für die Bereiche Clustering, Klassifikation, Assoziation, Zeitreihen, Datenvorverarbeitung (Preprocessing), Social-Network-Analysen und Verschiedenes (ABC-Klassifikation, gewichtete Bewertungstabellen) bereitstellt. Die für vorausschauende Analysen erforderlichen Prognosemodelle müssen in der Regel von hochspezialisierten Datenexperten erstellt werden. Abhilfe schafft hier die Anwendung SAP InfiniteInsight. Mit ihr können die Fachanwender Prognosen in Eigenregie erstellen, speichern und einsetzen. Ein weiteres Self-Service-Tool ist SAP Lumira. End-User können damit nach eigenen Anforderungen benötigte Daten unabhängig vom Format und aus verschiedenen Quellen zusammenstellen und analysieren.

Für bestimmte Szenarien hat SAP eigene Big-Data-Applikationen entwickelt, die auf SAP HANA basieren und quasi "out of the box" installiert werden können. Dazu zählen Anwendungen wie SAP Fraud Management für die vorausschauende Erkennung von Betrugsfällen oder SAP Social Contact Intelligence für die Analyse von Kommentaren und Beiträgen in sozialen Medien durch Geschäftskontakte aus internen Quellen. SAP-Lösungen für das Responsive Manufacturing sind für Fertigungsunternehmen gedacht, die datenintensive Industrie-4.0-Projekte umsetzen wollen.

Darüber hinaus unterstützt SAP inzwischen mehr als 1.250 Start-up-Firmen, die SAP-HANA-basierte Big-Data-Lösungen für ganz spezielle Zwecke wie die Genomanalyse oder das Prozess-Mining entwickeln. Benötigen Kunden eine individuelle Big-Data-Anwendung, so ist das auch kein Problem. Sie werden von der SAP Data Science Organisation realisiert, die Bestandteil von SAP Consulting ist und sich aus Mathematikern, Branchenkennern, Entwicklern, Analyse-Spezialisten und Fachleuten für Datenaufbereitung zusammensetzt. Diese Einheit bietet auch die erforderlichen Beratungsdienstleistungen an - von der Machbarkeitsstudie (Proof-of-Concept) bis hin zur Umsetzung konkreter auf den Kunden zugeschnittener Anwendungsszenarien mit der kundenindividuellen Lösung.