Predictive Analytics

Was Sie über Predictive Analytics wissen müssen

27.05.2015 von Wolfgang Martin
Dank Predictive Analytics wissen Unternehmen schon vorher, wie Kunden reagieren und können so Umsatz- und Gewinnpotenziale heben. Wir zeigen, was Sie wissen müssen.
Kundendaten zu sammeln ist das eine. Aber die Königsdisziplin ist, aus diesen Daten rechtzeitig die richtigen Schlüsse zu ziehen und danach zu handeln.
Foto: alphaspirit, Fotolia.com

Smart Data schlägt Big Data. Allerdings: Kein Mensch kann in die Zukunft schauen. Kein Mensch kann Daten aus der Zukunft kennen, geschweige denn analysieren. Doch es gibt Methoden, wie man aus Daten aus der Vergangenheit auf zukünftige Trends und Entwicklungen schließen kann. Das ist Ziel und Aufgabe von Predictive Analytics, eine der zentralen Herausforderungen für digitale Unternehmen, die Kundenerlebnismanagement als kritischen Erfolgsfaktor begreifen.

Predictive Analytics ist nicht unbedingt neu. Viele Unternehmen nutzen im Vertrieb ein Forecasting-System, beispielsweise Funnel-Management, um die vorhandenen Leads monetär nach vermutlichem Volumen, nach voraussichtlicher Dauer bis zum Abschluss und mit einer Wahrscheinlichkeit des erfolgreichen Abschlusses zu bewerten. Dann nutzen diese Unternehmen auch bereits Predictive Analytics.

Auch eine Vorschlagsmaschine in einem Webshop ist eine Anwendung von Predictive Analytics. Oder das Anwenden von Marketing-Modellen, um Entscheidungshilfen zu bekommen, welche Anzeige auf welcher Seite eines Mediums erscheinen soll, zählt dazu. All das sind Formen von Predictive Analytics, nämlich die Anwendung von Analytik zum Berechnen von Wahrscheinlichkeiten des Eintretens von Ereignissen wie

Predictive Analytics gehört genau wie Data Discovery (Entdecken von Zusammenhängen in Datenmengen) und Datenvisualisierung in die Familie der Konzepte von Analytik. Alle zusammen gehören mit den Konzepten von Performance Management und deren Umsetzungsformen zu Business Intelligence.

Im Zuge der Digitalisierung der Welt wird Predictive Analytics aber immer wichtiger. Es dient insbesondere dazu, die Spuren der digitalen Kunden im Big Data quer über alle Kanäle und Kontaktpunkte zu entdecken, zu analysieren und zukünftiges Kundenverhalten und Kundeneigenschaften vorherzusagen. Aus der Datenvielfalt und dem Datenvolumen aus mannigfaltigen Datenquellen wird aus Big Data gleichsam die Essenz herausgefiltert: Smart Customer Data. Das bedeutet neue Einsichten in Kunden und Markt und bietet die Basis für bessere Entscheidungen, Aktionen und Maßnahmen. Schließlich wird Predictive Analytics zum Impulsgeber für Innovation.

Big Data Glossar
Die Begriffe rund um Big Data
Big Data - was ist das eigentlich? Jeder spricht drüber, jeder versteht etwas anderes darunter. Klicken Sie sich durch unser Glossar mit den wichtigsten und meistgenutzten Begriffen (manche sagen auch "Buzzwords") und verstehen Sie, was damit genau gemeint ist. <br /><br /> <em>zusammengestellt von <a href="http://www.kommunikation-in-sendling.com/" target="_blank">Kriemhilde Klippstätter</a>, freie Autorin und Coach (SE) in München</em>
Ad Targeting
Der Versuch, die Aufmerksamkeit des potenziellen Kunden zu gewinnen, meist durch "passgenaue" Werbung.
Algorithmus
Eine in Software gegossene mathematische Formel mit der ein Datensatz analysiert wird.
Analytics
Mit Hilfe von Software-basierenden Algorithmen und statistischen Methoden werden Daten interpretiert. Dazu benötigt man eine analytische Plattform, die aus Software oder Software plus Hardware besteht und die die Werkzeuge und Rechenpower bereitstellt, um unterschiedliche analytische Abfragen durchführen zu können. Es gibt eine Reihe unterschiedlicher Formen und Einsatzzwecke, die in diesem Glossar näher beschrieben sind.
Automatic Identification and Capture (AIDC)
Jede Methode der automatischen Identifizierung und Datensammlung über eine Gegebenheit und die nachfolgende Speicherung in ein Computersystem. Etwa die Informationen aus einem RFID-Chip, die ein Scanner ausliest.
Behavioral Analytics
Behavioral Analytics nutzt Informationen über das menschliche Verhalten, um die Absichten zu verstehen und zukünftiges Verhalten vorhersehen zu können.
Business Intelligence (BI)
Der generelle Ausdruck für die Identifizierung, Herkunft und Analyse der Daten.
Call Detail Record (CDR) Analyse
Diese enthält Daten, die die Telekommunikationsunternehmen über die Nutzung von Mobilfunkgesprächen – etwa Zeitpunkt und Dauer der Gespräche – sammeln.
Cassandra
Ein verteiltes Datenbank-Verwaltungssystem für sehr große strukturierte Datenbanken („NoSQL“-Datenbanksystem) auf Open-Source-Basis (Apache).
Clickstream Analytics
Bezeichnet die Analyse der Web-Aktivitäten eines Benutzers per Auswertung seiner Klicks auf einer Website.
Competitive Monitoring
Tabellen, in denen die Aktivitäten der Konkurrenz im Web automatisch gespeichert werden.
Complex Event Processing (CEP)
Ein Prozess, bei dem alle Aktivitäten in den Systemen einer Organisation überwacht und analysiert werden. Bei Bedarf kann sofort in Echtzeit reagiert werden.
Data Aggregation
Das Sammeln von Daten aus unterschiedlichen Quellen für die Erstellung eines Berichts oder für eine Analyse.
Data Analytics
Ein Stück Software, mit dem Informationen aus einem Datensatz gezogen werden. Das Ergebnis kann ein Report, ein Status oder eine Aktion sein, die automatisch gestartet wird.
Data Architecture and Design
Legt dar, wie Unternehmensdaten strukturiert sind. Meist erfolgt das in drei Prozessschritten: Begriffliche Abbildung der Geschäftseinheiten, logische Abbildung der Beziehungen innerhalb der Geschäftseinheit sowie die physikalische Konstruktion eines Systems, das die Tätigkeiten unterstützt.
Data Exhaust
Die Daten, die eine Person bei ihrer Internet-Aktivität "nebenbei" erzeugt.
Data Virtualization
Der Prozess der Abstraktion verschiedener Datenquellen durch eine einzige Zugriffsschicht auf die Daten.
Distributed Object
Ein Stück Software, das es erlaubt, mit verteilten Objekten auf einem anderen Computer zusammenzuarbeiten.
De-Identification
Das Entfernen aller Daten, die eine Person mit einer bestimmten Information verbindet.
Distributed Processing
Die Ausführung eines Prozesses über verschiedene per Netzwerk verbundene Computer hinweg.
Drill
Apache Drill ist eine Open-Source-SQL-Suchmaschine für Hadoop- und NoSQL-Datenmanagement-Systeme.
Hadoop
Ein freies, in Java geschriebenes Framework der Apache Foundation für skalierbare, verteilt arbeitende Software in einem Cluster. Es basiert auf dem bekannten MapReduce-Algorithmus der Google Inc. sowie auf Vorschlägen des Google-Dateisystems.
HANA
SAPs Software-und Hardware-Plattform mit In-Memory-Computing für Echtzeitanalysen und große Transaktionsvolumen.
In-Database Analytics
In-Database Analytics bezeichnet die Integration der Analysemethoden in die Datenbank. Der Vorteil ist, dass die Daten für die Auswertung nicht bewegt werden müssen.
In-Memory Database
Jedes Datenbanksystem, das den Hauptspeicher für die Datenspeicherung benutzt.
In-Memory Data Grid (IMDG)
Die verteilte Datenspeicherung im Hauptspeicher vieler Server für schnellen Zugriff und bessere Skalierbarkeit.
Machine-generated Data
Alle Daten, die automatisch von einem Rechenprozess, einer Applikation oder einer nicht-menschlichen Quelle erzeugt werden.
Map/reduce
Ein Verfahren, bei dem ein großes Problem in kleinere aufgeteilt und an verschiedene Rechner im Netz oder Cluster oder an ein Grid aus unterschiedlichen Computern an verschiedenen Standorten ("map") zur Bearbeitung verteilt wird. Die Ergebnisse werden dann gesammelt und in einem (reduzierten) Report dargestellt. Google hat sein Verfahren unter der Marke "MapReduce" schützen lassen.
Mashup
Dabei werden unterschiedliche Datensätze innerhalb einer Applikation so kombiniert, dass das Ergebnis verbessert wird.
NoSQL
Datenbanken, die nicht relational aufgebaut sind und mit denen sich große Datenvolumina handhaben lassen. Sie benötigen keine festgelegten Tabellenschemata und skalieren horizontal. Beispielsweise ist Apache Cassandra eine NoSQL.
Operational Data Store (ODS)
Darin werden Daten aus unterschiedlichen Quellen gesammelt damit noch weitere Operationen ausgeführt werden können, bevor die Daten in ein Data Warehouse exportiert werden.
Pattern Recognition
Die Klassifizierung von automatisch erkannten Mustern.
Predictive Analytics
Diese Form der Analytics nutzt statistische Funktionen in einem oder mehreren Datensätzen, um Trends oder zukünftige Ereignisse vorherzusagen.
Recommendation Engine
Per Algorithmus werden die Kundenbestellungen einer Website analysiert und sofort passende Zusatzprodukte ausgesucht und angeboten.
Risk Analysis
Die Anwendung statistischer Methoden auf einen oder mehrere Datensätze, um das Risiko eines Projekts, einer Handlung oder Entscheidung abschätzen zu können.
Sentiment Analysis
Dabei werden Einträge von Leuten in sozialen Netzwerken über ein Produkt oder ein Unternehmen statisch ausgewertet.
Variable Pricing
Dabei folgt der Kaufpreis eines Produkts dem Angebot und der Nachfrage. Das erfordert die Echtzeit-Überwachung von Konsum und Lagerbestand.
Parallel Data Analysis
Ein analytisches Problem wird in Teilaufgaben aufgebrochen und die Algorithmen werden auf jede Problemkomponente zeitgleich und parallel angewendet.
Query Anal
In diesem Prozess wird eine Suchanfrage optimiert, um das bestmögliche Ergebnis zu erhalten.
Reference Data
Daten, die ein physikalisch oder virtuell vorhandenes Objekt und seine Eigenschaften beschreiben.

Predictive Analytics basiert im Wesentlichen auf Data Mining. Klassische Data-Mining-Methoden umfassen beispielsweise Regressionsanalyse, Klassifizierung (Clustering), neuronale Netze sowie Assoziationsanalysen. Über ein solches Erkennen von Mustern in Datenmengen nutzt Predictive Analytics auch statistische Berechnungen, maschinelles Lernen, Elemente der Spieltheorie sowie Methoden des Operations Research, wie Optimierungsrechnung und Simulationsverfahren. Dahinter steckt demnach eine ganze Menge Mathematik und Statistik, heute auch noch Linguistik, wenn Text Mining, bzw. Textanalytik auf nicht-strukturierte Daten wie Texte, Blogs, Tweets etc. angewendet werden soll.

Predictive Analytics ist der heute am meisten verwendete Begriff hierzu, aber er steht nur gleichberechtigt neben Descriptive Analytics und Prescriptive Analytics. Was ist also was?

Gut zu wissen

Was und wieviel sollte man als Manager oder Experte im Fachbereich von Analytics wissen und verstehen? Der Einfachheit halber wollen wir hier nicht zwischen Descriptive, Predictive und Prescriptive Analytics unterscheiden, sondern nur von Predictive Analytics sprechen.

Predictive Analytics dient als Konzept der Business Intelligence der Entscheidungsunterstützung. Es schafft Fakten, die sich im Rahmen eines Modells nachvollziehbar und eineindeutig ergeben. Auf Basis dieser Fakten sind dann Entscheidungen zu treffen. Das ist in der Tat die Aufgabe der Manager und Experten in den Fachabteilungen. Man muss also in der Lage sein, das Modell zu verstehen und die Fakten zu interpretieren und Schlüsse daraus ziehen können. Wie Mathematik, Statistik und Linguistik im Rahmen des Modells arbeiten, muss man nicht unbedingt verstehen. Das ist die Aufgabe von speziellen Business-Analysten und/oder Datenwissenschaftlern.

Hier ein paar Tipps, was man über Predictive Analytics ohne mathematisch/statistisch/linguistische Ausbildung wissen sollte, um auf Basis der Ergebnisse ein besseres Kundenerlebnismanagement zu ermöglichen:

6 Tipps zum Erfolgsmessung bei Content Marketing-Kampgagnen
6. Nicht mehr in Kanal-Silos denke!
Gesamt-RO erfassen; crossmediale Effekte berücksichtigen
5. Ausführlichst testen!
Unterschiedliche Kanäle, Content-Formate, Werbemittel und Allokationen von Budgets gegeneinander testen.
4. Kunden entlang der Customer Journey tracken
Verpixelung durch Linkparameter, Nutzung von Google Analytics
3. Beschränken Sie sich auf die relevanten KPIs!
Leadpotenzial anhand des Gewinns pro Kunde, der Kauffrequenz und des Customer Lifetime Values (CLV) bestimmen.
2. Führen Sie eine ausführliche Zielgruppen-Recherche durch!
Klären in welchen Kanälen sich eine vorab definierte Zielgruppe aufhält.
1. Content Marketing-Ziele so konkret wie möglich definieren
z.B. ein positiver Effekt auf Umsatz, Branding oder Kosten

Wer über ein solches Basiswissen verfügt, kann dann auch mit Analysten und Datenwissenschaftlern Ergebnisse von Predictive Analytics diskutieren und folgenden Fragen nachgehen, die zur Bewertung des Modells und seiner Interpretation entscheidend sind:

Es kommt also im Endeffekt darauf an, dass ein mit diesem Thema beschäftigter Manager die richtigen Daten und das richtige mathematische/statistisch/linguistische Modell hat sowie Sorgfalt beim Umgang mit den fundamentalen Annahmen walten lässt. Das ist in der Praxis nicht immer einfach. Aber mit einem solchen Ansatz erhält das Unternehmen Einsichten basierend auf belastbaren Fakten, mit denen auf der fachlichen und Management-Ebene bessere Entscheidungen getroffen werden können. Darauf lässt sich im Anschluss ein Kundenerlebnismanagement aufbauen, das den Erwartungen der Kunden auch entspricht.
Dann gilt es noch, die Auswirkungen dieser Entscheidungen im Sinne von Performance Management zu messen und somit Überwachungsmechanismen aufzubauen, die sicherstellen, dass die getroffenen Entscheidungen auch die beabsichtigten Wirkungen zeigen.

Fazit

Mit Predictive Analytics bekommen die Unternehmen leistungsstarke, analytische Werkzeuge an die Hand, um aus Big Data Smart Customer Data zu generieren. Wem es gelingt, Predictive Analytics effizient einzusetzen, der kann durch die Vorhersage wahrscheinlicher Entwicklungen von Kunden- und Markttrends bessere Entscheidungen ableiten und smarter handeln. Die Konsequenz ist ein Kundenerlebnismanagement, das die Erwartungen der Kunden erfüllt. Das bedeutet einen deutlichen Wettbewerbsvorsprung gegenüber den Mitbewerbern, sozusagen "real digital".

Die größte Herausforderung von Predictive Analytics besteht darin, die gewonnenen Ergebnisse erfolgreich in das Business zu übertragen. Smart Customer Data, das beispielsweise aufdeckt, welche Kunden potenziell kündigen können, nützt nur dann etwas, wenn die Unternehmen daraus auch die richtigen Schlüsse ziehen. Bei einer falschen Interpretation der Ergebnisse kann sogar das Gegenteil des gewünschten Effekts die Folge sein. Ein Beispiel wäre in einer Analyse von Kündigungsabsichten bei Kunden eine erhöhte Kündigungsrate. Als erfolgskritisch erweist es sich zudem, die mit den Predictive-Analytics-Ergebnissen verbundenen Aktionen und Maßnahmen für Manager und Experten in den Fachabteilungen transparent zumachen. (bw)