SAS, KXEN, RapidMiner, SAP Netweaver BI

Vier Tools für Data Mining im Test

Peter Neckel ist Analyst beim Data-Mining-Spezialisten Mayato.
Data-Mining-Tools unterscheiden sich nicht nur im Preis, sondern auch funktional erheblich. Dies zeigt ein Vergleich der Produkte von SAS, KXEN, Rapid-I und SAP Netweaver BI.

Obwohl Unternehmen derzeit sparen und Projekte zurückstellen müssen, stehen Vorhaben zur Datenanalyse weiterhin ganz oben auf der Liste der drängenden Aufgaben. Methoden und Werkzeuge für Data Mining können hierfür besonders nützlich sein, da sie Lücken und Schwachstellen in den eigenen Geschäftsprozessen aufdecken und zusätzliche Vertriebs- und Marketing-Potenziale erschließen helfen.

Nicht zuletzt sinkende Speicherpreise verleiten heute Unternehmen zum Horten riesiger Datenmengen im Terabyte-Umfang (und sorgen für Kopfschmerzen im Management). Um den Informationsgehalt dieser Daten noch effektiver erschließen zu können, gewinnen explorative Analyseansätze wie das Data Mining an Bedeutung. Anders als bei konfirmativen Analysen, die von konkreten Annahmen ausgehen, geht es hier um ein autonomes, ergebnisoffenes Durchsuchen der Datenmengen nach Mustern, Regelmäßigkeiten und bis dato unbekannten Zusammenhängen.

Ein typisches Einsatzgebiet ist das Churn-Management (Kundenabwanderung), bei dem es darum geht, per Data Mining abwanderungswillige Kunden frühzeitig zu identifizieren und hoffentlich rechtzeitig Maßnahmen zu ihrem Verbleib einzuleiten (mehr zur Datenanalyse im CRM finden Sie hier). Ferner kommen Data-Mining-Verfahren in der Kundensegmentierung, der Warenkorbanalyse und bei der Identifikation von Cross-Selling-Potenzialen zum Einsatz, und auch Schäden durch Betrug sowie ein drohender Kredit- oder Forderungsausfall sind mit Data Mining früh erkennbar (siehe auch den Ratgeber für den Einstieg ins Data Mining).

Anwendungsgebiete liegen heute auch im Einkauf, in der Produktion und im Qualitäts-Management, wo Data Mining zum Beispiel zur genaueren Bedarfsplanung, zur Schwachstellenanalyse im Produktportfolio oder für Prognosen über zu erwartende Ersatzteilausfälle dient (siehe auch den Trendbeitrag zu analytischem CRM).