Mayato-Data-Mining-Studie

Werkzeuge für Business Analytics und CRM im Test

05.03.2013
Von 
Peter Neckel ist Analyst beim Data-Mining-Spezialisten Mayato.

Ergebnisse des Praxistests

Taxonomie aktueller Data-Mining-Lösungen: Data-Mining-Funktionen stehen je nach Anbieter in stark unterschiedlichen Softwaretypen zur Verfügung.
Taxonomie aktueller Data-Mining-Lösungen: Data-Mining-Funktionen stehen je nach Anbieter in stark unterschiedlichen Softwaretypen zur Verfügung.
Foto: Mayato

Im Praxistest zeigt sich, dass die drei etablierten Data-Mining-Suiten gleichermaßen einen hohen Reifegrad erreicht haben. Das macht sich vor allem in sehr hoher Systemstabilität, hoher Ausführungsgeschwindigkeit und souveränem Umgang mit großen Datenmengen bemerkbar. Hier hat besonders die Umstellung auf 64-Bit-Architekturen eine spürbare Entlastung gebracht.

Allerdings führen die durchweg hohe Funktionsmächtigkeit und die vielfältigen Parametrisierungsmöglichkeiten der Suiten zu vergleichsweise langen Einarbeitungszeiten. Es wird zudem immer schwieriger, ein Bedienkonzept für alle Anwendergruppen bereitzu- stellen, so dass sich beispielsweise der erfahrene Data-Mining-Analyst ebenso zu Hause fühlt wie der Marketier oder der Fachexperte aus dem Controlling.

Stärken und Schwächen

Diesbezüglich gibt es signifikante Unterschiede zwischen den Tools: Die Stärke von SAS liegt hier in der Einbettung des Enterprise Miner in eine leistungsfähige BI-Gesamtarchitektur, die neben der Analyse flexible Möglichkeiten der Datenhaltung oder weitreichende ETL-Funktionen bietet. Für Nutzer, die weitere Werkzeuge der SAS- Plattform verwenden (etwa den Enterprise Guide oder das Data Integration Studio), ergibt sich jedoch kein Vorteil, da jedes Tool eine andere Oberfläche und ein unterschiedliches Bedienkonzept aufweist.

IBM ist es mit SPSS gelungen, umfangreiche Funktionalität in eine moderne, intuitive Oberfläche zu verpacken: Der Modeler bietet insgesamt die beste Ergonomie und eine sehr gute - als einzige im Testfeld auf Deutsch verfügbare - Dokumentation, die den Einstieg erleichtert.

Die Wurzeln von Statsoft liegen in der Statistik, wessen man auch als Anwender der Data-Mining-Komponente sofort gewahr wird: Der Data Miner enthält als "Grundlage" stets die volle Funktionalität des Statistikpakets, was zum Beispiel mächtige Datenvorverarbeitungsfunktionen sowie eine große Zahl von frei konfigurierbaren Grafiken einschließt. Dadurch bietet Statistica das beste Preis-Leistungs-Verhältnis im Testfeld und gefällt ebenso mit einer modernen Oberfläche.

Vor allem an der wenig ergonomischen Oberfläche merkt man der SAP Data Mining Workbench an, dass sie seit mehreren Jahren keine substanziellen Aktualisierungen erfahren hat: Der in der Praxis oft notwendige Wechsel zwischen dem Analyseprozessdesigner (APD) und der Data Mining Workbench kostet Zeit und ist aus Nutzersicht nicht nachvollziehbar. Zudem sind die Data-Mining-Funktionen in ihrem Umfang stark begrenzt - neuere Verfahren wie Support Vector Machines stehen gar nicht zur Verfügung. Die Visualisierung und Endausgabe lässt eine Qualitätsbewertung der Ergebnisse nur rudimentär zu. Insgesamt reiht sich SAP daher am Ende des Testfelds ein.

Automatisierung

Mit der Steigerung der Einsatzhäufigkeit von Data Mining stellt sich zunehmend die Frage nach der Effizienz des gesamten Analyseprozesses: In welchem Verhältnis steht der Zeitaufwand zum betriebswirtschaftlichen Nutzen der Analyseergebnisse? Dies geben letztlich die verwendeten Data-Mining-Werkzeuge durch Funktionsumfang, Bedienkomfort und vor allem durch ihren Automatisierungsgrad vor.

Die Tool-Hersteller haben dies erkannt: SAS bietet mit dem Rapid Predictive Modeler eine (in der aktuellen Version nochmals überarbeitete) Data-Mining-Umgebung mit sinnvoll begrenzten Parametrisierungsoptionen an. Hier konnten im Test bereits mit den Standardparametern akzeptable Ergebnisse erzielt werden, die auf Wunsch manuell weiter verfeinert werden können. Statsoft liefert alternativ vorgefertigte Data-Mining-Rezepte für Standardaufgaben, IBM SPSS stellt unter anderem einen automatischen Klassifizierer zur Verfügung, der mehrere Prognosemodelle automatisch berechnen und vergleichen kann.