Data Mining Studie

So finden Sie das richtige Analyse-Werkzeug

24.08.2009
Von 
Peter Neckel ist Analyst beim Data-Mining-Spezialisten Mayato.

Unübersichtliches Data-Mining-Angebot

Der Softwaremarkt für Data-Mining-Werkzeuge ist durch eine große "Artenvielfalt" an Lösungen gekennzeichnet, was zu einer gewissen Unübersichtlichkeit führt und den Anwenderunternehmen die Auswahl erschwert. Das Analysten- und Beratungshaus Mayato gibt in der "Data-Mining-Studie 2010" Tipps, die die Entscheidungsfindung erleichtern sollen.

Taxonomie der getesteten Data-Mining-Produkte.
Taxonomie der getesteten Data-Mining-Produkte.

Der Schwerpunkt liegt in der Analyse von Cross- und Upselling-Potenzialen mittels Assoziations- und Sequenzanalysen: Dazu mussten folgende fünf Data-Mining-Tools und -suiten ein umfangreiches Testszenario absolvieren, in dessen Verlauf die Softwarewerkzeuge anhand eines 1,8 Millionen Zeilen großen Testdatensatzes auf ihre Praxistauglichkeit geprüft wurden:

  • SAS Enterprise Miner 6.1

  • StatSoft Statistica Data Miner 9

  • KNIME 2.0.3

  • KXEN Analytic Framework 5.1.1

  • SAP NetWeaver 7.0 Data Mining Workbench.

Anhand einer Fallstudie mussten die Teilnehmer des Testfelds den gesamten Data-Mining-Prozess durchlaufen - von der Datenvorverarbeitung über die Datenexploration bis hin zur (grafischen) Darstellung und Interpretation der Ergebnisse. Bewertet wurden dabei unter anderem Bedienung, Stabilität, Systemverhalten bei großen Datenmengen, Dokumentation und die Gesamteffizienz des Analyseprozesses. Ausschlaggebend für die Wertung waren Kriterien wie Geschwindigkeit, Automatisierungsgrad und Ergebnisqualität. Die Ausführungsgeschwindigkeit haben die Prüfer mit einer Vielzahl unterschiedlicher Parametereinstellungen gemessen und dokumentiert. Zusätzlich zum umfangreichen Praxistest wurde für jedes getestete Werkzeug eine detaillierte Funktionsübersicht rund um die Assoziations- und Sequenzanalyse erstellt.