BI-Tools und Suiten im Test

Business Intelligence für Geizige

04.01.2010
Von 
Dr. Klaus Manhart hat an der LMU München Logik/Wissenschaftstheorie studiert. Seit 1999 ist er freier Fachautor für IT und Wissenschaft und seit 2005 Lehrbeauftragter an der Uni München für Computersimulation. Schwerpunkte im Bereich IT-Journalismus sind Internet, Business-Computing, Linux und Mobilanwendungen.

Data Mining - Weka

Data-Mining-Verfahren sind darauf spezialisiert, Muster, Auffälligkeiten und Zusammenhänge in größeren Datensammlungen zu finden. Auf Grundlage der entdeckten Muster lassen sich Vorhersagen für die Entwicklung von Umsatz- oder Kundenzahlen treffen. Data Mining Methoden sind beispielsweise Clustering, Regressions- und Faktorenanalyse, Entscheidungsbäume oder neuronale Netze.

Weka wurde als „Waikato Environment for Knowledge Analysis“ von der Neuseeländer Universität Waikato entwickelt. Entsprechend akademisch ausgerichtet ist das Tool. Die Data-Mining-Verfahren sind beeindruckend vielfältig.

So enthält Weka Funktionen für die Datenaufbereitung, Regressionsanalyse, Klassifikationsverfahren, Clusteranalyse und Visualisierung. Daneben können auch neue Methoden für Maschinelles Lernen erstellt werden. Es gibt kaum ein Data-Mining-Verfahren, das nicht in Weka implementiert worden ist.

Dafür ist das Programm allerdings nicht ganz einfach zu bedienen. Unbedarfte Anwender werden von der Funktionsvielfalt eher abgeschreckt, der Lernaufwand für die Software ist erheblich.

Knowledge Flow: Bei Weka erlaubt es eine Explorer-ähnliche Oberfläche, Data Mining Prozesse per Drag and Drop als Datenflüsse zu modellieren.
Knowledge Flow: Bei Weka erlaubt es eine Explorer-ähnliche Oberfläche, Data Mining Prozesse per Drag and Drop als Datenflüsse zu modellieren.

Zwar verfügt Weka über ein Webinterface und eine grafische Benutzeroberfläche. Darauf lassen sich die Algorithmen als Workflows zusammenfügen, so dass diese in Datenanalysen regelmäßig ausgeführt werden können. Doch bei der Verarbeitung von Daten sind proprietäre Produkte in der Handhabung viel mächtiger und transparenter zu bedienen.

Weka wurde wie Kettle und Mondrian 2006 von Pentaho aufgekauft. Seitdem wird das Tool von Pentaho vermarktet und bildet unter der Bezeichnung Pentaho Data Mining den Data Mining Part in deren BI-Plattform. Das Projekt besteht jedoch unter der GNU General Public Licence als eigenständige Anwendung weiter, so dass es auch als alleinstehende Lösung eingesetzt werden kann.