Quelloffene BI-Suiten

Analyse mit Open Source

Tobias Wendehost beschäftigt sich als Volontär aktuell mit verschiedenen Hardwarethemen und stellt täglich ein Gadget des Tages vor. Ansonsten arbeitet er sich thematisch durch die Ressorts Job und Karriere, Software, Netzwerke und Mobile sowie IT-Strategie. Wer möchte, kann Tobias bei Twitter (@tubezweinull) folgen oder bei Xing eine Nachricht schreiben.
Analytics-Software ist angesagt - besonders mit Blick auf die Big-Data-Herausforderung. Im Open-Source-Lager gibt es einige Alternativen.

Der Markt für Business-Intelligence-(BI-)Anwendungen wird 2012, so erwartet IDC, weltweit 33,9 Milliarden Dollar schwer sein - ein Wachstum um 8,2 Prozent gegenüber 2011. Da BI-Suiten als komplex und vor allem teuer berüchtigt sind, befassen manche Anwender sich mit Open-Source-Angeboten.

Jaspersoft

Diese BI-Suite wird seit November 2012 in Version 5 angeboten und ist modular aufgebaut. Für die einzelnen Arbeitsschritte bietet Jaspersoft jeweils eigene Tools (Jaspersoft ETL, JasperAnalysis und Jasper-Reports). Die grafische Oberfläche von Jaspersoft ETL beinhaltet individuell anpassbare Diagramm- und Baumstrukturen. Ein Codegenerator wandelt die Grafiken direkt in Java- oder Perl-Code um. Über ein Dashboard kann sich der Anwender einen individuellen Datenüberblick zusammenstellen. Die Anbindung von Drittanwendungen ist möglich.

Das JasperAnalysis-Tool integriert die Berichtsfunktionen und OLAP-Analysen, die sich formatieren lassen. Mit dem Entwicklungs-Tool iReport ist die grafische Formatierung einzelner Berichtselemente vorhanden. Diese lassen sich in Tabellen, Diagrammen und Widgets darstellen. Die Professional Edition bietet neben den Grundfunktionen einen Dashboard-Designer. Alle Module werden separat vermarktet. Lediglich iReport und der Report Designer sind Bestandteil eines Gesamtpakets.

Vorteile:

  • Zahlreiche Diagramme und Dashboards

  • Anbindung von Drittprogrammen

Nachteile:

  • Module separat vermarktet

  • Berichte werden manuell publiziert

Palo

Die BI-Plattform Palo ist ein Open-Source-Angebot von Jedox. Die Suite vereint Palo OLAP Server, Palo Web, Palo for Excel und ETL-Server. Palo ist als Community- und Enterprise-Edition erhältlich. Der ETL-Server bereitet die Daten auf und stellt sie für den Import zur Verfügung. Sie können entweder über eine Excel-Oberfläche oder den Palo Server analysiert werden. Der OLAP Server basiert auf der MOLAP-Architektur, was eine schnellere Verarbeitung in der Datenbank erlauben soll.

Ein ETL-Server ist für den Datenaustausch zwischen Quell- und Zielsystem gedacht. Damit können in der Enterprise Edition auch Daten aus verschiedenen Quellen geladen werden. Der Palo Worksheet Server ist eine Web-Anwendung und wird zur Erzeugung von Berichten und zur Analyse genutzt. Eigene Arbeitsmappen sollen das Zusammenstellen von Berichten vereinfachen. Schließlich können Dashboard-Vorlagen eingebettet werden.

Vorteile:

  • Gewohnte Excel-Oberfläche

  • Schnelle Verarbeitung durch MOLAP

Nachteile:

  • Nur für eigenen Server optimiert

  • Große Analysen sind unübersichtlich

Pentaho

Wie Jaspersoft ist Pentaho modular aufgebaut und wird auf dem Java-Applikations-Server Tomcat umgesetzt. Derzeit gibt es die Suite in der Version 4.8. Das ETL-Werkzeug nennt sich Pentaho Data Integration. Der Anwender kann es eigenständig oder in Kombination mit der Suite nutzen. Einzelne Plugins, die etwa zur Anbindung an ERP-Software dienen, sind kostenpflichtig.

Für die Analyse der Daten bietet Pentaho das Produkt Business Analytics an. Die Oberfläche ist interaktiv und dient zur Darstellung von Reports. Ein Assistent hilft bei der Zusammenstellung von Berichten und Prognosen. Seit 2010 wirbt der Anbieter zudem für Big-Data-Funktionen wie Datenbankanalysen. Der Aggregation Designer ist für die Zusammenstellung von Tabellen auf Basis vorhandener Datenbankverbindungen verantwortlich. Hiermit werden eigene Aggregate entworfen, die bei der Analyse helfen sollen. Zudem existiert ein Report Designer, mit dem sich eigene Berichte darstellen lassen.

Vorteile:

  • Integrierter Assistent

  • Big-Data-Funktionen

Nachteile:

  • Plattform teilweise unübersichtlich

  • Design-Tools nur in Enterprise Edition

Teaserbild: ra2studio, Shutterstock.com (mhr)