Business Intelligence

Was bieten Open-Source-Lösungen?

26.11.2009 von Daniela Hoffmann
Im BI-Umfeld werden Open-Source-Tools für Reporting, Olap und Data Warehouses zunehmend salonfähig. Experten raten jedoch zu professionellen Editionen inklusive Support.

"Runterladen und glücklich werden gibt es leider nicht", meint Andreas Bitterer, Research Vice President bei Gartner. Deshalb werde der Markt vor allem von kommerziellen Vendors und Integratoren getrieben, die die Open-Source-Tools in ihre Produkte einbauen. "Open-Source-BI hat große Wachstumschancen, allerdings von einer recht kleinen Basis aus", meint Bitterer. Bis 2012 soll sich die Anzahl der Open-Source-BI-Implementierungen laut Gartner verfünffachen. Bisher machen die quelloffenen Lösungen nur etwa ein bis zwei Prozent des gesamten BI-Marktes aus. "Open-Source-BI-Tools sind schon lange kein Spielzeug mehr", meint Michael Weck, Consultant beim BI-Analysten- und Beratungshaus Mayato: "Ohne Supportkomponente sind sie allerdings etwas für Bastler." Auch Bitterer sieht den Supportvertrag als unerlässlich für Unternehmen: "Wenn es um den produktiven Einsatz der Lösung geht, sollte man sich nicht nur auf die Community verlassen, sondern im Problemfall immer kurzfristig einen Experten ans Telefon bekommen."

"Zu den Schwächen freier Open-Source-Lösungen zählt, dass es kaum oder weniger Support, keine Zusatzprodukte und keine Garantie gibt. Handbücher und Dokumentationen werden nicht permanent weiterentwickelt und aktualisiert", sagt auch Barbara May, Marketing Manager Software bei Sun Microsystems GmbH. Der Hersteller unterstützt eine Reihe von Open-Source-BI-Tools wie Kettle, Talend und die Jasper for MySQL OEM Edition, zudem hat Sun mit ETL SE (ETL = Extract, Transform, Load) eine eigene Open-Source-Komponente für die Datenintegration entwickelt.

Ganz kostenlos ist Open-Source-BI also für Unternehmen, die Wert auf (Rechts-)Sicherheit legen, in der Regel nicht. Wer Support will, muss sich an die Enterprise- oder Professional Editions der Anbieter halten. Dennoch haben die kostenlosen Community-Editions auch Vorteile für Unternehmen. "Zum Einstieg nutzen die meisten Anwender die kostenlose Edition. In der Testphase wird auch etwas Improvisation in Kauf genommen. Nach einigen Wochen oder Monaten wechseln Unternehmen dann meist auf die kommerziellen Editionen mit Support und mehr Features", behauptet Kristian Raue, CEO des Open-Source-BI-Anbieters Jedox AG. Ebenso wie im Funktionsspektrum unterscheiden sich die Lösungen jedoch auch in der Abgrenzung zwischen den kostenlosen und den professionellen Versionen.

Pentaho

Grundlage der Java-basierenden BI-Suite Pentaho ist die BI-Plattform. Neben dem Olap-Server Mondrian stehen Komponenten zur Gestaltung von Reports und Cockpits zur Verfügung. Zum Umfang gehören ein neuer Dashboard Designer und eine Ad-hoc-Reporting-Komponente. Auch Data-Mining-Funktionen stehen über das integrierte Open-Source-Tool "Weka" zur Verfügung. Für die Datenintegration wird mit PDI (Pentaho Data Integration) das ehemalige ETL-Werkzeug Kettle genutzt, für das Reporting sorgt Birt. "Die Preise für die Enterprise Edition orientieren sich an den jeweiligen Service-Level-

Agreements. Unternehmen sparen hier in erster Linie die Lizenzkosten", sagt Hans-Jürgen Zinn, Geschäftsführer der Proratio GmbH, eines der ersten Vertriebspartner des 2004 gegründeten amerikanischen Anbieters Pentaho. Die kommerzielle Variante unterscheidet sich zudem durch zusätzliche Features, hauptsächlich Komfortfunktionen wie Monitoring- und Management-Tools, der Quellcode ist ansonsten der gleiche wie in der Community Edition. Hinzu kommen eine Patentschutzversicherung, zertifizierte Software, rasche Bugfixes und Unterstützung bei den Release-Wechseln.

Jaspersoft

JasperReports

JasperReports zählt zu den verbreitetsten Reporting-Engines. Mit Jaspersoft Server steht jedoch auch eine komplette BI-Suite zur Verfügung. Als ETL-Tool nutzt Jasper Talend, weitere Bausteine sind Jasper Server, Analysis, Reports und das Grafikdesign-Tool iReports. Input für Reports kann auch über XML-Dateien kommen. Die plattformunabhängige Lösung ist gut mit bestehenden BI-Anwendungen zu integrieren oder in eigene Anwendungen einzubinden. "40 Prozent unserer Kunden sind selbst Softwareentwickler", sagt Tom Cahill, Senior Director Emea Sales bei Jaspersoft. Die Vorteile der Professional-Version liegen vor allem in der Produktgarantie, Schutz vor Urheberrechtsklagen und der Gewährleistung, dass die BI-Suite kompatibel zu proprietären Servern und Datenbanken ist. Zudem gibt es 24/7-Support für Anwender mit geschäftskritischen Produktionssystemen und Support für ältere Softwareversionen. Hinzu kommen weitere Funktionen für Endnutzer und Administratoren wie Web 2.0, Ad-hoc-Anfragen, Reporting und Erstellung von Dashboards. Professional-Kunden zahlen weniger für Schulungen und Professional-Services-Beratungen.

Palo

Die BI-Suite Palo umfasst als kommerziell entwickelte Kernkomponenten Daten- und Olap-Server, ETL-Tool und Frontend. "Die Unterstützung aus dem Community-Umfeld bezieht sich eher auf APIs, Sprachversionen und Bug-Tests", berichtet Firmenchef Kristian Raue. Palo setzt einen Schwerpunkt auf das Thema Corporate-Performance- Management. Dafür stehen Funktionen für Planung, Budgetierung und Forecasting zur Verfügung, die laut Raue über das eher vergangenheitsbezogene Reporting des sonst häufig eingesetzten, rein relationalen Mondrian-Servers hinausgehen. Jedox setzt zudem auf das im BI-Umfeld vielgeschmähte Excel, das jedoch bei Controllern nach wie vor als beliebtestes Tool gilt. "Obwohl mit Excel oder Kalk (OpenOffice) gearbeitet werden kann, greifen alle Controller auf die gleichen, multidimensional gehaltenen Daten zu. Excel wird damit zum netzwerkfähigen BI-Frontend, das bringt eine hohe User-Akzeptanz", meint Raue. Der Unterschied zwischen der Community- und der Enterprise Version liegt zum einen im Support, zum anderen in zusätzlichen Features wie der SAP-Anbindung.

Bezüglich der Supportzeiten gibt es ebenfalls Preisunterschiede. Da BI nicht so geschäftskritisch ist wie operative Systeme, besteht nur bedingter Bedarf an 24/7-Support. "Über 90 Prozent der Kunden wählen den klassischen Support von 9 bis 17 Uhr", so der Anbieter. Anfang 2010 wechseln die Freiburger von einem einmaligen Preis für Beratung und Support zu einem Subskriptionsmodell.

Birt

Birt Project (kurz für Business Intelligence and Reporting Tools) wurde ursprünglich von Actuate initiiert und wird von der Open Source Community Eclipse als Top-Level-Projekt weiterentwickelt. Derzeit werden die Versionen 2.3.2 und 2.5 unterstützt. Die Benutzeroberfläche basiert auf Ajax und ist auch für Business-Anwender nachvollziehbar zu bedienen, der Report Viewer stellt verschiedene Berichtsarten und dynamische Elemente wie Drilldowns im Browser dar. Kern von Birt sind ein grafischer Berichtsdesigner und eine Laufzeitkomponente. Berichte werden als XML-Dateien gespeichert. Birt kann Datenquellen wie JDO-Datastores, JDBC, POJOs, XML, Web Services und SQL-Datenbanken einbeziehen. Eine Besonderheit besteht darin, dass Auswertungen durch die Birt Report Engine API direkt in den Java-Code anderer Anwendungen integriert werden können. Ein weiteres Alleinstellungsmerkmal ist die Bereitstellung einer eigenen Ajax-basierenden Web-Applikation zur Visualisierung der Daten, der "Birt Report Viewer". So können bei der Ausgabe der Auswertungen im Browser dynamische Komponenten wie Drilldowns und interaktive Parametrisierungen optisch ansprechend umgesetzt werden.

Wer nimmt was?

"Oft liegen die Unterschiede von Jaspersoft und Pentaho im Nuancenbereich", meint Samir Mimouh, Berater beim auf Open Source spezialisierten IT-Dienstleister Ancud: "Daher geht es stark nach den Anwenderanforderungen, dann wird geschaut, bei welcher Lösung die entsprechenden Features stärker ausgeprägt sind." So glänzt Jaspersoft beispielsweise mit komfortablen Dashboards, die interaktiv aus der Oberfläche bedienbar sind. Zudem lässt sich die Software leicht mit bestehenden Systemen integrieren.

Bei Pentaho liege eine Stärke in der Flexibilität von Auswertungen durch "xactions", mit denen sich auf einfache Weise zusätzliche Logik in die Reports einbringen lasse. "Beide Suiten haben einen hohen Standard und stehen proprietären Lösungen in vielen Features nicht nach", so Mimouh. Generell seien Open-Source-BI-Lösungen eine Alternative für die Unternehmen, für die "gesalzene" Preise der kommerziellen Anbieter eine Einstiegsbarriere darstellen.

Palo ist nach Ansicht des BI-Spezialisten Mimouh bei stark planerischen Anforderungen sinnvoll, da der In-Memory-Olap-Server Daten auch in Systeme zurückschreiben kann. Jaspersoft und Pentaho verfügen dagegen nicht über explizite Planungs- und Forecasting-Features. "Bei Birt liegt die Stärke vor allem in der Einbettung in bestehende Systeme und in Java-Anwendungen auf API-Ebene. Der Fokus liegt auf dem Reporting, Birt ist jedoch keine komplette BI-Suite: Aspekte wie Security, Repository und Web-Oberfläche fehlen", bemerkt Mimouh. Zudem richte sich Birt eher an Entwickler als an Endanwender.

Quelloffenes Data Warehouse und Data Mining

Auch in den angrenzenden Bereichen Data Warehousing und Data Mining tut sich im Open-Source-Bereich einiges. "Mit Weka, dessen Ansatz sich auf Machine-Learning konzentriert, und RapidMiner stehen funktional umfangreiche Tools zur Verfügung. Auch R Project ist interessant, eine mächtige Statistikbibliothek, mit der sich komplette Analyseumgebungen zusammenstellen lassen - das setzt jedoch einiges an Fachwissen voraus", meint BI-Berater Michael Weck.

Unter den Data-Warehouse-Alternativen stechen Greenplum und Infobright hervor. Der amerikanische Hersteller Greenplum unterhält mittlerweile etliche Partnerschaften in Europa, unter anderem mit Sun, Talend und GoldenGate. Das Data Warehouse ist für analytisch orientiertes Processing auf sehr großen Datenmengen gebaut. Zu den Kunden gehört Ebay; der Online-Auktionator nutzt die Software für ein Datenvolumen von 6,5 Petabyte.

Noch einen Schritt innovativer kommt die Data-Warehouse-Technik von Infobright daher. Anstatt zeilenorientiert lassen sich die Daten hier spaltenbezogen ablegen. "Unsere Praxiserfahrung zeigt, dass sich mit diesem komplett neuen Ansatz die DW-Performance deutlich erhöhen lässt", so Mimouh. Benchmark-Tests zufolge soll sich die Zugriffsgeschwindigkeit im Vergleich zu einem kommerziellen Data Warehouse um das Fünf- bis Zehnfache steigern lassen. Eine Datenkomprimierungsrate von 10:1 bis 40:1 spart Speicherplatz.