Business Intelligence in der Praxis

Bürgel setzt auf Open Source und Pentaho

10.11.2008
Von Martin Ortgies

Gute Erweiterbarkeit, aber Speicherhunger

Die Integration der vorhandenen Daten in die Olap-Datenbank verlief laut der Projektbeteiligten ohne ernsthafte Probleme, sodass die Implementierung des Open-Source-Tools innerhalb von drei Monaten abgeschlossen werden konnte. Zur Sicherheit wurde die Datenbank redundant aufgebaut (mit Backup-Funktion untereinander), um eine Hochverfügbarkeit über 24 Stunden an 7 Tagen zu gewährleisten. "Wir haben die besonderen Stärken der Open-Source-Lösung, aber auch einige Schwächen bestätigt bekommen", so Siebertz.

So habe ihm vor allem die Erweiterbarkeit der BI-Software gefallen, da sich fehlende Funktionen direkt über ein Java-Skript einbinden ließen. Dadurch war möglich, zusätzliche Funktionen für die Datenbereinigung und zur Zusammenführung mehrerer Datenquellen zu ergänzen. Eine Schwäche der Pentaho-Lösung sei hingegen der relativ große Hauptspeicherbedarf beim erstmaligen Laden der Anwendung.

Auch kann kein BI-Tool allein eine gute Abfrageleistung im laufenden Betrieb nicht sicherstellen. Hierzu ist es vielmehr eine entsprechende Datenmodellierung, die Vorbereitung der Datenbank auf typische Abfragen (Queries) sowie die Beschleunigung besonders komplexer Abfragen durch ein ganzes Spektrum von Abfrage-Charakteristika nötig. Die Kunden von Bürgel erfahren bereits bei der Adressselektion in Echtzeit, wie sich die Zahl der ausgewählten Adressen mit jedem Selektionskriterium (wie Region, Branche, Mitarbeiterzahl usw.) verändert.

Tuning der Abfragegeschwindigkeit

"Die Abfrage in Echtzeit kann man sich so vorstellen, dass noch während der Frontend-Abfrage, die DB2-Datenbank im Hintergrund schon eine Antwort formuliert", erklärt Ingo Baden, BI-Spezialist von iTgain. Hier sorgt das Pentaho-Modul Data Integration für das Laden der Informationen in die Datenbank. Die Abfrage der Daten erfolgt unabhängig davon in nachfolgenden Prozessen. Für die erforderliche Performance der Abfrage sorgt eine entsprechende Datenmodellierung, die Vorbereitung der Datenbank auf typische Abfragen (Queries) sowie die Beschleunigung besonders komplexer Abfragen durch ein ganzes Spektrum von Abfrage-Charakteristika.

Ein weiterer Implementierungsschritt ist bei Bürgel bereits in der Planung. So ist im Bereich "Marketing Services" ebenfalls die Ablösung der manuellen Datenselektion durch Pentaho-Module angedacht. Dazu will man die bisherigen Cobol-Programme und ETL-Prozesse durch Java-Techniken ersetzen (as).

Stärken und Schwächen von Pentaho

Ingo Baden, Business-Intelligence-Spezialist von Itgain sieht folgende Vorteile und Probleme von Pentaho:

  • Pentaho stellt mit seinen Komponenten Data Integration, Mondrian, Report-Designer, Metadata-Editor und Design Studio eine modulare BI-Produktsuite bereit;

  • Pentaho biete mittlerweile über einen "Platinum-Level Subscription" vergleichbare Leistungen wie andere Anbieter (Support 7 x 24 h);

  • Die Entwicklung von Pentaho, inklusive "Meilensteine", lassen sich durch Veröffentlichungen im Internet stets nachvollziehen;

  • jeder Fehler wird öffentlich gelistet;

  • Pentaho skaliert nur begrenzt. So ist etwa wie im Fall Bürgel, eine Versorgung paralleler Datenbankknoten (IBM DB2) nicht gegeben;

  • Das stärkste Argument für Open Source sind die geringeren Kosten. Allerdings muss auch bei freier Software der künftige Wartungs- und Integrationsaufwand berücksichtigt werden. Pentaho bietet ähnlich den kommerziellen BI-Anbietern einen "Professional Support" mit vergleichbaren Leistungen. Bei Erweiterungen sei Pentaho durchaus flexibler, da die gesamte Pentaho-Suite auf Java basiert.