Sand bringt Nucleus nach Deutschland

Die etwas andere Datenbank für Warehousing

21.12.2001
MÜNCHEN (CW) - Mit einer eigenen, für analytische Anwendungen modifizierten relationalen Datenbanktechnik will die kanadische Firma Sand Technology neue Maßstäbe im Bereich Data Warehousing setzen. Die darauf basierende Produktfamilie "Nucleus" soll über eine Hamburger Niederlassung jetzt auch in Deutschland etabliert werden.

Wer umfangreiche Kunden- und Detaildatenbestände ausführlich analysieren will, stößt schnell an Grenzen, sofern seine Anwendung auf einer relationalen, für operative Transaktionssysteme entwickelten Datenbank beruht. Dieser Auffassung ist man bei Sand Technology, einem Anbieter für analytisches Customer-Relationship-Management, Data Mining, Data Marts und Data Warehousing. Eingeschränkt seien vor allem die Möglichkeiten für unlimitierte Ad-hoc- und What-if-Analysen, die täglich anfallende Verarbeitung von eventuell mehreren Millionen Datensätzen sowie das zeitnahe Darstellen operativer Aktionen.

Diesem Anspruch soll die "Nucleus Analytical Suite" mit ihrer 64-Bit-RDBMS-Technik gerecht werden. Zwei Verfahren sorgen für die Geschwindigkeit. Zum einen arbeitet das System spaltenorientiert, wobei ein "Optimizer" die für eine Abfrage benötigten Spalten aus einer Tabelle "on-the-fly" zusammenstellt und wieder entfernt. Letztlich ist es also unerheblich, wie viel Spalten eine Tabelle insgesamt enthält. Das zweite Performance-Feature besteht darin, dass die Datenbank sämtliche Spalten ausschließlich Bitmap-orientiert indiziert. Jedem Datum, etwa dem Namen einer Stadt, wird eine Bit-Folge zugeordnet. Dieser Wert benötigt nicht nur weniger Speicherplatz, was sich besonders bei ständigen Wiederholungen eines Datums bemerkbar macht, sie lässt sich auch deutlich schneller finden.

Zwar bieten andere relationale Datenbanken ebenfalls die Möglichkeit, mit Bitmap-basierten Indizes zu arbeiten, bei Nucleus muss man diese jedoch nicht eigens erstellen: Das Bitmap wird automatisch mit dem Laden der Daten aufgebaut. Von Vorteil ist dies, so der Hersteller, vor allem bei besonders großen Datenmengen. In anderen relationalen Systemen würde man bei großen Volumen diese Art der Indizierung üblicherweise nicht anwenden.

Ein weiteres Argument für sein Produkt sei die bei relationalen Datenbanken im Lauf der Zeit auftretende Fragmentierung der Indizes. Dies könne bei Nucleus nicht passieren, da der Index vom System her gepflegt werde. Schließlich wird als Pluspunkt die Kompression der Bitmaps ins Feld geführt, was sich ebenfalls gerade bei großen Datenmengen günstig auf die Performance auswirkt - zumal die für Abfragen in den Speicher geladenen Bitmaps nicht dekomprimiert werden.

In Sachen Benutzerfreundlichkeit bietet Nucleus neben der physischen eine virtuelle Datenbank. Dort können Anwender eine persönliche Sicht auf die von ihnen benötigten Informationen einrichten und zum Beispiel What-if-Analysen betreiben.

All diese Features haben laut Sand Auswirkungen auf die Betriebskosten. Zum einen erlaube die performante Technik den Einsatz einfacherer Hardware, als dies bei anderen Data-Warehouse-Lösungen der Fall ist. Außerdem sei die Datenbank aufgrund der Indizierungsmechanismen sowohl in ihrem Aufbau als auch während der späteren Wartung (Optimierung) und Administration sehr viel einfacher zu bedienen.

Derartige Aussagen untermauert die Hamburger Sand-Niederlassung mit der Kostenrechnung eines namentlich nicht genannten deutschen Großunternehmens. Dort traf man auf eine bestehende Data-Warehouse-Umgebung mit DB2 unter OS/390 sowie einer darauf aufsetzenden Business-Intelligence-(BI-)Architektur. Die Berechnung ergab, dass sich die gleiche Data-Warehouse-Applikation mit Nucleus als Datenbank unter AIX oder Windows NT deutlich günstiger betreiben lässt. Vor allem bei den über vier Jahre kumulierten Kosten zeigte sich, dass gegenüber dem Host-Betrieb das Data Warehouse unter AIX um etwa 12 Prozent, unter Windows NT gar um 58 Prozent billiger ausfällt. (ue)

Abb: Aufwandsanalyse

Wie viel lässt sich einsparen, wenn eine Data-Warehouse-Applikation auf einem Host (OS/390) mit DB2 oder mit Nucleus als Datenbank unter AIX oder Windows NT betrieben wird? Die hier aufgeführten Zahlen stammen von einem deutschen Großunternehmen, das wissen wollte, ob sich ein Umstieg von der vorhandenen Großrechner-Infrastruktur im Bereich Data Warehousing lohnt. Das extremste Ergebnis: Über vier Jahre kumuliert lassen sich mit Windows NT als Nucleus-Plattform gegenüber dem Host-Betrieb über 1,1 Millionen Euro einsparen. Allerdings gilt es zu hinterfragen, ob man auf die Management-Features des Mainframes verzichten kann. Quelle: Sand