IBM will Data Warehousing billiger machen

31.10.2006
Die neue Datenbank-Engine "Viper" bringt Datenkompression, Partitionierung und XML-Support.

Für Dezember plant IBM ein Update seiner Produktsuite "DB2 Data Warehouse Edition" zum Aufbau von Data-Warehouse-Lösungen. Sie wird auf der Datenbank- Engine DB2 9, Codename "Viper", basieren, die der Hersteller zur Jahresmitte auf den Markt brachte, und soll von einer Reihe ihrer neuen Features profitieren. So verfügt Viper unter dem Codenamen "Venom" über Mechanismen zur Datenkompression, die laut Richard Wozniak, Marketing Director für Business Intelligence bei IBM, den Speicherbedarf, die Netzlast und Hardwarekosten erheblich senken helfen. "Wir haben Kostenersparnisse zwischen 20 und 30 Prozent bei Kunden festgestellt", sagte der Manager gegenüber der computerwoche auf der Veranstaltung "Information on Demand" im kalifornischen Anaheim. Ihren Ursprung hat die hardwarebasierende Kompressionstechnik in der bisherigen Mainframe-Version von DB2.

Mehr zum Thema

www.computerwoche.de/

1214902: XML-Technik in DB2;

583136: Produktstrategie Daten-Werkzeuge.

Tools für Data Warehousing

Die DB2 Data Warehouse Edition umfasst:

• Design Studio: einheitliche Entwurfsumgebung für das Modellieren von physischen Daten, Olap-Würfeln, Data Mining und SQL- Datenflüssen und -Steuerungsflüssen. Design Studio basiert auf der Eclipse-Workbench.

• SQL Warehousing-Tool (SQW): grafisch orientiertes Tool, das SQL für die Pflege und Verwaltung von Data-Warehouses generiert, um manuell codiertes SQL zu ersetzen. Es erzeugt automatisch DB2-spezifisches SQL basierend auf visuellen Operatorflüssen, die im DWE Design Studio modelliert wurden.

• Verwaltungskonsole: eine Websphere-Anwendung, die ein Tool für die Verwaltung von BI-Anwendungen bereitstellt, die mit DWE Design Studio erstellt wurden.

• DB2 Query Patroller: verwendet die Schätzung des Abfrageaufwands des DB2-Optimierungsprogramms, um die Auslastung des Data Warehouse zu erfassen. Die Software gleicht projektierte Ressourcenkosten mit vordefinierten Benutzerprofilen, Systemschwellenwerten und Warteschlangenkriterien ab und leitet Abfragen dynamisch weiter.

• DB2 Cube Views: Die Komponente arbeitet mit der zugekauften Technik von Alphablox oder mit BI-Tools anderer Hersteller zusammen, um Olap-Abfragen in DB2 zu beschleunigen. Sie verwendet mehrdimensionale Modelle, um DB2-Laufzeitobjekte zu erstellen, die kritische Dimensionen und Ebenen (Schichten) des Würfels enthalten.

• Intelligent Miner: verwendet Algorithmen zur Analyse von Data-Warehouse-Daten, um beispielsweise Kundenverhalten und Geschäftstrends aufzudecken.

• DB2 Alphablox: dient zur schnellen Erstellung benutzerdefinierter Web-basierender Analyseanwendungen.

Endliche Partitionierung möglich

Ebenfalls wird ein von Data-Warehouse-Kunden seit langem gefordertes Feature verfügbar: Möglichkeiten zur leistungsverbessernden Aufteilung von Datenbankobjekten. Viper wartet als einzige Datenbank im Markt mit verschiedenen Optionen zur Datenpartitionierung auf: "Range Partitioning", "Database Partitioning" und "Multidimen- sional Clustering". Zudem sollen Kunden auch von den neuen XML-Features in Viper profi- tieren. Statt wie bisher XML als Blob (Binary Large Object) zu speichern oder XML-Struktur auf relationale Strukturen ab- zubilden, speichert Viper mit "pureXML" die XML-Datei selbst - mit all ihren Eigenschaften und ihrer hierarchischen Struktur. Dadurch könnten künftig auch Data-Warehouse-Lösungen Informationen in XML besser abspeichern.

Eine weitere Neuerung betrifft die Datenbewirtschaftung des Systems. Hier können Kunden künftig den neuen "IBM Information Server" nutzen, in dem unter anderem Technik des Datenintegrationsspezialisten Ascential aufgegangen ist. Der Information Server sei vor allem dann eine Option, wenn das Data Warehouse aus verschiedenen Quellsystemen gespeist wird, erklärte Wozniak. Kunden könnten aber weiterhin auch Software beispielsweise von Informatica nutzen oder - wie dies offenbar öfter geschieht - ihre Daten über "Microsoft SQL Server" und dessen Datenbewirtschaftungstechnik beziehen.

Laut Wozniak können Kun- den mit Wartungsverträgen für die DB2 Data Warehouse Edi- tion kostenlos upgraden. Man werde versuchen, die Migra- tion "so schmerzlos wie möglich zu gestalten". Um eine Anpassung bisheriger Datenbank- schemas führe allerdings kein Weg herum, da sich nur so die neue Partitionierungstechnik ausnutzen lasse. Grundsätzlich gehe es auch im kommenden Release darum, die Systemverwaltung zu erleichtern. Dies schließt auch eine Vermarktung von Data-Warehouse-Appliances ein, die Hardware, Software, Speicher und Dienstleistungen umfassen.

Neue Appliances

Erste dieser "Balanced Configuration Units" kamen als Pakete für AIX (auf "X-Servern") und Suse Linux (auf "E-Servern") zu Jahresbeginn auf den Markt. Kunden erhielten genauere Leistungsprofile, da eine BCU die CPU-Nutzung, den I/O-Durchsatz und Speicherbedarf kontrolliere. Kürzlich gesellte sich eine Version für Red Hat Linux hinzu. Sie enthält neben der DB2 Data Warehouse Edition den E-Server "326m" und das Speichersystem "Total Storage DS 4800". Bisher sind BCU mit einem Ein-Terabyte-Speicher versehen. Es soll aber künftig auch kleinere Angebote mit 300 GB geben, hieß es auf der Veranstaltung.

Strategisch will IBM sich auch künftig auf die Lieferung von Infrastrukturkomponenten für Data Warehousing und Business Intelligence konzentrieren. Frontends für Analyse und Reporting sollen weiterhin von Partnern wie Cognos, Business Objects und Hyperion kommen, sagte Wozniak.

Oracle hinkt hinterher

Mit den Features von Viper habe man im Moment im Markt für Highend-Systeme für Data Warehousing gegenüber Konkurrenten wie Oracle und Teradata die Nase vorn, behauptet Wozniak. Oracle beispielsweise habe noch nicht einmal mit dem Betaprogramm seiner nächsten Datenbankgeneration begonnen, die angeblich einige der Viper-Features enthalten werde, sagte Wozniak gegenüber dem Brancheninformationsdienst "Computergram". Erst Ende 2007 soll die nächste Datenbankversion von Oracle kommen.