Wer räumt die Daten ein?

Unter der Lupe: Tools zum Füllen von Data-Warehouses

18.10.1996

Data-Warehouses werden regelmäßig von operationalen Datenbanksystemen mit Informationen bestückt. Hierzu werden derzeit vor allem Sprachen und Werkzeuge der dritten oder vierten Generation verwendet. Der Nachteil dieser Tools liegt darin, daß dabei anwendungsspezifischer und in der Regel schwer wartbarer Code entsteht. Je mehr ein Warehouse wächst, desto schwieriger wird es, die damit verbundenen Änderungen programmiertechnisch umzusetzen.

Dieses Problem nahmen die Analysten der Londoner Ovum Ltd. zum Anlaß, um das Data-Warehouse einmal aus dem Blickwinkel der Tools zu betrachten. Dabei haben sie vor allem diejenigen Produkte untersucht, die das Einbringen der Daten in einen solchen Informationslieferanten automatisieren sollen. Dieser Bereich ist deshalb besonders wichtig, weil

-hierfür zu Projektbeginn der Löwenanteil der Kosten anfällt,

-die Auswahl des richtigen Werkzeugs den Aufwand für Verwaltung und Wartung des Warehouse bestimmt und

-weil die Auswahl und Integra- tion dieser Tools zu den kniffligsten Aufgaben gehören.

Wollte man das Ergebnis der Studie auf einen Punkt bringen, so wäre "Sourcepoint" in der Verbindung mit "Passport" von der Software AG (SAG) eindeutiger Sieger mit 40 Punkten. Die vom selben Hersteller angebotene Kombination von "Sourcepoint" mit den "Natural Extract Services" kommt nur auf Platz sieben.

Passport alleine, das von der Carleton Corp., Burlington, Massachusetts, stammt, liegt einen Platz besser. Das SAG-Beispiel zeigt, daß schon die Bewertung der verschiedenden Produkte eines einzigen Herstellers unterschiedlich ausfällt. Zudem weist die Nummer eins in der Gesamtrangliste deutliche Schwächen bei der Integration fremder Datenquellen auf, obwohl Ovum gerade in dieser Kategorie die meisten guten Noten vergeben hat - nur eben für andere Anbieter.

Es wäre deshalb unfair, die Produkte in ihrer Gesamtheit zu vergleichen. Ein genereller Eindruck drängt sich jedoch auf: Fast alle Hersteller haben nach wie vor viel zu tun, was die Wartbarkeit des erzeugten Codes betrifft sowie bei der Integration ihrer Tools in verschiedene Data-Warehouse-Umgebungen.

Warehouse Manager von Prism Solutions

Die Prism Solutions Inc., Sunnyvale, Kalifornien, ist eine reinrassige Data-Warehouse-Spezialistin. Die Produkte des Unternehmens kommen mit allen gängigen Datenquellen und Warehouse-Datenbanken klar. Für die Festlegung von Regeln und Migrationsverfahren verwendet Prism allerdings eine proprietäre Programmiersprache. Die Bestückung mit Daten übernimmt der Cobol-Generator "Warehouse Manager". Die hohe Funktionalität der Prism-Tools werden durch schwer erlernbare Verfahren erkauft.

Auch ist die Prism-Terminologie nur Anwendern mit Großrechner-Kenntnissen vertraut. Der Basispreis für den Warehouse Manager liegt bei 130000 Dollar, erhöht sich jedoch je nach Anzahl der Quell- und Zielformate.

Passport von der Carlton Corp.

Passport ist ein Generator, der Cobol-Code und Job-Control-Scripts erzeugt, die der Belieferung der Warehouses mit Informationen dienen. Das PC-Werkzeug zeichnet sich durch Mechanismen aus, die sich sowohl für einfache als auch für komplexe Datenübertragungen (Mapping) eignen. Als besonders positiv hebt Ovum hervor, daß das Werkzeug die Daten auf ihre Qualität überprüfen kann und zudem ein breites Spektrum an Datenquellen zuläßt. Außerdem seien die Entwicklungswerkzeuge darauf abgestimmt, daß Business-Analytiker und Programmierer mit ihnen umgehen können.

Kritisiert werden dagegen Mängel bei den Management-Funktionen, insbesondere wenn Veränderungen anstehen. Auch verfügt Passport in der Version 5.5 nicht über eigene Middleware-Funktionen, unterstützt aber das Warehouse-API der Software AG und kann so die Management- und Middleware-Funktionen des Darmstädter "Sourcepoint"-Produkts nutzen. Der Preis richtet sich nach der Plattform, von der die Daten extrahiert werden. Stammen sie vom Großrechner, kostet das Tool 150000 Dollar, bei Midrange-Maschinen 75000 Dollar und bei LANs 37500 Dollar.

Sourcepoint von der Software AG

Das Sourcepoint-Werkzeug der Darmstädter Software AG wird in einer Variante mit Carletons Passport oder mit den hauseigenen Natural Extract Services angeboten. Sourcepoint ist für die Ausführung der Extraktion sowie für die Umsetzung der Daten in das neue Format zuständig, nicht aber für deren Spezifikation. Die Vorteile liegen in der Vereinfachung des Job-Managements und der Optimierung des Ladevorgangs bei der Belieferung von Data- Warehouses mit Daten. Diese Funktionen werden über eine offengelegte Anwendungsprogrammier-Schnittstelle (API) anderen Produkten wie Passport und den Natural Extract Services zur Verfügung gestellt.

An der Kombination mit Passport kritisieren die Autoren der Ovum-Studie, daß hier zwei Produkte mit unterschiedlichen Konzepten zusammenarbeiten müssen. Auch in der Variante mit den Natural Extract Services wird die mangelhafte Integration beanstandet, diesmal aber die von Sourcepoint mit der Warehouse-Datenbank. Zudem sei für die Datenextraktion ein 3270-Großrechnerbildschirm erforderlich. In beiden Ausführungen wird außerdem (Stand Juni 1996) das Fehlen einer Versionskontrolle bemängelt.

Visual Warehouse von der IBM

Von IBM wurden das "Visual Warehouse" in der Version 1.2, "Data Guide 1.2" und die "Visualizer"-Varianten 1.0 für Windows, 1.1 für OS/2 und 1.2 für AIX untersucht. Generell eignet sich das Komplettpaket zur Datenbestückung und Verwaltung von kleinen Warehouses, sogenannten Data-Marts.

Kräftiges Lob spendet Ovum der engen Integration mit den Anwender-Tools sowie für die Management-Features. Außergewöhnlich sei auch, wie es der IBM gelungen ist, einfache Bedienbarkeit mit hoher Funktionalität zu verbinden. Bemängelt wird jedoch, daß es für die Datenmigration lediglich einfache Endanwender-Tools sowie für komplexe Aufgaben Programmiermöglichkeiten für Spezialisten gebe. Dazwischen klaffe eine Lücke, die von Wettbewerbern üblicherweise mit einer Scripting-Sprache überbrückt wird. IBM habe hier noch nichts Vergleichbares anzubieten. Auch daß als Zielplattform nur das hauseigene DB2-System in Frage kommt, wird dem Anbieter angekreidet. Preise nennt Ovum im Falle der IBM nicht.

Enterprise Copymanager von Information Builders

Middleware-Spezialist Information Builders Inc., New York, profitiert von seiner Datenbank-Schnittstelle "EDA/SQL". Sie garantiert dem "Enterprise Copymanager 1.0" den Zugriff auf eine ungewöhnlich breite Palette an Quelldaten. Ovum gibt sich allerdings enttäuscht über die mangelhafte Integration der auf EDA/ SQL beruhenden Metadatenmodelle sowie über die schlechten Features bei der Änderung der Verteilungsverfahren.

Gelobt werden jedoch die Unterstützung für die Verwaltung von Load-jobs, die transparente Wiederverwendung der Metadatenmodelle sowie die einfache Übertragung der Daten vom vituellen in das physikalische Warehouse. Der Einstiegspreis für das Tool liegt ohne EDA/SQL bei 20 000 Dollar.

Infopump von Platinum Technology

"Infopump" läßt sich als programmierbarer Verteilungsagent beschreiben, der Daten in einem zentralen Warehouse zusammenführen kann, sie bei Bedarf von dort aber auch an Data-Marts verteilt. Im Grunde ist diese hier untersuchte Funktion aber lediglich eine von vielen möglichen Infopump-Anwendungen. Außerdem gehört das Tool zu einer breiten Palette an Data-Warehouse-Produkten von Platinum.

Als vorteilhaft gilt die einfache Konzeption des Produkts, zu der beiträgt, daß es sich über eine zentrale Konsole kontrollieren läßt. Ungewöhnlich ist, daß es die Lotus-Groupware "Notes" sowohl als Quelle als auch als Zieldatenbank unterstützt. Dafür fehlt es zumindest in der Version 1.2 an einer grafischen Oberfläche, und auch die Unterstützung von Metadatenmodellen ist laut Ovum eingeschränkt. Preise werden auch in diesem Falle nicht genannt, weil Infopump in der Regel nicht als eigenes Produkt, sondern als Teil einer integrierten Lösung ausgeliefert wird.

Das SAS System von SAS Institute

Das SAS System spielt eine Sonderrolle. Damit bietet SAS Institute schon seit Jahrzehnten eine Art Abstraktionsschicht, die die Kunden von der Heterogenität von Hardware, Betriebssystemen und Datenbanken abschirmt. Die Integration unterschiedlicher Datenquellen gab es bei dem Anbieter aus Cary, North Carolina, also schon lange vor dem Data-Warehouse-Boom. Ungewöhnlich ist auch die Preisgestaltung des Unternehmens. Die SAS-Kunden zahlen jährliche Gebühren. Der Einstiegspreis für die Data-Warehouse-Module liegt bei 50000 Dollar. Diese Summe reduziert sich allerdings von Jahr zu Jahr.

Mit der Zeit hat SAS Institute eine breite Palette an unterstützten Datenformaten angesammelt. Das System läuft auch auf vielen Client-Server-Plattformen und unterstützt dabei das Multitier-Konzept. Data-Warehouse-Interessenten, die Wert darauf legen, nur bei einem Anbieter zu kaufen, haben hier die besten Karten. Trotz der Erfahrung des Herstellers fehlt es laut Ovum allerdings an Management-Werkzeugen. Auch sei das Produkt sehr komplex und verlange eine lange Einarbeitungszeit.