Bloor nimmt MPP- und SMP-Systeme unter die Lupe

Informix und Oracle dominieren bei paralleler Datenbanktechnik

05.01.1996

Unkenntnis beherrscht den Markt der parallelen DV-Technik sowohl bei Herstellern als auch bei Anwendern. Mit dieser These leiten die Bloor-Experten ihre juengste Studie ein, in der die Parallel-Features von Datenbanken und Rechnerplattformen unter die Lupe genommen werden. Marketiers braechten Schlagworte in Umlauf und sorgten so fuer reichlich Verwirrung unter den Interessenten.

Enttaeuscht stellen die Bloor-Autoren fest, dass es die Hersteller bereits in ihrer eigenen Produktliteratur oder White Papers versaeumen, wichtige Features etwa zur Implementierung einer Paralleldatenbank zu beschreiben. Die Rede ist von einem Mythos paralleler Datentechnik, der auf Fehlinformationen aufbaut und zu Missverstaendnissen und Veraergerung beim Anwender fuehrt.

Ein von Herstellern haeufig angefuehrtes Argument sei, dass im Fall von Performance-Problemen die Aufruestung des Rechners mit weiteren oder schnelleren Prozessoren als Abhilfe ausreiche. Dies sei eine unzulaessige Vereinfachung einer komplexen Situation, auf die nicht nur die CPU-Leistung, sondern auch das Design der Datenbank und Anwendung Einfluss haetten. Als irrig bezeichnet Bloor ebenso die Annahme, dass sich Umgebungen fuer das symmetrische Multiprocessing (SMP) eher fuer mittelgrosse Installationen eigneten, waehrend massiv-paralleles Processing (MPP) im grossen Stil unternehmensweit eingesetzt werden koenne. Bei den in der Studie beurteilten Systemen haetten einige MPP-Installationen nicht die Performance der SMP-Konkurrenz erbracht, zumal die Software oft nicht in der Lage sei, die durch einen CPU-Ausbau erreichte Zusatzleistung zu nutzen.

Benchmark-Tests ohne Aussagekraft

Insofern verzichtet Bloor bei der Beurteilung auch auf Benchmark-Tests, die keine Aussagen ueber entscheidende Faktoren wie Datenbankstruktur, -umfang, Handling und Auslastung zuliessen. Die Bewertung erfolgt statt dessen nach den Kategorien:

- Marktpraesenz des Produkts und Kontinuitaet bei dessen Weiterentwicklung,

- komplexe Abfragen (dabei handelt es sich um das meistverlangte Feature in der Paralleltechnik, so dass dieses Kriterium sehr hoch gewichtet wird),

- einfache Abfragen,

- das Systemverhalten waehrend der Datenaktualisierung (Fachjargon "Update") sowie

- die Mehrfachbelastung (mehrere parallele Operationen).

Vernachlaessigt man den ersten Punkt, also die Marktpraesenz, so geht Informix als Klassensieger aus dem MPP-Vergleich hervor. "Informix DSA" zeigt mit neun von zehn erreichbaren Punkten das beste Ergebnis bei komplexen Abfragen, gefolgt von IBMs "DB2/6000 PE" und "WX9000 RDS" von White Cross Systems mit jeweils acht Punkten. In der Gesamtbewertung (inklusive Marktpraesenz) liegt Tandems "Nonstop SQL/MP" an der Spitze, wobei allerdings die enge Kopplung des Systems an die "Himalaya"-Maschinen des Herstellers beruecksichtigt werden muss.

Enttaeuschend schneiden bei den MPP-Modellen dagegen in einigen Bereichen "Openingres" von Computer Associates und der "Navigation Server" von Sybase ab. Bei dem auf "System 10" basierenden Sybase-Produkt muss allerdings in Rechnung gestellt werden, dass es innerhalb der komplexen Abfragen nicht fuer Ad-hoc-Queries konzipiert wurde und ausserdem zahlreiche Parallel-Features erst mit dem neuen System 11 eingefuehrt werden.

Unter den SMP-Implementierungen fuehren Informix und Oracle 7 das Feld an. Beide zeigen laut Bloor sehr gute Eigenschaften im Performance-Test, wobei Informix bei komplexen Abfragen vorn liegt. Das von der Software AG auschliesslich im SMP-Bereich positionierte Datenbanksystem "Adabas D" gehoert ebenfalls zu den Spitzenreitern. Unter dem Aspekt des Zielmarkts ist das maessige Abschneiden von "Red Brick Warehouse" zu sehen: Dem Hersteller kommt es beim Data-Warehousing in erster Line auf die Performance komplexer Abfragen an - hier reicht das Produkt an die Ergebnisse von Informix heran.

Neben einer detaillierten Beschreibung der einzelnen Datenbankprodukte samt ihren Architekturen listet die Bloor-Studie auch Vor- und Nachteile des jeweiligen Systems auf:

Im Gegensatz zum mittlerweile ueber zwanzig Jahre alten Klassiker "Adabas C" handelt es sich beim neuen System Adabas D um eine vollstaendig relationale Datenbank. Die Entwicklung der Software AG soll dahin gehen, dass parallele Abfragen die "Shared-everything"-Technik von SMP-Rechnern nutzen koennen. Die Daten-Partitionierung auf den Platten gestaltet sich laut Bloor in Adabas D unflexibel. Als Staerken des Systems werden die Architektur und die einfache Administration genannt. Als Einsatzgebiete empfehlen die Marktbeobachter OLTP und Data-Warehousing.

Fuer lediglich mittelgrosse OLTP-Applikationen im SMP-Umfeld soll sich CA-Openingres 1.1 eignen. Die Parallelisierung individueller Abfragen sei nicht moeglich, und im MPP-Bereich gebe es Schwaechen bei speziellen Kontrollfunktionen. Dafuer sei das Produkt mit guten Administrations-Tools sowie mit einer ungewoehnlich ausgekluegelten Daten-Partitionierung ausgestattet.

Bei IBMs DB/2 6000 hat der Anwender die Wahl zwischen zwei Varianten: Die hier von Bloor getestete Version 1.x eignet sich fuer MPP-Plattformen, waehrend Version 2.x den SMP-Markt bedienen soll. Kritisiert wird an dem fuer Data-Warehouse-Anwendungen empfohlenen System unter anderem die relativ schwache Daten-Partitionierung. Pluspunkte vergab Bloor fuer die Kontrolle der Query-Pipelines.

Eine Spitzen-Position unter den Herstellern kommerzieller Datenbanksysteme trauen die Bloor-Experten Informix zu. Der auf der Dynamic Scalable Architecture (DSA) basierende "Online Dynamic Server" eignete sich bereits in Version 6 fuer SMP-Rechner und wurde zusammen mit Sequent im Upgrade 7 hinsichtlich paralleler, auch individueller Abfragen erweitert. Mit der juengsten Version 8.0 hat sich Informix das MPP-Feld erschlossen. Das auf zahlreichen Plattformen laufende Produkt laesst sich laut Bloor fuer alle Anwendungen verwenden.

Speziell fuer Data-Warehouse-Applikationen mit vordefinierten komplexen Abfragen ist der "Navigation Server" von Sybase konzipiert. Auch Bloor sieht das System dort gut positioniert, obwohl manche Aufgaben nur unzureichend geloest sind. Weder das Update grosser Datenmengen noch die in Data-Warehouse-Anwendungen uebliche Ad-hoc-Suche seien befriedigend realisiert. Als Einsatzgebiet kommen deshalb grosse Datenbanken in Betracht, auf denen man umfangreiche Routine-Abfragen durchfuehren muss.

Tandem sitzt die Konkurrenz im Nacken

Das Schicksal von Tandems "Nonstop SQL/MP" ist laut Bloor auf laengere Sicht (drei bis fuenf Jahre) ungewiss. Der Traditionsanbieter in Sachen Parallel-Computing koenne zwar aufgrund der engen Hard- und Softwarekopplung einen beachtlichen Reifegrad des Systems vorweisen, dieser Vorsprung werde aber zusehends von der Konkurrenz aufgeholt. Als Beispiel verweist Bloor auf die juengste Verfuegbarkeit von DB2/6000 PE auf RS/6000 SP. Auch der Performance-Vorteil proprietaerer Gesamtloesungen werde bald von offenen Systemen erreicht. Grosse OLTP-Applikationen sowie mit Einschraenkung auch Data-Warehousing sind in der Tandem-Umgebung moeglich.

Von Oracle, dem derzeitigen Marktfuehrer unter den Unix-Datenbankanbietern, ist Bloor ueberzeugt, dass die im Test festgestellten Maengel bald behoben werden. Schwaechen sehen die Analysten bei der MPP- und SMP-tauglichen Datenbank Oracle 7 aufgrund einiger Einschraenkungen in der Parallelisierung von Abfragen sowie in den limitierten Moeglichkeiten des parallelen Abfrage-Processings (Pipeline Parallelism). Waehrend der Hersteller Oracle 7 als eine Art Allrounder vermarktet, wird das Ende 1994 von Digital Equipment uebernommene "Rdb"-System als OLTP-Engine fuer DEC-Umgebungen (Open VMS und Alpha) positioniert. Bloor ist der Ansicht, dass sich die Funktionen beider Systeme zunehmend ueberschneiden werden, auch wenn Oracle derzeit keine Verschmelzung der Datenbank-Engines plant. Es liege nahe, die Staerken des einen Produkts, etwa den Abfrage-Optimierer von Rdb, in das andere zu uebernehmen.

Bei dem von AT&T GIS (ehemals NCR) uebernommenen DBMS "Teradata" wurde die enge Hardwarekopplung (inzwischen "AT&T 5100") und damit der Vorteil eines Komplettsystems teilweise aufgegeben. Die Loesung ist nun auch auf Unix-Plattformen portierbar. Eine durchgaengige OEffnung, wie urspruenglich von NCR geplant, wurde jedoch nicht realisiert. Diese Zwitterposition wertet Bloor als Schwaeche. Kontrollfunktionen fuer Abfrage und Ergebnisse werden als Produktstaerke bezeichnet, Minuspunkte verzeichnen dagegen die Query-Pipelines sowie die unflexible Datenorganisation auf dem Speichermedium.

Ein reines Data-Warehouse-Produkt kommt von Red Brick Systems. Das Unternehmen war der Ansicht, dass sich OLTP-Anwendungen so grundsaetzlich vom Data-Warehousing unterscheiden, dass sich beide Applikationen nicht in einem Produkt vereinen lassen. Die im Red Brick Warehouse speziell verwendeten Indizierungsstrukturen wurden allerdings in aehnlicher Weise mittlerweile auch von anderen Herstellern uebernommen.

Die ausschliesslich an die Hardware WX9000 gekoppelte Loesung WX9000 RDS des britischen Herstellers White Cross kann sich ausserhalb des Koenigreichs keiner nennenswerten Verbreitung erfreuen. Da sich das Produkt strikt an Standards wie SQL und ODBC haelt, zeigt es seine Staerken speziell in einem Microsoft-Netzwerk. Von OLTP-Anwendungen wird abgeraten, den Einsatz als Data-Warehouse mit komplexen Abfragen in mittelgrossen Datenbanken haelt Bloor dagegen fuer gerechtfertigt. Es bleibt der Eindruck, dass Bloor dieses Produkt nur aufgrund seiner nationalen Verbundenheit in die Testreihe mitaufgenommen hat.