Relationale Datenbanken und XML

Ludger Schmitz ist freiberuflicher IT-Journalist in Kelheim. Er ist spezialisiert auf Open Source und neue Open-Initiativen.
MÜNCHEN (COMPUTERWOCHE) - Die „Extensible Markup Language“ (XML) ist die Lingua franca im Internet. Doch relationale Datenbank-Management-Systeme klassischer Art sind für das Speichern von XML-Dokumenten nicht geeignet. Deren Anbieter versuchen, durch Erweiterungen die neue Welt in die alte zu integrieren.

Nun ist auch die Datenwelt keine flache Scheibe mehr, nicht mehr schachbrettartig gegliedert in Spalten und Reihen, die Werte bergen, welche sich zueinander in Beziehungen setzen lassen. Neben dieses flache relationale Modell ist ein dreidimensionales getreten. Im Internet werden Dokumente bewegt, die nicht nur aus Buchstaben und Zahlen bestehen, sondern andere Datentypen für Bilder, Videos oder Musik bis hin zu kompletten Anwendungen umfassen, die auch noch in mehreren Ebenen baumartig (Tree) miteinander und mit anderen Dokumenten verknüpft sind. Die Grundlage dieser komplexen Dokumente, die man auch als Sammlung von Dateien ansehen könnte, ist die Metasprache XML.

Kritische Distanz: Die Grundlage des nebenstehenden Beitrags bildet die vor einem Monat erschienene Studie „Database Management Systems - Managing Relational and XML Data Structures“ von der Butler Group. In der 241 Seiten umfassenden Untersuchung schneiden die relationalen Datenbanken von Oracle, IBM und - mit geringen Abstrichen - Microsoft besonders gut ab. Daher ist zu erwarten, dass die Studie von diesen Herstellern zu Marketing-Zwecken ausgeschlachtet wird. Davor sei gewarnt.

Denn die Butler-Studie weist erhebliche Defizite auf: Sie listet nur die technischen Features von Datenbanksytemen auf, ohne zu hinterfragen, ob bestimmte Features performant arbeiten oder überhaupt notwendig sind. Letzteres führt zu Verzerrungen, da die Studie für Features Punkte unabhängig davon vergibt, um welchen Typ von Datenbank es sich handelt. So steht eine native XML-Datenbank wie Tamino im direkten Vergleich mit IBMs DB2 und Oracle 9i - und schneidet prompt schlecht ab, weil dem Produkt der Software AG relationale Features fehlen. Ein Vergleich von Äpfel und Birnen, weil Tamino nach seinem technischen Konzept nicht gegen, sondern ergänzend zu relationalen Systemen positioniert ist.

Auch die XML-bezogenen Checkpunkte der Studie sind nicht immer nachvollziehbar. So wird auf Entity-Start- und -End-Marker Wert gelegt, nicht aber auf die Unterstützung verschiedener Abfragesprachen und APIs. Diese Aspekte kommen nur in den Erläuterungen zu den einzelnen Produkten zur Sprache, werden dort aber nicht gleichermaßen beleuchtet. In einigen Punkten bestehen eklatante Widersprüche zu vorherigen Aussagen.

Aus solchen Gründen könnte sich der Blick in eine Studie lohnen, die zum gleichen Thema das US-amerikanische Unternehmen Zapthink herausgebracht hat: „XML Data Storage Technologies and Trends - Native XML Data Stores (NXDs) and XML Extensions to RDBMS“. Da sie im März dieses Jahres erschienen ist, ist sie im Falle Oracle 9i nicht auf dem aktuellen Release-Stand 2.