2007: Der Markt für Datenbanken - Von der Tabelle zum Baum

Schulze ist freier Autor der Website CIO.de und dem CIO-Magazin.
Obwohl Datenbanken als ausgereift und wenig innovationsträchtig gelten, stellen XML-Daten und Business Intelligence die Anbieter vor große Aufgaben. Diese sind erst zum Teil gelöst.

Die reinen Datenbank-Engines sind am Ende ihres Innovationszyklus angekommen", kommentierte Andreas Zilch, Vorstandsmitglied der Experton Group, den Datenbankmarkt im Jahr 2005 (siehe COMPUTERWOCHE Top100 von 2005). "Alle wichtigen Neuerungen werden heute darauf aufbauend entwickelt." Die Innovationskraft fließe in Business Intelligence (BI) oder Data Warehousing. Diese Prognose hat sich bewahrheitet. Für das Gros der Anwender nur wenig sichtbar sind die Datenbank-Management-Systeme der großen Anbieter dabei, die nächste Sprosse der Evolutionsleiter zu erklimmen.

Datenbanken gelten als ein Ruhepol der IT-Landschaft. Die Produkte und Technologien haben sich seit den Anfängen der digitalen Informationsverarbeitung beständig weiterentwickelt und wirken seit vielen Jahren ausgereift. Seit langer Zeit ist es Stand der Technik, Daten relational zu speichern ein Verfahren, das bereits 1970 vom 2003 verstorbenen britischen Mathematiker Edgar F. Codd vorgeschlagen wurde. Das relationale Datenbankmodell basiert im Wesentlichen darauf, Daten in Tabellen zu speichern und über relationale Algebra abzufragen. Formuliert werden diese Abfragen mit SQL, der "Structured Query Language". Diese Methodik hat sich sehr gut bewährt und ist für die meisten traditionellen Einsatzszenarien bestens geeignet.

XML und BI als Herausforderung

Doch IT wäre nicht IT, wenn sich nicht fortlaufend neue Technologien abzeichnen würden, die auch neue Einsatzfelder und -methoden eröffnen. Die aktuellen Schlagworte dazu sind Business Intelligence (BI) und Extensible Markup Language (XML). Hinter diesen zwei Begriffen verbergen sich aus Sicht der Datenbanken zwei große Herausforderungen, denen nicht mit dem tradierten Tabellenmodell der Speicher-Engines begegnet werden kann.

Die zehn größten Datenbankanbieter in Deutschland 2006 nach Umsatz (Quelle: Gartner)

Hersteller

Marktanteil (in Prozent)

1. Oracle

32,2

2. IBM

31,7

3. Microsoft

21,4

4. Teradata

3,0

5. Sybase

2,5

6. Software AG

1,9

7. Progress Software

1,1

8. CA

0,9

9. Open-Source-Anbieter

0,9

10. InterSystems

0,7

Vor allem neue Datenarten machen den relationalen Datenbanken zu schaffen. "Aktuell befasst sich die Forschung in diesem Bereich mit Datenarten, die sich nicht ohne weiteres in strikt relationalen Tabellen abbilden lassen", erläutert Torsten Grust, Professor am Lehrstuhl für Datenbanksysteme der Technischen Universität München. "Zum einen geht es um unstrukturierte Daten also Text. Bislang lag der Fokus dabei auf der Suche nach Schlüsselwörtern. Mittlerweile hat sich dieser Bedarf geändert, die Anwender benötigen mehr Informationen als nur reine Fundstellen." So sollten Datenbanken heute zum Beispiel in der Lage sein, Abfrageergebnisse nach Relevanzkriterien zu sortieren ganz ähnlich, wie die Anwender es von Internet-Suchmaschinen kennen. Hierfür seien andere Index-Technologien erforderlich als für die Suche in strukturierten Tabellen.

Besonderes Gewicht legt die Forschung jedoch auf den Bereich der XML-Daten: "XML-Daten sind nicht in Tabellen strukturiert, sondern als hierarchische Bäume", so Grust. Da in relationalen Datenbanken auch XML als reine Zeichenfolgen verarbeitet und Abfragen in SQL formuliert werden, lassen sich viele für XML typische Operationen nicht durchführen. "Inzwischen sind die Datenbanken so weit, dass sie die Baumstruktur von XML beibehalten können. Bei IBMs DB2 ist das zum Beispiel in der Version 9 der Fall", erläutert Grust.

Allerdings sieht Grust hier noch viel Optimierungspotenzial. "Die Performance ist noch nicht in allen Bereichen so, wie sie sein könnte." Da die jetzt verfügbaren XML-fähigen Datenbanken vor allem auf kleine Datenblöcke wie XML-Messages ausgerichtet sind, wie sie zum Beispiel bei Verträgen in der Finanzbranche anfallen, lässt die Leistungsfähigkeit aus Sicht des Professors bei großen Datenmengen oder sehr komplexen Abfragen noch zu wünschen übrig. Er gibt aber zu bedenken: "Wir können beim Umgang mit relationalen Daten auf über 30 Jahre Erfahrung zurückgreifen, während XML-Daten erst seit wenigen Jahren ein Thema sind."

Auch in das Thema Business Intelligence stecken die Hersteller viel Geld und Engagement. Vor allem die Marktführer IBM, Oracle und Microsoft versuchen, immer mehr Merkmale der BI direkt in die Datenbanken zu integrieren. Dabei geht es in erster Linie darum, die Erstellung der Berichte aus den gesammelten Daten zu beschleunigen und so die Arbeit der darauf aufbauenden BI- und Data-Warehousing-Tools zu erleichtern. Hier können vor allem die drei Marktführer trumpfen und den über Jahre implementierten Funktionsumfang ihrer Datenbank-Management-Systeme ausspielen.

Allerdings ist die Open-Source-Welt hier nicht untätig. So ist zum Beispiel MySQL dabei, mit NitroDB eine neue Speicher-Engine in die Open-Source-Datenbank zu integrieren, die vor allem bei Data Warehousing eine Leistungssteigerung verspricht. Laut Kaj Arnö, Vice President of Open Source Community Relations von MySQL, will das schwedische Unternehmen zudem BI-Merkmale in den Kern des Datenbanksystem integrieren und diese so unabhängig von der verwendeten Speicher-Engine nutzbar machen.

Open Source auf niedrigem Umsatzniveau

Ob Open-Source-Datenbanken ihren Marktanteil auf diese Weise signifikant vergrößern können, bleibt abzuwarten. Laut den Marktforschern von Gartner können alle freien Datenbanken zusammen gerade mal 0,9 Prozent Marktanteil nach Umsatz am deutschen Datenbankmarkt 2006 für sich reklamieren. Im Vorjahr waren es zumindest noch 0,7 Prozent. Die ersten drei Plätze machten 2006 wie schon seit Jahren Oracle mit 32,2 Prozent, IBM mit 31,7 Prozent und Microsoft mit 21,4 Prozent unter sich aus. Der Unterschied zwischen Platz eins und Platz zwei ist schon fast traditionell sehr gering, Oracle und IBM wechseln sich mit schöner Regelmäßigkeit bei der Marktführerschaft in Deutschland ab. IBM profitiert in Deutschland zwar von seiner großen installierten Basis im Mainframe-Bereich, doch ist hier kein nennenswertes Neukundengeschäft zu melden. Oracle kann dagegen auf eine breite Basis im SAP-Umfeld bauen.

Schwer Fuß zu fassen

Für kleinere Anbieter oder gar für Open-Source-Produkte ist es schwierig, in diesem Bereich Fuß zu fassen. Immerhin geht es oft um die Untermauerung unternehmenskritischer Anwendungen, wo Migrationsprojekte aus gutem Grund selten sind. Die Chancen auf höhere Marktanteile für Open-Source-Lösungen und auch für kleine Anbieter so sie sich nicht auf klare Nischen spezialisiert haben finden sich also überwiegend bei neuen Projekten auf der sprichwörtlichen grünen Wiese.

Dennoch scheint das Geschäftsmodell der Open-Source-Datenbanken die Marktriesen zu beunruhigen. Unternehmen wie MySQL generieren ihre Umsätze durch Wartungs- und Supportoptionen, die für den Einsatz der freien Software im Unternehmen unverzichtbar sind. Diesen Weg hat nun auch Big Blue jüngst eingeschlagen. Bereits seit einiger Zeit stellt IBM eine funktional reduzierte Version seiner DB2-Datenbank unter dem Namen "DB2 Express-C" kostenlos zur Verfügung. Nun bietet das Unternehmen ähnlich wie zum Beispiel MySQL dazu einen optionalen, kostenpflichtigen Support an, der über eine jährliche Wartungspauschale von knapp 3000 Dollar pro Server abgerechnet wird. Es kann fast als sicher gelten, dass IBM mit diesem Angebot den Open-Source-Datenbanken Marktanteile entziehen kann.

Eine Zeit lang sah es so aus, als wären Datenbanken und der Markt erstarrt. Die neuen Anforderungen wie XML sowie das noch bescheidene Wachstum der Umsätze mit Open-Source-Datenbanken scheinen den Markt zu beleben und für die Anwender spürbare Vorteile zu bringen: In Form neuer technologischer Möglichkeiten und mehr Vielfalt vor allem im unteren Preissegment.