Der Datenbankmarkt im Umbruch

08.12.2008
Von 


Sascha Alexander ist seit vielen Jahren als Redakteur, Fachautor, Pressesprecher und Experte für Content-Strategien im Markt für Business Intelligence, Big Data und Advanced Analytics tätig. Stationen waren unter anderem das Marktforschungs- und Beratungshaus BARC, die "Computerwoche" sowie das von ihm gegründete Portal und Magazin für Finanzvorstände CFOWORLD. Seine Themenschwerpunkte sind: Business Intelligence, Data Warehousing, Datenmanagement, Big Data, Advanced Analytics und BI Organisation.
Die Machtverhältnisse schienen lange geklärt. Doch neue technische Entwicklungen und Konkurrenten fordern die Platzhirsche heraus. Eine Datenbank für alle Zwecke gilt nicht mehr als ideal.

Erdrückend ist heute die Vorrangstellung von Oracle, IBM und Microsoft. Laut Berechnungen von IDC konnten sie 2007 zusammen rund 80 Prozent der Umsätze mit relationalen, aber auch nichtrelationalen Datenbank-Management-Systemen (DBMS) einstreichen. Die Anbieter profitieren davon, dass das Datenbankgeschäft als relativ krisensicher gilt, da Firmen ein DBMS als Grundpfeiler ihrer IT-Landschaft betrachten und unternehmenskritische Anwendungen darauf betreiben. So verzeichnete der Datenbankmarkt in den letzten Jahren ein kontinuierliches Wachstum, das den Großen der Branche zweistellige Umsatzsteigerungen brachte. Besonders die Anwendungsgebiete Stammdatenverwaltung, Business Intelligence/Data Warehousing und die ständig zunehmenden Datenmengen treiben die Nachfrage. Allerdings sind angesichts der aktuellen Wirtschaftsentwicklung sowohl IDC als auch die Marktforscher von Gartner vorsichtiger in ihren Prognosen für 2009. Sie erwarten eine Wachstumsdelle.

Den Nutzen und die Bedeutung von DBMS wird zwar kaum ein Anwender grundsätzlich in Frage stellen. Viele müssen aber aus einem anderen Grund ihre bisherige Datenbankstrategie überdenken: Es ist nicht mehr selbstverständlich, mit einem DBMS die immer vielfältigeren Anforderungen in puncto Datenmenge und -typen sowie Zugriffsmethoden optimal abdecken zu können. Im Gegenteil: Seit einigen Jahren wächst die Vielfalt der Systeme, die beispielsweise als XML-Speicher, als Suchmaschinen oder als spezielles Data-Warehouse-System genutzt werden (siehe Kasten "Spezialisierung"). Vor allem das mit Abstand größte Marktsegment der relationalen DBMS (geschätztes Marktvolumen bis Ende 2008: 19 Milliarden Dollar) ist von dieser Entwicklung betroffen, auch wenn dies gemessen an der reinen Umsatzverteilung zunächst nicht den Eindruck macht.

Vielfalt relationaler Datenbanken

So lassen sich die RDBMS grob in vier Gruppen untergliedern, die allerdings viele Überschneidungen aufweisen. Da sind zum Ersten die in puncto Features und Performance (Transaktionsunterstützung) im Highend angesiedelten OLTP-Systeme von Anbietern wie Oracle, IBM (DB2) sowie mittlerweile Microsoft (SQL Server). Ferner finden sich auf Data Warehousing spezialisierte DBMS allen voran von Teradata, gefolgt von Sybase und neueren Anbietern wie Netezza, Datallegro (jetzt bei Microsoft), Paraccel, Vertica, Infobright, Greenplum, Kognitio und anderen, die insbesondere große Datenmengen laden und schnell lesen sollen. Eine weitere Gruppe bilden Datenbanken, denen noch einige Highend-Features fehlen oder die einem anderen Vertriebsmodell folgen. Hierzu gehören auch die Open-Source-Datenbanken wie MySQL (jetzt bei Sun Microsystems), PostgreSQL oder Enterprise DB, Reseller-Produkte wie Progress Openedge oder Pervasive PSQL sowie abgespeckte Highend-Versionen. Als vierte Gruppe könnte man eingebettete relationale Datenbanken betrachten, zu denen Angebote wie "Oracle Timesten", "Sybase SQL Anywhere" und "Soliddb" zählen.

Typische Auswahlkriterien, insbesondere für Highend-Systeme, bleiben weiterhin Hochverfügbarkeit, Ausfallsicherheit, Leistung, Skalierbarkeit, Sicherheit, Lizenzkosten, Wartungsgebühren, der Aufwand für Entwicklung und Verwaltung und unterstützte Datentypen. Allerdings zeigt die Praxis auch, wie schwer es für Anwender ist, DBMS zu vergleichen, da öffentliche Bewertungen und Benchmarks wenig helfen. Gerade bei den neueren Produkten raten Praktiker zum ausführlichen Prototyping und Tests.

Nibelungentreue der Anwender

Oft kommt es aber gar nicht so weit, weil insbesondere große Unternehmen aus Tradition einen bevorzugten Datenbankanbieter haben, der ihnen im Gegenzug für ihre Treue Rabatte bei den Lizenz- und Wartungskosten einräumt. Zudem versuchen die führenden Anbieter durch immer neue Highend-Features und Zukäufe entsprechender Techniken, ihren Kunden ein "One-Stop-Shopping" für alle Lebenslagen zu bieten - gegen entsprechenden Aufpreis. Abgesehen davon ist die Migration einer bestehenden Datenbank aufgrund der auf ihr basierenden, oft unternehmenskritischen Anwendungen oft komplex und teuer. Über Jahre wurden zudem Ressourcen und Wissen aufgebaut, die bei einem Umstieg auf ein anderes Produkt zunächst fehlen würden. Unternehmen werden daher auch in Zukunft ihre laufenden Systeme nicht ohne triftigen Grund austauschen, sondern eher gezielt ergänzen.

Konkurrenten und Neulinge haben daher bei den lukrativen Großkunden kaum Chancen, sich mit ihren Angeboten als zentrale Datenbank zu etablieren. Allerdings gelingt es ihnen mit wachsendem Erfolg, an zwei anderen Stellen die Trutzburg der RDBMS-Anbieter zu stürmen: in Anwendungsfällen, bei denen es nicht auf Highend-Features ankommt, die sowieso nur wenige Kunden wirklich brauchen, sowie im Data Warehousing (siehe Seite 16: "Datenbanken wachsen zu Appliances").

Verkannte Konkurrenz

Wie der Datenbankexperte Kurt Monash weiß, gibt es gute Gründe, sich einmal die vielen Cousins von Oracle, IBM oder Microsoft näher anzuschauen. Diese von Monash auch als "Midrange"-Systeme bezeichneten RDBMS könnten mittlerweile in vielen Funktionen und Finessen mit den führenden Anbietern mithalten. Vor allem aber verursachten sie (wie auch neuere Data-Warehouse-DBMS) durch ihr modernes Design einen wesentlich geringeren Pflegeaufwand (Indexverwaltung) als die altgedienten Produkte, so Monash.

Daran ändere auch die Tatsache wenig, dass Highend-Systeme grundsätzlich die besseren Administrationswerkzeuge bereitstellten. So sei beispielsweise der Erfolg von Microsofts SQL Server anfänglich vor allem auf seine guten Tools zurückzuführen gewesen. Oracle konnte unter anderem mit Hilfe des zuvor bei Borland beschäftigten Usability-Gurus Dan Rosenberg seine Werkzeuge verbessern. Oft ist es aber auch dem Wissen in den Anwenderunternehmen geschuldet, dass die Verwaltungskosten der Datenbank nicht aus dem Ruder laufen.

Schwerer fällt ein Leistungsvergleich. So würden die meisten OLTP-DBMS bei einfachen Anwendungen auf einem Prozessor eine vergleichbare Performance liefern. Allerdings würden sich zum Teil erhebliche Unterschiede etwa bei der Replizierung offenbaren. Das Gleiche gelte für die Skalierbarkeit, die bei Ein-Prozessor-Systemen kaum Unterschiede zeige. Bei Acht-Prozessor-Systemen kämen hingegen manche Midrange-Produkte bereits ins Straucheln, andere Angebote könnten durchaus noch mehr Prozessoren unterstützen. Auch könnten Midrange-Systeme bei kritischen Funktionen für Failover oder Replikation noch nicht mit den Marktführern mithalten.

Open Source nur mit Bedacht

Gartner-Analyst Donald Feinberg rät daher, insbesondere die Open-Source-DBMS unter den Midrange-Systemen wie MySQL oder PostgreSQL trotz laufender Verbesserungen ihrer Stabilität und Leistung nicht für unternehmenskritische Anwendungen zu verwenden. Sie seien derzeit vor allem als Basis für weniger kritische Web- und Portalanwendungen eine gute Wahl.

Auch die von Open-Source-Anbietern gegen die etablierten Hersteller ins Feld geführten geringeren oder fehlenden Lizenz- und Wartungskosten seien langfristig kein eindeutiger Vorteil. So gibt es laut Monash in der Praxis auch bei kommerziellen Produkten viel Verhandlungsspielraum hinsichtlich der Lizenz- und Wartungskosten, und laut Feinberg fällt ein Supportvertrag für quelloffene Datenbanken auf Dauer nicht wesentlich günstiger aus als einer für die etablierte Konkurrenz.

Ganzheitliche Betrachtung

Dennoch: Trotz vieler, oft gradueller Unterschiede zwischen den Datenbankfunktionen oder etwa in der Zahl unterstützter Datentypen sowie den verhandelbaren Lizenzkosten bleibt unter dem Strich festzustellen, dass ein rein technischer Vergleich der RDBMS nicht mehr genügt. Vielmehr sollten Unternehmen künftig mehr auf die Total Cost of Ownership (TCO) achten. Diese wird in der Datenbankwelt durch vier Faktoren beeinflusst:

- Performance (Durchsatz und Latenz) je nach Konfiguration und genutzter Hardware;

- Features, die den Programmieraufwand verringern helfen;

- Administrationsfunktionen und Tools;

Drei gegen den Rest

2005

2006

2007

Gesamter Marktanteil 2007

Wachstum von 2006 auf 2007

Oracle

6,396 Mrd. Dollar

7,365 Mrd. Dollar

8,343 Mrd. Dollar (davon 7 Millionen Dollar mit nichtrelationalen DBMS)

37,6 %

13,3 %

IBM

4,017 Mrd. Dollar

4,397 Mrd. Dollar

4,879 Mrd. Dollar (davon 926 Millio-nen Dollar mit nichtrelationalen DBMS)

22,0 %

11,0 %

Microsoft

3,593 Mrd. Dollar

4,215 Mrd. Dollar

4,670 Mrd. Dollar (davon 1,190 Mrd. Dollar mit nichtrelationalen DBMS)

21,0 %

10,8 %

Sybase

0,531 Mrd. Dollar

0,591 Mrd. Dollar

0,658 Mrd. Dollar

3,0 %

11,3 %

Teradata

0,542 Mrd. Dollar

0,558 Mrd. Dollar

0,630 Mrd. Dollar

2,8 %

12,9 %

- das Geld, das der Kunde beim Hersteller lässt.

Spezialisierung

Datenbank-Management-Systeme gibt es heute in verschiedenen Ausprägungen. Denkbar wäre beispielsweise eine Untergliederung in:

  • OLTP-Systeme für die schnelle Transaktionsverarbeitung;

  • analytische/Data-Warehouse-Systeme (zeilen- oder spaltenbasierende Speicherung) für große Datenmengen und gute Ad-hoc-Abfragen;

  • wissenschaftliche Datenbanken wie Matlab;

  • Speicher für semistrukturierte Metadaten im RDF-Format (Resource Description Framework);

  • XML-Speicher;

  • Suchmaschinen, die heute jeweils eigene Datenbank-Engines nutzen;

  • Streaming Processing Engines für Echtzeitdaten wie zum Beispiel Stream SQL;

  • (funktional abgespeckte) Datenbanksysteme beispielsweise für eingebettete Lösungen.