Oracle Senior IT

Massive Parallelverarbeitung bei Big Data

Quo vadis, Data Warehousing?

10.04.2012
Von 
Dr. Klaus Manhart hat an der LMU München Logik/Wissenschaftstheorie studiert. Seit 1999 ist er freier Fachautor für IT und Wissenschaft und seit 2005 Lehrbeauftragter an der Uni München für Computersimulation. Schwerpunkte im Bereich IT-Journalismus sind Internet, Business-Computing, Linux und Mobilanwendungen.

Was MPP bringt

Eine Migration der bestehenden Datenbank zu einer MPP-Datenbank wirkt sich laut dem Analysepapier vor allem positiv auf die Parameter Kosten, Performance, Komplexität und Funktionalität aus.

  • Kosten
    Bei einer MPP-Datenbank müssen keine Heerscharen an Beratern beschäftigt werden, die Hilfstabellen, Materialized Views, Bitmap-Indizes und SQL-Programme erstellen, um beispielsweise Ladeprozesse einige Minuten schneller zu machen. Auch die ständigen Bemühungen um eine Beschleunigung von Reporting und Analyse, damit die Antwortzeiten den Vorstellungen der Anwender entsprechen, sind damit hinfällig. Vielmehr reduziert sich durch die automatischen Optimierungsmodelle des Master-Servers die gesamte Datenbank-Administration bei vielen Anbietern auf einen Bruchteil.

  • Performance
    Sämtliche MPP-Anbieter gehen je nach Aufgabenstellung von einem Performancegewinn mit Faktor 10-120 aus. Das ergibt in jedem Fall genug Reserven für die mittlere Zukunft. Zusätzlich sind die neueren Systeme auch im laufenden Data-Warehouse-Betrieb umfangreich skalierbar.

  • Komplexität
    Auch die Komplexität des Datenbankschemas wird durch den Wegfall zum Beispiel von Hilfstabellen, Materialized Views und Bitmap-Indizes erheblich reduziert. Der größte Unterschied zum herkömmlichen DWH liegt sicher darin, dass durch den großen Performancegewinn auf die verdichtete Analyseschicht weitgehend verzichtet werden kann. Für den nächtlichen Ladeprozess, bei dem die Verdichtung der atomaren Analysedaten in der Regel einen nicht unerheblichen Teil der Gesamtzeit in Anspruch nimmt, ist dies somit ebenfalls von Vorteil.

  • Funktionalität
    MPP-Datenbanken bieten einige Data-Warehouse-Funktionalitäten, die man bisher lediglich von mehrdimensionalen OLAP-Datenbanken kannte. Zusätzliche Verdichtungsfunktionen "on the fly" ermöglichen in den meisten Fällen den Verzicht auf verdichtete Daten.