Open-Source-BI

Ohne Risiko zu Ad-hoc-Abfragen

28.10.2011
Von Patrick Schulte-Middelich und Georg Peters

Infobright nutzt Spaltenorientierung

Mit der Spaltenorientierung greift die ICE-Technik einen aktuellen Trend im Bereich Data Warehousing auf. In einer spaltenorientierten Datenbank werden die Daten in Spalten gespeichert und aus Spalten gelesen statt wie bei klassischen Datenbanken in Zeilen. Diese Art des Speicherns bringt wesentliche Vorteile in Bezug auf die Verringerung von I/O-Operationen mit sich und damit eine Verbesserung der Performance. Während beim Verarbeiten einer Transaktion gewöhnlich eine Zeile eingefügt, manipuliert oder gelöscht wird, werden zur Abarbeitung einer Anfrage in der Regel Daten aus mehreren Tabellen nach bestimmten Kriterien benötigt. Diese Kriterien sind in aller Regel Spalten wie zum Beispiel die Anfrage nach "allen männlichen Mitarbeitern unter 40". Die Spalten wären hier: Name, Geschlecht und Alter. Spaltenorientierte Datenbanken machen sich also zunutze, dass Anfragen gewöhnlich spaltenbasierend ablaufen.

Der zweite große Vorteil entsteht durch die Kompression, da es möglich ist, für jede Spalte beziehungsweise jeden Datentyp einen optimalen Kompressionsalgorithmus zu verwenden. Sind Daten höher komprimiert, können mehr Daten mit einer einzelnen I/O-Operation von der Platte in den Speicher eingelesen werden, wodurch proportional zur Kompressionsrate weniger I/O-Operationen benötigt werden. Ein weiterer Vorteil ist, dass keine physikalischen Datenmodelle wie zum Beispiel das Star-Schema mehr benötigt werden.