SAP-Technologie

In-Memory-Computing - zwischen IT-Beschleuniger und Nische

01.06.2012
Von 
Martin Bayer ist Chefredakteur von COMPUTERWOCHE, CIO und CSO. Spezialgebiet Business-Software: Business Intelligence, Big Data, CRM, ECM und ERP.

Zeile, Spalte oder beides

Welches Potenzial sehen Sie für Ihr Unternehmen in der In-Memory-Technologie?
Welches Potenzial sehen Sie für Ihr Unternehmen in der In-Memory-Technologie?
Foto: RAAD Research

Den zweiten Eckpfeiler neben dem In-Memory-Computing bildet die Datenbank. SAP verwendet in HANA ein Hybridmodell, das eine zeilen- und spaltenorientierte Datenhaltung erlaubt.

Klassische relationale Datenbanken arbeiten zeilenorientiert. Hier werden beispielsweise Informationen zu Kundensätzen hintereinander geschrieben: Name, Ort, Land. Dann folgt der nächste Kunde. Spaltenorientierte Datenbanken sind anders aufgebaut. Sie schreiben zunächst alle Namen hintereinander, dann folgen die anderen Attribute wie Orte und Länder.

Beide Ansätze haben Vor- und Nachteile: Zeilenorientierte Datenhaltung erlaubt schnelle schreibende Zugriffe, während das Lesen der Daten länger dauert, da beispielsweise auf der Suche nach einem bestimmten Namen gesprungen werden muss. Das verzögert die Suche. Aufgrund dieser Voraussetzungen eignet sich dieser Datenbanktyp vor allem für OLTP-Systeme (Online Transactional Processing) wie beispielsweise das ERP, aus dem laufend viele Informationen in die Datenbank eingespeist werden. Mit diesem häufigen Schreiben kommen spaltenorientierte Datenbanken weniger gut zurecht, da beim Einfügen von Daten die Indizes neu organisiert werden müssten. Das dauert seine Zeit. Dagegen spielt dieser DB-Typ seine Vorteile bei lesenden Zugriffen aus. Wird zum Beispiel ein Name gesucht, liest die Datenbank einfach die entsprechende Spalte sequenziell ohne Sprünge aus. Das funktioniert extrem schnell. Daher werden spaltenorientierte Datenbanken meist in Olap-Systemen (Online Analytical Processing) wie Data Warehouses und anderen auf Auswertungen sowie Analysen spezialisierten Systemen eingesetzt. Ein weiterer Vorteil der Spaltenorganisation: Die so abgelegten Daten lassen sich stark komprimieren.

"Die Trennung zwischen OLTP- und Olap-Systemen löst sich allmählich auf", kommentiert SAP-Manager Brenckmann. Die Annahme, dass man für transaktionale Aufgaben zeilenbasierte und für analytische Zwecke spaltenbasierte Systeme verwenden sollte, lasse sich so nicht mehr aufrechterhalten. In HANA benutzt der Konzern eigenen Angaben zufolge eine Hybridform. Beide Techniken der Datenhaltung seien hier möglich und kombinierbar. Je nach Datenmodell und Nutzungsszenario ließen sich die Daten zeilen- oder spaltenbasiert organisieren.