Informations-Management

Virtuelle Data-Marts helfen Ebay beim Sparen

25.11.2008
Von 
Karin Quack arbeitet als freie Autorin und Editorial Consultant vor allem zu IT-strategischen und Innovations-Themen. Zuvor war sie viele Jahre lang in leitender redaktioneller Position bei der COMPUTERWOCHE tätig.

Prototyp statt Pflichtenheft

Deshalb hat Ebay vor etwa drei Jahren begonnen, das Konzept "Analytics as a Service" umzusetzen. Damit haben die Fachabteilungen die Möglichkeit, zeitlich begrenzte Analyseanwendungen ("Data Marts") selbst zu erstellen und zu testen. "Wir bieten virtuelle Data Marts an", bringt Ratzesberger den Sachverhalt auf den Punkt: "Wenn eine Business Unit eine Idee hat, kann sie damit rasch einen Prototpyen bauen."

Zwar sind die vom Data-Warehouse-Lieferanten Teradata stammenden Softwarewerkzeuge zu komplex, als dass ein IT-Laie sie anwenden könnte. Doch ordnet Ebay den in Frage kommenden Fachabteilungen laut Ratzesberger jeweils ein oder zwei Entwickler zu. Die helfen den Fachleuten dabei, die Anforderungen zu erfassen und sie in Form eines Prototypen umzusetzen, der sich dann exakt den Vorstellungen der Experten anpassen lässt.

Innerhalb von 90 Tagen muss die Fachabteilung entscheiden, ob aus dem Prototypen eine permanente Anwendung werden soll. Falls ja, wird er an die Softwareentwicklungs-Abteilung übergeben - quasi als Ersatz für ein Pflichtenheft.

Mit diesem "Sandboxing"-Verfahren gelinge es den Entwicklern, eine Analyseanwendung deutlich schneller umzusetzen als auf die konventionelle Art, so Ratzesberger: "Die haben dann im Normalfall innerhalb von sechs Wochen eine Produktionsversion fertig." Und das bedeute eine "enorme" Zeitersparnis. Inzwischen habe Ebay ständig etwa 100 Prototyping-Environments parallel laufen. Zwischen 50 und 100 Data Marts seien auf diese Weise bereits entstanden.

Geringere Systembelastung

Oliver Ratzesberger zeichnet für das Data Warehouse von Ebay verantwortlich.
Oliver Ratzesberger zeichnet für das Data Warehouse von Ebay verantwortlich.
Foto: Ratzesberger

Analyseanwendungen sind extrem rechenintensiv und belasten folglich den Arbeitsspeicher über Gebühr. Glücklicherweise haben sie nicht alle zum selben Zeitpunkt ihren "Peak". Aus dieser Tatsache zieht Ebay Profit: Nicht nur die Prototypen, sondern auch die Produktivversionen laufen als virtuelle Data Marts in der zentralen Data-Warehouse-Umgebung. Das sei ein "Riesenunterschied" gegenüber konventionellen Stand-alone-Anwendungen, schwärmt Ratzesberger. Eigentlich sind es sogar mehrere Unterschiede: Zum einen ist es nicht mehr notwendig, den maximalen Bedarf für alle Applikationen vorzuhalten. Während eine Auswertung in einem Stand-alone-System nur auf die jeweils zugeordneten Ressourcen zugreifen könne, stehe in einer virtuellen Umgebung "theoretisch die gesamte Rechenleistung des Data Warehouse" zur Verfügung, wie Ratzesberger ausführt. (Siehe auch: "Sieben Tipps für die Virtualisierung".)

Zum anderen entfallen auch die redundante Speicherung der Daten in Data Warehouse und Data Mart sowie die Systembelastung durch deren Synchronisation. "Wir haben vor drei Jahren unseren größten Marketing-Data-Mart virtualisiert", berichtet Ratzesberger: Stand-alone sei die Anwendung 5 Terabyte groß gewesen, nach der Virtualisierung seien nur 300 Gigabyte übrig geblieben, weil sich die Kundendaten schon im Data Warehouse befanden. (Zum Thema siehe auch: "20 Wege, in der IT zu sparen".)