EMC World 2011

EMC setzt auf die hybride Cloud

10.05.2011 von Uli Ries
Trotz Sicherheitsbedenken setzt der Storage-Anbieter EMC weiterhin auf die Cloud. Neue Produkte und Analysetechniken sollen die Datenmengen in Zaum halten.
Keine Zweifel an der Cloud: EMC-Boss Joe Tucci setzt weiterhin voll auf die Cloud, auch wenn Technik und Sicherheit nicht immer einwandfrei sind.
Foto: Uli Ries

Zum Auftakt der Hausmesse EMC World 2011 haben CEO Joe Tucci und CTO Pat Gelsinger deutlich gemacht, dass das Unternehmen auch in Zukunft am Ausbau von Cloud-Infrastrukturen teilhaben will. Insbesondere hybride Clouds, also der Mix aus der im eigenen Rechenzentrum und der vom Dienstleister betriebenen Cloud-Technik, werden laut Tucci weite Verbreitung finden.

Auf dem Weg zur allgegenwärtigen Cloud werden die gespeicherten Datenmengen laut einer von Tucci zitierten IDC-Studie immens ansteigen. Insbesondere die Menge unstrukturierter Daten soll explodieren: Knapp 70 Exabyte sollen es im Jahr 2014 sein. Im Gegensatz dazu sollen nur zirka 10 Exabyte an strukturierten Daten anfallen. EMC spricht in diesem Zusammenhang von Big Data und meint damit schwierig handhabbare Files. Diese fielen typischerweise beim Produzieren von 3D-Kinofilmen an oder beim Analysieren von Genmaterial. Laut Tucci und Gelsinger findet sich inzwischen aber auch in zahlreichen Storagesystemen von kleineren und mittleren Unternehme Big Storage. Und zwar immer dann, wenn die Menge an unstrukturierten Daten anschwillt und die Übersicht über die Bestände verloren geht.

Damit Unternehmen dieser Flut an Daten Herr werden und den eigentlichen Wert der Dateien ausschöpfen können, will EMC ihnen eine leistungsfähige Analyselösung zur Seite stellen: Die kürzlich zugekaufte Datenbank Greenplum – optimiert auf das parallele Verarbeiten von Informationen – beherrscht jetzt auch unstrukturierte Daten und ist somit eine wichtige Säule von EMCs Big-Data-Strategie. Möglich wird der Umgang mit den unstrukturierten Daten durch die Integration von Apache Hadoop. Die Open-Source-Lösung skaliert sehr gut, ist optimiert auf paralleles Verarbeiten und wird beispielsweise von Facebook, IBM und Yahoo genutzt.

Demonstrierte Leistung: CTO Pat Gelsinger zeigte während der EMC World 2011 unter anderem, wie leistungsfähig die Greenplum-Hadoop-Appliance in der Praxis ist.
Foto: Uli Ries

Wie leistungsfähig Hadoop auf der entsprechend gut ausgestatteten Hardware „Greenplum HD Data Computing Appliance“ funktioniert (mehr als 300 CPU-Kerne und über 1 Terabyte Arbeitsspeicher), demonstrierte Gelsinger. Er ließ mehrere Milliarden Kundendatensätze durchsuchen, um einen bestimmten Kundenkreis für ein Mailing zusammen zu stellen. Der vollständige Suchvorgang war nach 34 Sekunden beendet. Referenzkunde T-Mobile hat nach Auskunft von EMC dank Greenplum erstmals analysieren können, woher die Unzufriedenheit von Kunden kommt. Der Mobilfunkbetreiber hat hierzu verschiedene Datenquellen – unter anderem Informationen der Funkzellen und Meldungen aus dem Call-Center – korreliert und mit der Greenplum-Appliance analyisiert. Das Ergebnis sollen Einblicke im Wert von 100 Millionen US-Dollar gewesen sein.

Neben der Greenplum-Appliance will EMC noch die Greenplum HD Enterprise Edition (enthält eine vollkommen kompatible Interface-Implementierung des Apache-Hadoop-Stacks) sowie die kostenlose Community Edition ins Angebot aufnehmen.

Wird EMC zum Server-Anbieter?

Ein Schritt in Richtung x86-Server von EMC ist das sogenannte Project Lightning. Zwar wollten weder Tucci noch Gelsinger den Begriff EMC-Server nutzen. Durch den im Rahmen des Projekts entwickelten Flash-Speicher (PCI-Express-Karte), der als Cache im Server und als Speicher im Array eingesetzt wird, ist EMC aber nicht mehr weit vom eigenen Server entfernt. Der Flash-Speicher wird mit der FAST-Software kombiniert, wodurch die Verarbeitungsgeschwindigkeit steigen soll. Die Idee dahinter: Speicherintensive Anwendungen laufen dank einheitlicher zugrunde liegender x86-Architektur auf der Hardware des Speicher-Arrays. Umgekehrt würden virtuelle Maschinen mit CPU-hungrigen Applikationen auf dedizierte Server verschoben. Erste Produkte auf Basis des Projekts sollen laut Gelsinger im Lauf des Jahres erhältlich sein.

Getrübt wurde EMCs Cloud-Show von den Negativschlagzeilen der letzten Wochen: Datenklau im Sony Playstation Network, Ausfall von Amazon EC2 und nicht zuletzt der Hackerangriff auf die EMC-Tochter RSA. EMC-Boss Tucci will trotz der erheblichen Störungen keinen Zweifel an der Cloud aufkommen lassen. So hält er es für ausgeschlossen, dass EMC-Kunden bei einem Vorfall, wie er bei Amazon passierte, ebenfalls Daten verloren hätten. Und auch an der Integration der RSA-Produkte in EMCs Cloud-Strategie hält Tucci fest: „Ich sehe keinen Grund, unsere Sicherheitsstrategie wegen des Datenklaus bei RSA zu ändern. Zwar wurde geistiges Eigentum entwendet. Die geklauten Informationen reichen aber nicht aus, dass die Diebe SecurID kompromittieren könnten. Außerdem haben wir die Teile von SecurID, die vom Diebstahl betroffen sind, neu entwickelt. Selbst wenn den Dieben auch noch die anderen Informationen in die Hände fielen, wären sie nutzlos“, so Tucci auf Nachfrage der Computerwoche. Er fügt hinzu: „Wir nutzen den Einbruch, um uns weiter zu entwickeln. Was uns nicht umbringt, macht uns nur härter.“ (wh)