Amazon S3 & Co.

Storage in der Cloud - was Anwender beachten müssen

10.08.2009
Von 
Heinrich Vaske ist Editorial Director a.D. von COMPUTERWOCHE, CIO und CSO.
Cloud Computing erhitzt die Gemüter. Sind Speicherkapazitäten aus der Wolke wirklich billiger? Und wie sicher und performant sind die Angebote aus der Cloud? Wir beantworten die wichtigsten Fragen.

So manchem IT-Manager wird blümerant zumute, wenn er mit der Cloud-Diskussion konfrontiert wird. Immerhin ist er es, der den Kopf hinhalten muss, wenn es zu Sicherheitsproblemen, Performance-Verlusten oder sonstigem Ärger kommt. Solange die Cloud-Strategien der großen IT-Player nicht richtig erkennbar sind, fühlen sich die IT-Chefs oft auch gar nicht verpflichtet, unnötige Risiken einzugehen.

Und doch bleibt ein leises Unbehagen: In vielen Unternehmen wird mit Diensten wie Amazon S3 lebhaft experimentiert - erfolgreich, und die Kosten sinken. Wir beantworten im Folgenden wichtige Fragen zum Thema Storage in der Cloud.

Der Unterschied zwischen Public und Private Storage Cloud

Die Public Cloud ist eine von vielen Anwendern nutzbare Speicher-Utility, bei der je nach Nutzung gezahlt werden muss. Alle Komponenten befinden sich außerhalb der Unternehmens-Firewall des Kunden in einer geteilten Infrastruktur, die logisch partitioniert, Multi-Tenant-fähig (mit einer Softwareinstanz werden viele Kunden bedient) und über eine sichere Internet-Verbindung zugreifbar ist.

Anbieter wie zum Beispiel Amazon.com mit seinem Simple Storage Service (S3) erheben normalerweise eine monatliche Gebühr nach genutzten Gigabytes sowie zusätzliche eine Gebühr für die Datenübertragung zu und von der Cloud. Kunden brauchen keine eigene Speichereinheiten mehr und auch kein entsprechendes Know-how im Haus. Der Serviceanbieter verwaltet die komplette Infrastruktur und organisiert seine Kapazitäten so, dass er ein möglichst breites Kundenspektrum bedienen kann.

Eine Private Cloud residiert innerhalb der Firewall und baut auf der Hardware und Software auf, die ein Unternehmen gekauft und lizenziert hat. Die Daten bleiben vollständig im Haus und werden von der eigenen IT-Mannschaft kontrolliert. Das IT-Team legt die Speicherkapazitäten in einen Pool zusammen, aus dem die einzelnen Abteilungen und Projektteams sich unabhängig von ihrem jeweiligen Standort bedienen können. Wie in der Public Cloud lassen sich Speicherkapazitäten schnell und einfach aufstocken, in dem der Pool durch weitere Server ausgebaut wird.

Lesenswertes zu Cloud Computing:

FAQ Cloud Computing;

Security-Risiken bremsen Cloud Computing aus;

Industrieallianz für Cloud Computing

Neun Mythen um Cloud Computing

Um Speichersysteme in der Private Cloud anzubieten gibt es bereits spezielle Applikationen, die beispielsweise von ParaScale ("CloudStorage") oder Caringo ("CAStor") angeboten werden. Die Software von ParaScale wurde entwickelt, um Plattenspeicher auf vielen standardisierten Linux-Servern so anzubieten, das eine skalierbare, sich weitgehend selbst verwaltende Speicher-Cloud entsteht. Produkt-Manager Mike Maxey beschreibt den Unterschied zwischen privater und öffentlicher Cloud im Gespräch mit unserer US-Schwesterpublikation "Computerworld" wie folgt: "Wenn man über ein Wide-area Network angebunden ist und die Ressourcen mit anderen Kunden teilt, ist man in der öffentlichen Cloud."

Das gebe Sinn, wenn man ein extrem dezentrales, verteilt organisiertes Unternehmen habe ohne einheitliche, zentrale Infrastruktur. Vorteile ergäben sich außerdem, wenn man sehr kurzlebige, speicherintensive Daten wie beispielsweise Film-Trailer verwalten müsse, die für einige Monate laufen sollen. Die Public Cloud eignet sich also nicht zuletzt dazu, kurzfristig Lastspitzen abzufedern.

Ist Cloud-Speicher für alle Datentypen sinnvoll?

Nein. In Clouds lassen sich am besten große Mengen unstrukturierter Daten und Archivmaterial verwalten. Nach heutigem Stand werden Public Clouds noch nicht besonders gut mit hochtransaktionalen Dateien oder Datenbanken fertig, die schnelle Netzverbindungen verlangen. Online-Transaktionsverarbeitung funktioniert definitiv nicht performant.

Cloud-Speicher ist auch ungeeignet für Block-basierten Datenspeicher. Wer beispielsweise ein SAN hinter einem transaktionsorientierten CRM-System gegen eine Cloud-Lösung eintauschen möchte, macht einen Fehler. Wenn man Block-level-Storage in der Cloud abbilden wollte, käme es auch aufgrund der Latenzzeiten im Web zu deutlich verzögerten Antwortzeiten. Cloud-Systeme können Anwendern in etwa den Datenzugang von NAS-Systemen gewähren, nicht mehr.

Typische Nutzungsszenarien für die Cloud sind demnach Backup, Archivierung und Desaster Recovery. "Man wird vernünftigerweise keine Datenbank in der Cloud anlegen, aber man kann dort durchaus die Kopie einer älteren Datenbank vorhalten, anstatt sie auf teurer SAN- oder NAS-Technologie zu verwalten", sagt John Engate, Cheftechniker der Rackspace Hosting Inc. Er empfiehlt, ruhende Daten in der Wolke abzulegen, durchaus auch in sehr großen Mengen.

Eine andere Daumenregel in Expertenkreisen besagt, man soll Cloud-Speicher nur für Anwendungen in Erwägung ziehen, bei denen die Zugriffszeiten nicht ganz so wichtig sind. Das gilt für Backup-, Archiv- und sonstige Massendaten, bei denen es auf die Zugriffszeiten nicht so ankommt. Datenbanken und Performance-sensitive Daten sind demnach nicht geeignet.

Vor allen Cloud-Erwägungen sollten sich Anwender allerdings erst einmal generell fragen, warum ihr Datenbestand eigentlich so ausufert. Die private oder öffentliche Cloud mit Daten zu füllen, deren Zustandekommen niemand wirklich nachvollziehen kann und die weder gespeichert werden müssen noch jemals wieder gebraucht werden, ist eine eher suboptimale Herangehensweise.