Centera soll unveränderliche Inhalte verwahren

EMC hebt neuen Speichertypus aus der Taufe

10.05.2002
BRÜSSEL (kk) - Bei den Margen für herkömmliche Highend-Speicher herrscht Flaute. Branchenprimus EMC versucht deshalb, etwa mit Verwaltungssoftware Umsatz zu erzielen. Jetzt kreiert das Unternehmen einen neuen Storage-Typ: "Content Addressed Storage" (CAS) - die Datenspeicherung von nicht veränderbaren Inhalten.

Mit der Vorstellung der Centera-Hard- und Software ist EMC ein Coup in puncto Geheimhaltung gelungen: Obwohl die Company nach eigenen Angaben seit Jahren an dem Speichersystem für unveränderliche Inhalte entwickelt, drang von den Plänen vorab nichts an die Öffentlichkeit. Im vergangenen Jahr erlebte das Projekt laut EMC einen Entwicklungsschub, als der Hersteller die belgische Filepool Inc. für rund 50 Millionen Dollar übernahm. Filepool - aus dem Apple-Entwicklungshaus Wave Research hervorgegangen - machte sich als Softwareentwickler und Speicher-Service-Provider einen Namen. Centera basiert wesentlich auf den dafür entworfenen Softwareprodukten.

EMC-Chef Joe Tucci definierte bei der europäischen Markteinführung in einem Brüsseler Filmstudio die Aufgaben der Hard- und Softwarelösung genauer: "Centera soll gleich bleibende Inhalte (Fixed Content) speichern und wiederfinden." Ähnlich wie traditionelle Archivsysteme sei der Speicher für Daten entwickelt worden, die für lange Zeit aufbewahrt werden. Anders als Band-, Mikrofilm- oder CD-Archive speichert Centera die Informationen jedoch auf dem schnellen Medium Festplatte und stellt sie online zur Verfügung. EMC hat dafür eine neue Speichergattung eingeführt, die die herkömmlichen Architekturen SAN und NAS ergänzen soll: Content Addressed Storage (CAS).

Tucci verspricht sich glänzende Aussichten vom neuen Geschäft. Derzeit werde jährlich rund eine Milliarde GB an neuen Daten gespeichert, wovon die eine Hälfte auf Transaktionen beruhe und somit veränderlich sei, die andere Hälfte aber einen fixierten, nicht veränderbaren Inhalt aufweise. Die drastisch fallenden Preise für Festplattenspeicher machten es möglich, auch solche Informationen, etwa Röntgenbilder, Filme, E-Mails oder Verträge, online vorrätig zu halten: Kostete es 1995 noch etwa 1,50 Dollar, um ein Megabyte auf Festplatte zu speichern, so sank dieser Wert im Jahr 2000 auf 30 Cent. Die Branche erwartet, dass 2005 weniger als zehn Cent für 1 MB zu zahlen sind.

Unverwechselbarer FingerabdruckEMCs Technikchef Jim Rothnie erklärte die vier wesentlichen Säulen - Content Addressing, Stored Objects, RAIN-Implementierung von Redundant Array of Independent Nodes (Rain) sowie Distributed Content -, auf die sich Centera stützt. Die "Centrastar"-Software errechnet für jedes Datenobjekt (beispielsweise ein Röntgenbild) mittels des Message-Digest-Algorithmus (RSA MD-5) einen unverwechselbaren, 128-Bit langen "Fingerabdruck". Der wird zusammen mit den Metadaten (etwa die Angaben über Arzt und Patienten) zu einem Objektnamen umgewandelt.

Daraus ergeben sich drei Vorteile: Der Fingerabdruck ist einzigartig, etwaige Veränderungen des gespeicherten Objekts würden einen anderen Wert ergeben. EMC ist derzeit bemüht, für Centera weltweit die Zulassung als Archivmedium etwa bei den Steuerbehörden zu erhalten. Das zweite wichtige Ergebnis des Verfahrens ist die Tatsache, dass ein Objekt, beispielsweise eine Powerpoint-Präsentation, die alle Mitarbeiter einer Firma einsehen wollen, nur einmal gespeichert werden muss.

Drittens vereinfacht sich nach Meinung von EMC in Zukunft auch die Verwaltung der Objekte: Bis jetzt muss das Anwendungssystem wissen, wo die Informationen abgelegt sind - bei steigender Anzahl von gespeicherten Objekten kein leichtes Unterfangen. In der für den Herbst angekündigten zweiten Centera-Generation wird es - unter Umgehung des Anwendungs-Servers - möglich sein, vom Client aus direkt auf den Speicher zuzugreifen. Im Übrigen legt EMC die APIs für Centera offen und bindet das System - über "Widesky" - in die Management-Initiative "Auto IS" ein.

Das System lasse sich auch für Desaster Recovery nutzen, da die Anwendungsserver über LAN- und WAN-Verbindungen auf zwei oder mehr Centera-Speicher zugreifen können.

Auch in puncto Hardware hat sich EMC für Centera etwas Neues einfallen lassen: das Rain-Konzept, das den "Blade"-Rechnern im Server-Markt nachempfunden ist. Der Speicher enthält jeweils doppelt ausgelegte Ethernet-Switches sowie Zugriffs- und Speicherknoten. Zudem haben die EMC-Ingenieure dem System Hilfsprogramme zum selbständigen Konfigurieren, Überwachen, Diagnostizieren und automatischem Verlagern der Daten bei drohenden Fehlern eingepflanzt.

Daten werden gespiegeltDie Hardware stammt weitestgehend von der Stange: Pentium-III-Prozessoren mit 850 Megahertz und 256 MB RAM sowie kostengünstige EIDE-Festplatten. Pro Rack kommt man mit 16 Knoten auf eine Kapazität von insgesamt 10 TB. Da die Daten aus Sicherheitsgründen aber immer gespiegelt werden, halbiert sich der Speicherplatz auf 5 TB. Reicht das nicht aus, können Speicher-Cluster bis zu einem nutzbaren Fassungsvermögen von 160 TB gebildet werden. Im größten Verbund, der Centera-Domain, finden über 1 PB Daten Platz. Das vollausgebaute Rack mit 16 Knoten und nutzbaren 5 TB kostet 100000 Dollar für die Hardware und 110000 Dollar für die Centrastar-Software.