Daten nach ihrem Wert sortieren

12.05.2006
"Information-Lifecycle-Management (ILM) ist kein Produkt, sondern eine Kombination aus Prozessen und Technologien", definiert der Branchenverband Bitcom das, was den Unternehmen derzeit ins Haus steht.
Die Umsetzung von ILM erfolgt in fünf Schritten.
Die Umsetzung von ILM erfolgt in fünf Schritten.
Ein neuer Satz von Verwaltungspraktiken wird erstellt, der den Wert einer Information für das Unternehmen bestimmt und den besten Platz für die Speicherung aussucht.
Ein neuer Satz von Verwaltungspraktiken wird erstellt, der den Wert einer Information für das Unternehmen bestimmt und den besten Platz für die Speicherung aussucht.

Seit der Speicherhersteller Storagetek den Begriff Information-Lifecycle-Management (ILM) vor mehr als drei Jahren in das IT-Vokabular einführte, hat er sich zum Leitmotiv für die moderne Datenhaltung- und verwaltung gemausert. Das griffige Schlagwort wurde und wird begeistert von den Herstellern aufgenommen, allen voran von Lieferanten für Speicherhardware. Mittlerweile, so scheint es, segelt jedes neue Speicher-Array un- ter der ILM-Flagge, und es hat tatsächlich drei Jahre gedauert, bis die erste Kritik an dem Konzept aufkam. Doch um welches Konzept handelt es sich eigentlich?

Visionen der Snia

Die Snia-Initiative Data Management Forum (DMF) soll "die führende Autorität und Ressourcenquelle für die Daten-Management-Infrastruktur und das Information-Life- cycle-Management sein, um die Interoperabilität zwischen den ILM-Lösungen und Datenservices zu fördern". DMF-Programmdirektor Michael Peterson wählt für seine ILM-Vision einen ziemlich umfassenden Ansatz. Er will "das Problem der Komplexität des Managements strategisch lösen".

Seiner Meinung nach reichen die Computerwissenschaften für das Management (computer science of management) nicht aus, um die Erfordernisse heutiger global vernetzter Business-zu-Business-Rechenzentren oder der On-Demand-Datencenter der nahen Zukunft zu erfüllen. Denn, so Peterson, das Problem ist die Komplexität. Im Rechenzentrum berechnet er sie so: Zahl der Server mal Zahl der Clients mal Zahl der Applikationen mal Zahl der Netzkomponenten mal Zahl der Speicherelemente mal Zahl der Verbindungen mal Zahl der Hersteller.

Damit sich die Administratoren in diesem Dschungel zurechtfinden, wurden Management-Werkzeuge angeschafft - bis zu 20 verschiedene je Rechenzentrum. Und das ist nach Meinung von Peterson falsch: "Mehr Tools sind keine Lösung, aber auch nicht das eine Werkzeug, dessen Versprechen lautet, alle Einzelfunktionen unter einem Dach zu haben." Ähnlich wie man ab 1995 dem Problem der Verwaltung einer Unmenge von Speicherplatten durch die Einführung von Speichernetzen begegnete und seit 1999 die Blade-Server helfen, die Server-Farmen in handhabbare Rechenknoten umzuwandeln, sei es jetzt notwendig, sich auch für das Daten-Management eine neue Architektur einfallen zu lassen.

Wegen der Komplexität dieses Problems müssten aber fundamental neue Prinzipien her, da intuitiv nichts zu lösen sei. Peterson stellt zwei Grundsätze zum Umgang mit vielschichtigen Problemen auf, die sich in der Praxis bewährt haben:

1. Wenn Sie ein komplexes Problem nicht in den Griff bekommen, hören Sie einfach damit auf.

Am Beispiel der Backup-Prozesse beschreibt der Experte, wie die Datensicherung immer komplizierter und ressourcenfressender wurde. Vielfach wurde als Lösung dafür eine Automatisierung der Prozesse eingeführt. Nach Ansicht von Peterson der falsche Weg, der nur die Probleme zementiert. Das bringt ihn zum zweiten Grundsatz:

2. Sie werden niemals ein komplexes Problem lösen, wenn Sie einen schlechten Prozess automatisieren.

Für das Backup-Beispiel bedeuten beide Grundsätze, dass sich die Datensicherung jetzt als Forderung versteht, "die Daten immer präsent zu haben". Das gelingt mit Festplatten für das Backup. Damit erhöht sich die Erfolgsrate der Datensicherung von 70 bis 80 Prozent bei Tape-Backup auf nahezu 100 Prozent, wenn auf Festplatten gesichert wird. Und es ergibt sich ein "einfacher und transparenter Betrieb, in dem die Datenredundanz durch Replikation (mit Versionierung) nativ im Schreibprozess enthalten ist und bei dem sogar das Problem des Restore gelöst ist".

Für das Information-Lifecycle-Management muss "ein neuer Satz von Verwaltungspraktiken definiert werden, der den Wert einer Information für das Business in Einklang bringt mit der geeigneten und kosteneffektiven Infrastruktur".

Hier lesen Sie …

Mehr zum Thema

www.computerwoche.de/

574800: CW-TV - Gespräch mit Andreas Zilch zum Thema ILM;

574487: Zur ILM-Studie der Experton Group;

571730: Anwenderbericht der Stadtwerke München;

566855: Zur "artgerechten" Datenhaltung.

Fachkonferenz "Storage Solutions"

24. Mai 2006, Frankfurt am Main

Immer mehr E-Mails, immer mächtigere Office-Dokumente und Data-Warehouse-Anwendungen: Die zunehmende Datenflut hat nach Schätzung von Experten einen jährlich rund 40 Prozent wachsenden Speicherbedarf zur Folge - ein Umstand, der viele Geschäftsprozesse lähmt und vor allem das IT-Budget belastet.

Das Problem lässt sich allerdings alleine mit mehr Spei- cherplatz nicht lösen. Vielmehr sind gezielte Investitionen in intelligente Storage-Lösungen notwendig. Ziel muss ein an den Geschäftsprozessen orientiertes Information-Lifecycle-Management sein. Wie das funktioniert und welche Effizienzsteigerungen sich beim Einsatz solcher Lösungen auch und gerade unter Kostenaspekten erzielen lassen, steht im Mittelpunkt der COMPUTERWOCHE-Fachkonferenz "Storage Solutions" am 24. Mai 2006 in Frankfurt am Main.

Weitere Informationen und Anmeldung unter:

www.idg-veranstaltungen.de/ cwstorage

Anfangs ging es nur darum, ähnlich wie beim altgedienten hierarchischen Speicher-Management (HSM) aus der Mainframe-Welt, gespeicherte Daten gemäß ihrer Zugriffshäufigkeit und ihrem Alter auf unterschiedliche Speichergeräte zu verschieben. ILM ersetzte allerdings den Begriff Zugriffshäufigkeit durch den "Wert", den die Daten für das Unternehmen darstellen. Daten sind danach an dem Ort abzulegen, der ihrer Bedeutung für das Geschäft zukommt: unternehmenskritische Informationen auf Highend-Speichern, Kopien dieser Daten auf Nearline-Arrays etc. Wichtig ist dabei, dass Informationen an Wert verlieren können und dann möglichst automatisch ihren prominenten und teuren Speicherplatz räumen sollen.

Was bedeutet ILM?

Mittlerweile ist das Konzept ausgeufert, eine einheitliche Definition unmöglich. Das gesteht sogar die Snia (Storage Networking Industry Association) ein, die die Interessen der Speicherbranche und auch der Anwender vertreten soll und sich um Standards bemüht. Allerdings hat die Organisation unter dem Namen "Data Management Forum" (DMF) eine Initiative gegründet, die IT-Professionals, Integratoren und Hersteller aufnehmen will. Die Gruppe, die von Michael Peterson, President und Senior Analyst der Strategic Research Corp., geleitet wird, hat eine Begriffsklärung gewagt, die stark von Petersons Vision (siehe Kasten "Visionen der Snia") getragen ist. Danach besteht "ILM aus Regeln, Prozessen, Praktiken und Werkzeugen, die den Geschäftsnutzen der Information - von ihrer Entstehung bis zu ihrer letzten Ablage - ausrichten auf die am besten geeignete und kostengünstigste IT-Infrastruktur. Die Information wird mit den Geschäftserfordernissen in Einklang gebracht durch Management-Policies und Service-Levels zusammen mit Applikationen, Meta- und Nutzdaten."

Wie zu erwarten sieht diese Definition ein Framework (siehe Grafik "Die ILM-Vision der Snia") und eine Roadmap vor. Das fünfstufige Modell dient als Handlungsanweisung für Unternehmen auf dem Weg zu ILM und wurde auch von den Analysten der Experton Group als Basis (siehe Grafik "ILM in fünf Phasen") für ihre Studie "Enterprise Storage und Information-Lifecycle-Management" verwendet. Die Marktforscher befragten zur Jahreswende IT-Leiter, CIOs und Speicherverantwortliche in 200 deutschen Anwenderunternehmen zum Thema ILM.

ILM ist wichtig für fast alle

Es zeigte sich, dass sich rund drei Viertel der Befragten mit dem Information-Lifecycle-Management beschäftigen und fast ein Drittel das Konzept zumindest punktuell umgesetzt hat. Knapp ein Viertel der Unternehmen wollen ILM in absehbarer Zeit nicht einführen oder sind noch unschlüssig. Als treibende Faktoren für eine Umorganisation der Speicherinfrastruktur nannten die Befragten an oberster Stelle die Bereiche Datensicherheit, Business Continuity und Desaster Recovery, gefolgt vom Wunsch nach Bewältigung der Datenflut und den Erfordernissen, rechtlichen Vorschriften zu genügen (Compliance).

Die Basis des fünfstufigen ILM-Modells bilden die "Vorarbeiten". Dazu zählen anspruchsvolle Projekte wie die Speicherkonsolidierung und -virtualisierung, der Aufbau eines Speichernetzes und das Speicherressourcen-Management. Experton schätzt, dass die Hälfte der Unternehmen in dieser Phase stecken.

Klassifizierung schafft Probleme

Noch schwieriger wird es, wenn die zweite Stufe genommen werden soll. Hier geht es unter anderem um die Klassifizierung der Daten. Damit sollen der Wert der Information, der sich im Laufe der Zeit verändern kann, bestimmt, der richtige Speicherort ausgesucht und die Service-Level-Objekte (SLOs) festgelegt werden. Die Klassifizierung der Daten stellt die Unternehmen vor große Probleme, da es hierfür kaum Werkzeuge zur Automatisierung gibt. EMCs Chefentwickler Mark Lewis beispielsweise begründete die Übernahme von Softwarefirmen wie Legato und Documentum durch den Speicherspezialisten unter anderem damit, dass man mehr über die Dateninhalte wissen müsse, um sie automatisch klassifizieren zu können.

Die Analysten der Aberdeen Group stellen derzeit einen Trend in den Unternehmen zum Aufbau von "Information-Value"-Teams fest, die sich mit allen Fragen des Daten-Managements beschäftigen, Rollen und Verantwortlichkeiten zuordnen und eine Art Business-Plan erstellen für den Umgang mit den Informationen, die das Unternehmen produziert. Aberdeen erwartet, dass in diesem Jahr Klassifizierungsprogramme auf den Markt kommen werden, die eine intuitive Benutzeroberfläche, einen Katalog und ein Wörterbuch für die Metadaten sowie vordefinierte Policies enthalten. Erst wenn diese Werkzeuge verfügbar sind, so Aberdeen, könnten die Unternehmen "zuversichtlich und proaktiv" ihr Daten-Management planen.

Alle außer Sun

Während sich die meisten Speicher- und Infrastrukturhersteller - allen voran EMC - das Information-Lifecycle-Management auf die Fahnen geschrieben haben, geht ausgerechnet Sun Microsystems einen anderen Weg. Die Company hat sich durch die Übernahme von Storagetek zwar den Erfinder der Wortschöpfung ILM ins Haus geholt und ist dadurch in die Speicheroberklasse aufgestiegen, kehrt dem Konzept aber den Rücken. Sun legte kürzlich eine eigene Speicherstrategie vor, die auf einem Prozess namens "Information Management Maturity Model" (IM3) fußt.

ILM versus IM3

IM3 fordert von den IT-Verantwortlichen vier Schritte: Alles muss eine Kennung erhalten, alles muss virtualisiert, gesichert und integriert werden. Für Schritt eins nutzt der Hersteller das eigene Portfolio an Identity-Management-Werkzeugen wie den "Java System Access Manager" oder den "Java Identity Auditor". Beide Programme hat Sun bereits auf die Storagetek-Produkte abgestimmt. Auch für die Virtualisierung kann auf die hauseigenen Lösungen, etwa den "Virtual Storage Manager" (VSM) von Storagetek, zurückgegriffen werden.

Programmierbare Speicher

Punkt drei der Roadmap gilt der Sicherheit, für die die Verschlüsselung eine zentrale Rolle spielt. Viertens muss alles integriert und in einer einzigen Plattform zur Datenverwaltung zusammengeführt werden. So sollen sich Komplexität und Abhängigkeiten verringern lassen. Diese Plattform soll auf einem gemeinsamen Satz an Werkzeugen und offenen Standards basieren. Die eingesetzten Speicher werden Solaris als Betriebssystem verwenden und sich programmieren lassen. Sun hat mit "Honeycomb" bereits das erste Storage-Array vorgestellt, das mit einem Entwickler-Kit ausgeliefert wird.

James Whitemore, Vice President of Marketing der Data Management Group bei Sun, ist davon überzeugt, dass der IM3-Ansatz besser als ILM dazu geeignet ist, die Probleme der Anwender zu lösen, denn "Information-Lifecycle-Management verdeckt die Probleme nur, IM3 wird sie lösen". Schließlich sollen die Daten für die Unternehmen einen Vermögenswert darstellen und keine Bürde sein. Dem werden wohl auch die Verfechter des ILM-Ansatzes zustimmen.