Auch E-Mails haben einen Lebenszyklus

30.03.2006
Von Diethard Gentsch 
Wer E-Mails archivieren will, muss Vorarbeit leisten. Ohne eine systematische Analyse der Daten und Speichertechnik geht nichts.
Hersteller wie HP oder Hitachi wollen die gesamte Speicherverwaltung und Archivierung künftig über ein integriertes System abdecken.
Hersteller wie HP oder Hitachi wollen die gesamte Speicherverwaltung und Archivierung künftig über ein integriertes System abdecken.

Das Aufkommen geschäftlicher E-Mails steigt rasant und füllt die Speicher. Zugleich müssen Unternehmen aufgrund rechtlicher Vorgaben dafür sorgen, dass Auditoren und Wirtschaftsprüfer schnellen Zugang zu relevanten E-Mails erhalten - auch wenn diese sich in großen Archiven befinden. Doch wie kann der Anwender unter einer Million E-Mails genau diejenigen herausfiltern, die er gerade dringend benötigt? Und wie können Unternehmen eine systematische E-Mail-Verwaltung aufbauen, wenn in der Regel die finanziellen Mittel fehlen und schrumpfende oder im besten Fall stagnierende IT-Budgets die Regel sind?

Fragen zur E-Mail-Archivierung

• Welche Regularien (Compliance) gelten für mein Unternehmen/meine Branche?

• Liegen geschäftsrelevante Informationen nur als E-Mail oder noch in anderer Form vor?

• Wird der Online-Speicher/ das tägliche Backup mit Archivdaten belastet?

• Enthalten lokale Festplatten geschäftsrelevante Daten?

• Werden die Aufbewahrungsfristen von elektronischen Daten eingehalten?

Hier lesen Sie …

Mehr zum Thema

www.computerwoche.de/go/

568793: rechtliche Vorgaben bei der E-Mail-Verwaltung;

551130: Content-Archivierung;

572632: Trends im ECM-Markt.

Orientierung und Hilfe können Strategien für ein Information-Lifecycle-Management (ILM) geben. Sie lassen sich sowohl für komplette Datenbestände als auch speziell für das Management von E-Mails verwenden. Dabei geht es darum, E-Mails nach ihrer Relevanz für die Geschäftstätigkeit des Unternehmens zu beurteilen und sie mit Hilfe definierter Richtlinien (Policies) abzulegen. Die Umsetzung einer ILM-Strategie erfolgt schrittweise: Zunächst werden die E-Mail-Daten analysiert und klassifiziert, dann werden sie in operationale und Referenzdaten eingeteilt. Es folgen eine Prüfung der aktuellen Speicherumgebung, der Abgleich mit Compliance-Vorgaben sowie Anpassungen und gegebenenfalls ein Re-design der Infrastruktur. Erst wenn diese Vorarbeiten geleistet sind, sollten Unternehmen an die Umsetzung gehen.

Zunächst wird ermittelt, welche Daten das Unternehmen besitzt und wie es sie verwendet. Hierzu kann man beispielsweise als Erstes untersuchen, wie häufig die Daten abgerufen werden: Wie alt ist die Datei? Wann wurde das letzte Mal auf sie zugegriffen? Ferner sind die Größe der einzelnen Dateien und ihr Besitzer zu erkunden. Allein diese vergleichsweise rudimentäre Analyse bringt erstaunliche Ergebnisse: Oft stellt sich heraus, dass nur noch die Hälfte der Daten im täglichen operativen Bereich benötigt wird. Auf Basis dieser Grobanalyse lässt sich der Prozess weiter verfeinern. Unter Umständen ist es sinnvoll, gemeinsam mit Beratern einen Workshop aufzusetzen, um Kernklassen für die Kategorisierung zu erarbeiten. E-Mails werden normalerweise nicht als einzelne Dateien abgelegt, sondern in Abhängigkeit vom verwendeten Mail-System in spezifischen Datenbanken. Dort lassen sich die Mail-Daten meist mithilfe von spezifischen Tools wie in einem Dateisystem analysieren.

Verschwendeter Speicherplatz

Im nächsten Schritt gilt es, die Dateien/E-Mails zu kategorisieren. So sind zum Beispiel E-Mails, die rechtlich bindend sind, oder Nachrichten der Geschäftsleitung anders zu behandeln als die alltägliche Bürokommunikation. Sind alle Mails klassifiziert, lässt sich auch feststellen, wo sich Mails mit nicht mehr relevanten Inhalten oder unnötige Duplikate oder Mehrfachspeicherungen existieren. Gerade Letzteres ist ein häufig auftretendes Phänomen: Werden zum Beispiel großvolumige Powerpoint-Präsentationen mit zehn oder 15 Megabyte per Mail an einen größeren Kreis von Empfängern verschickt, speichert in der Regel jeder die Datei wieder lokal ab. Zum Problem für den einzelnen Nutzer wird dies besonders dann, wenn der Speicherplatz auf dem Mail-Server quotiert ist, also für jeden Benutzer nur ein begrenzter Speicherplatz zur Verfügung steht.

Zudem gibt es verschiedene Verfahren zur Klassifizierung. Sie reichen von der Speicherung des kompletten ein- beziehungsweise ausgehenden Mail-Verkehrs (Compliance Mode) bis zu teilautomatisierten Verfahren, die zum Beispiel aus Adressen und Textmustern geschäftsrelevante Mails filtern. Eine weitere Möglichkeit ist die manuelle Bearbeitung, bei der die Fachabteilungen relevante E-Mails herausfiltern. Bei der Umsetzung eines ILM-Konzepts wird außerdem analysiert, in welcher Lebensphase sich die verschiedenen Daten befinden. Dadurch lassen sich Datenbestände so organisieren, dass aktuelle Dokumente und Informationen (operative Daten) sofort verfügbar sind, während seltener genutzte Dokumente (Referenzdaten) auf kostengünstige Medien ausgelagert werden.

Die Kosten der Mail-Verwaltung lassen sich durch ein abgestuftes Speichersystem senken, das die elektronische Post automatisiert nach definierten Richtlinien gemäß ihrer Relevanz ablegt. Unternehmen sollten prüfen, ob ihre derzeitige Speicher- und Archivumgebung diese Anforderungen erfüllt. Die Speicherlösung muss in der Lage sein, E-Mails regelbasierend aus teuren Online-Speichern automatisch in Langzeit-Archivsysteme zu verlagern. Ebenso sind die gesetzlichen oder branchenspezifischen Anforderungen bei der Speicherung elektronischer Informationen einzuhalten.

Aufbewahrungsfristen prüfen

Die Verantwortlichen im Unternehmen müssen ihrerseits prüfen, ob die Aufbewahrungsfristen für E-Mails eingehalten werden, und sicherstellen, dass niemand die Daten während dieser Zeit manipulieren kann. Falls Veränderungen dennoch nötig sind, muss dies klar gekennzeichnet sein, und es muss festgehalten werden, welcher Mitarbeiter dafür verantwortlich ist. Insbesondere wenn aufbewahrungspflichtige Informationen nur als E-Mail existieren, sind sie in unveränderter Form eventuell viele Jahre aufzubewahren. Eine revisionssichere Langzeitspeicherung sollte deshalb Teil der Planung sein.

Langfristige E-Mail-Strategien

Es reicht aber nicht aus, wenn Richtlinien nur die aktuelle Nutzung und Ablage von E-Mails definieren. Unternehmen brauchen vielmehr langfristige Strategien, und die Verantwortlichen müssen regelmäßig prüfen, ob die definierten Policies noch den aktuellen Anforderungen entsprechen. Eine der schwierigsten Aufgaben ist dabei, auch langfristig den Zugang zu den Daten sicherzustellen. Liegen archivierte E-Mails auf nicht mehr genutzten Speichermedien, kann es sehr schwierig sein, sie noch zu nutzen.

Aber keiner weiß heute, welche Technologien in zehn Jahren verfügbar und vorherrschend sein werden. Deshalb sollten man sich nicht nur mit der Lebensdauer der Speichermedien beschäftigen, sondern für die Speicherung auf adaptive Strukturen wie Service-orientierte Architekturen (SOAs) setzen. Diese stellen sicher, dass für geschäftskritische Informationen ein Migrationsweg vorgesehen ist. Ansonsten lassen sich Daten eventuell bereits nach nur wenigen Jahren schwer auslesen.

Was tun mit alten E-Mails?

Probleme machen auch Mails, die in alten E-Mail-Programmen geschrieben wurden oder Anhänge enthalten, die von aktuellen Softwareprogrammen nicht mehr unterstützt werden. Hilfe versprechen hier moderne Grid-Architekturen, in denen Grid-Elemente der jeweils aktuellen Technologie Auslaufversionen älterer Grid-Elemente ersetzen. Durch die Selbstorganisation eines Grid-Speichers werden so die Daten des Elements "alt" automatisch auf das Element "neu" migriert.

Allerdings hilft dies wenig, wenn im Lauf der Zeit ein Unternehmen zum Beispiel ein neues Mail-System einführt. Um dann noch alte Mails auslesen zu können, müssen die Altsysteme erhalten bleiben. Der Aufwand lässt sich allerdings durch Virtualiserungstechniken auf Applikations-Images reduzieren, die die IT dann nur noch verwalten muss. Spätestens hier wird deutlich, dass Langzeitspeicherung kein reines Technologiethema ist, sondern dass die Verantwortlichen auch die IT-Prozesse entsprechend anpassen müssen.

Wichtig ist jedoch nicht nur das effiziente Speichern von E-Mails. Die elektronischen Nachrichten müssen sich bei Bedarf auch schnell wieder auffinden lassen. Je nach Inhalt und vorangegangener Klassifizierung der Mails variieren dabei die Anforderungen an die Mail-Suche. Kriterien sind zum Beispiel das schnelle Wiederfinden oder ein Zugriff, der lediglich das Lesen gespeicherter Mails ermöglicht und nicht zulässt, dass der Anwender Änderungen vornimmt. Mechanismen zur Index- oder Content-basierenden Suche erleichtern das Auffinden von E-Mails zusätzlich. Zudem ist ein Berechtigungskonzept zu erarbeiten, das exakt regelt, welcher Mitarbeiter auf welche Informationen zugreifen kann, und die sichere Authentifizierung berechtigter Personen gewährleistet.

Keine integrierten Systeme

Traditionelle Lösungen für die Archivierung von Mails basieren auf einem mehrschichtigen Architekturmodell und enthalten teilweise sehr komplexe Komponenten, die zu verwalten sind. Dazu zählen zum Beispiel Server, Software für die Archivierung und das hierarchische Speicher-Management (HSM), eine Suchmaschine, ein oder mehrere Datenbank-Server sowie ein Cluster, das die Ausfallsicherheit gewährleistet. Viele dieser einzelnen Systeme sind proprietär. Zudem handelt es sich dabei oft um nicht hinreichend integrierte Insellösungen.

Pragmatische Lösung

Eine pragmatische Lösung vor allem für kleine Firmen ist eine Erweiterung der File-Systeme, wie sie verschiedene Hersteller in Form von File-System-Extender-Lösungen bewerben. Sie binden zum Beispiel Platten- und Bandmedien ein und ermöglichen so automatisierte mehrstufige Speicherlösungen, die kostengünstig, revisionssicher und leicht zu verwalten sind. Die Alternative sind Lösungen für das E-Mail-Management aus einem Guss. Diese erlauben die Konfiguration und das Management von unternehmensinternen Policies und Compliance-Richtlinien über eine zentrale Konsole. Sind die Richtlinien etabliert, funktioniert das System wie eine Appliance. Ein zusätzlicher Administrator, der sich ausschließlich um dieses System kümmert, ist so in vielen Fällen nicht nötig.

Ein Beispiel ist ein Storage Grid, wie es HP mit RISS verfolgt (Reference Information Storage System). Es verfügt über eine modulare Speicherinfrastruktur und besteht aus so genannten Smart Cells - einzelne Knoten im Grid, die über eine eigene Intelligenz verfügen und so Funktionen wie das Suchen und Finden von Daten übernehmen können. Informationen lassen sich über sie Anwendungen zuordnen oder Content-spezifisch erfassen und indizieren. Sie helfen, wichtige Informationen aus unterschiedlichen E-Mail-Programmen zu archivieren und schnell wiederzufinden. Möglich wird dies über eine Volltextsuche, die sowohl die Mails als auch die Anhänge überprüft. Zudem kann das Archivsystem um intelligente Zellen erweitert werden, und es lassen sich bestehende Speichersysteme in die Lösung integrieren. Für welche Lösung sich ein Unternehmen entscheidet, hängt von den spezifischen Anforderungen ab. Unternehmen fahren jedoch gut, wenn sie auf Speicher- und Archivierungslösungen setzen, die auf intelligenten und skalierbaren Architekturen basieren. So können sie ihre Systeme nicht nur erweitern, sondern auch an veränderte Anforderungen anpassen. Denn wer weiß, wie die Speichersysteme in zehn oder 20 Jahren aussehen. (as)