E-Mail-Archive im Vergleich

13.08.2008
Im COMPUTERWOCHE-Test mussten die Archivlösungen von Mimosa Systems und GFT Inboxx zeigen, ob sie die E-Mail-Flut bändigen.

Von Christoph Lange*

Elektronische Post wollen Firmen archivieren, um ihre überquellenden Server zu entlasten. Zudem müssen sie Nachrichten mit Steuerrelevanz zehn Jahre lang aufbewahren. Auch hier helfen Archivsysteme für E-Mails, die sich zum Beispiel mit dem Exchange Server von Microsoft koppeln lassen.

Softwareprodukte zur E-Mail-Archivierung erlauben es Unternehmen, Messages nach bestimmten Regeln zu speichern. Darüber hinaus entlasten sie die E-Mail-Systeme, indem sie Dateiduplikate entfernen (Single Instancing) und ältere E-Mails und Attachments in ein Archiv auslagern.

Außerdem lassen sich die lokalen PST-Dateien (Public Store) der Nutzer der Outlook-Software in das zentrale Archiv migrieren. Auf diese Weise können Systemverwalter gewährleisten, dass die bislang lokal auf PCs oder Notebooks abgelegten E-Mails zentral gespeichert und gesichert werden.

E-Mail-Archivierung von Mimosa

Zum COMPUTERWOCHE-Test traten zwei Anbieter an, die sich auf E-Mail-Archivierungslösungen spezialisiert haben. Das US-amerikanische Startup-Unternehmen Mimosa hat mit "Nearpoint" eine Lösung entwickelt, die nicht wie bisher meist üblich jede E-Mail per Journaling dupliziert. Stattdessen erstellt Nearpoint eine vollständige Kopie der Exchange-Datenbank und hält diese dann per Log-Shipping. Der Exchange Server wird so weniger belastet. Exchange speichert die Informationen für jede Server-Instanz in einer Datenbank; alle fortlaufenden Änderungen (gesendete und empfangene E-Mails, Termine, Kontakte etc.) werden in einer Transaction-Log-Datei protokolliert; diese Log-Datei wird genau wie bei SQL-Datenbank-Servern etwa alle zwei Stunden auf ein externes Backup-Medium gesichert. Falls die Datenbank zerstört werden sollte, lässt sich anhand der in der Nacht erstellten Backup-Kopie und der Logs der Zustand der Datenbank so wiederherstellen, wie er zur letzten Log-Sicherung von vor maximal zwei Stunden war. Diese regelmäßige Sicherung der (Exchange-) Datenbank-Logs wird Log-Shipping genannt.

E-Mail-Archivierung von GFT Inboxx

Der deutsche Anbieter GFT Inboxx setzt auf das klassische Journaling-Verfahren in Kombination mit einer Archivdatenbank, die für Indexierung optimiert wurde. Wenn keine vollständige Archivierung in Echtzeit erforderlich ist, lässt sich Inboxx auch für eine SMTP-basierende Mail-Ablage nutzen. In diesem Fall erfasst das Produkt allerdings keine firmeninternen Mails.

Inboxx basiert auf dem seit mehr als 20 Jahren erhältlichen Archivsystem "Hyparchiv", das insbesondere im SAP-Umfeld eingesetzt wird. GFT hat Hyparchiv um Schnittstellen für Microsoft Exchange und Lotus Notes erweitert.

Symantec, Hersteller des bekannten Produkts "Enterprise Vault", wurde ebenfalls zu dem Test eingeladen, wollte sich aber dem direkten Vergleich mit der Konkurrenz nicht stellen und lehnte ab.

E-Mail- und File-Archivierung

Beide Testkandidaten können nicht nur E-Mails und deren Anhänge archivieren, sondern sind auch in der Lage, unstrukturierte Dateien zum Beispiel von File-Servern regelbasiert zu überwachen und automatisch in das Archiv zu verschieben. Zum Funktionsumfang zählen leistungsfähige Suchfunktionen, mit denen sich archivierte E-Mails und Dokumente gezielt wiederfinden lassen (E-Discovery). Dies ist insbesondere dann wichtig, wenn bei einem Gerichtsverfahren alle relevanten elektronischen Dokumente vorgelegt werden müssen.

Vorbereitung der Installation für Nearpoint

Für den COMPUTERWOCHE-Test wurden beide E-Mail-Archivierungslösungen in einer eigenen virtuellen Testumgebung mit einem Windows-2003-Domänen-Server und einem Mail-Server auf Basis von Exchange Server 2003 installiert. Als Test-Clients dienten ein Windows-XP- und ein Windows-Vista-Rechner.

Vor der Installation muss der Anwender eine Reihe von Vorkehrungen treffen. Nearpoint benötigt unter anderem einen Microsoft-SQL-Server (2005 oder 2000).

Beim Nearpoint-Server ist nach dem Basis-Setup zunächst die Initialkopie der Exchange-Datenbank anzustoßen. Sobald diese abgeschlossen ist, aktualisiert Nearpoint die Kopie fortlaufend per Log-Shipping. Im nächsten Schritt definiert der Administrator dann die Archivierungsregeln. Die E-Mail-Archivierung erfolgt mit Hilfe einer "Smart Extraction". Diese kann nicht nur E-Mails und ihre Anhänge, sondern auch alle anderen Objekte wie zum Beispiel Kalendereinträge extrahieren und archivieren. Wenn der Anwender Nearpoint mit Exchange Server 2007 verwenden will, muss er die Exchange-Funktion Remote Streaming Backup aktivieren, damit die Lösung korrekt arbeitet.

Vorbereitung der Installation für GFT Inboxx

Bei GFT Inboxx kommt als Basis für das Archiv dagegen die Datenbank C-Tree zum Einsatz. Dabei handelt es sich um ein Index-Filesystem, das von GFT Inboxx für die E-Mail-Archivierung optimiert wurde. Es verwendet Container und redundante Indizes. Die E-Mails, Anhänge und sonstigen Dateien werden sequenziell in so genannten Container-Dateien im Archiv abgelegt. Die Container können zwischen 10 MB und 4 GB groß sein. C-Tree erstellt für jeden Container eine eigene Index-Datenbank. Dies hat gegenüber SQL-Datenbanken den Vorteil, dass sich der Index im laufenden Betrieb im Hintergrund reorganisieren lässt. Während der Reorganisation ist jeweils nur der gerade betroffene Container nicht verfügbar. Die Konfiguration des Inboxx-Servers wird in einer lokalen MSDE-Datenbank gespeichert.

Auf Wunsch ausfallsicher

Beide Testkandidaten unterstützen auch hochverfügbare Konfigurationen. Mimosa hat Nearpoint als Grid-Architektur aus Master- und Peer-Systemen entwickelt, die den Ausfall einzelner Server durch eine Failover-Funktion abfängt und ein Load Balancing integriert. Alternativ ist eine Disaster-Recovery-Lösung erhältlich, die die Nearpoint-Server mittels der Software "Double Take" im Cold- oder Hot-Standby-Modus auch über größere Entfernungen hinweg replizieren kann. Künftig soll zudem eine Replikation über die Snap-Mirror-Funktion von Network-Appliance unterstützt werden.

Das Inboxx-System lässt sich in einem hochverfügbaren Windows-Cluster aus zwei oder mehr Cluster-Nodes betreiben. Alternativ kann der Administrator das C-Tree-Index-Filesystem auch auf mehrere Server verteilen. Eine Lastverteilung ist bei Inboxx nur statisch möglich, indem die einzelnen Container auf unterschiedliche Server verteilt werden.

Archivierungsfunktionen im Testbetrieb

Sowohl Nearpoint als auch Inboxx unterstützen eine regelbasierte Archivierung. Dabei kann der Administrator festlegen, ab welchem Alter oder welcher Größe und zu welchem Zeitpunkt die Software eine E-Mail, einen Anhang beziehungsweise eine Datei automatisch archivieren soll. Beide Produkte erlauben es, E-Mail-Anhänge sofort zu speichern.

Im Test wurde zunächst bei beiden Produkten eine automatische Archivierung nach einer Woche konfiguriert. Beide Kandidaten verhielten sich erwartungsgemäß und archivierten alle Test-Mails, die älter als sieben Tage waren. Anschließend wurde die Option aktiviert, E-Mail-Anhänge sofort ins Archiv zu verschieben. Auch sie funktionierte bei beiden Lösungen ohne Probleme.

Nearpoint lässt mehr Regeln zu

Bei Inboxx gelten die eingestellten Regeln immer für den gesamten Server. Der Administrator hat aber die Möglichkeit, über Templates die Regeln für einzelne Mailboxen anzupassen.

Der Nearpoint-Server bietet hier mehr: Regeln lassen sich auf unterschiedlichen Ebenen bis hinunter zu einzelnen Elementen anwenden.

Bei beiden Testkandidaten kann der Administrator vorgeben, dass die Benutzer ihre E-Mails selbst archivieren und wiederherstellen dürfen. Dem Anwender stehen hierfür zusätzliche Schaltflächen in Outlook zur Verfügung. Mimosa legt zudem in Outlook einen zusätzlichen Archivordner an. Das erleichtert es dem Nutzer, E-Mails und Anhänge wiederherzustellen. Beim Test der Wiederherstellungsfunktion ließen sich bei beiden Testkandidaten E-Mails reibungslos vom Archiv in den E-Mail-Client zurückladen.

Suchen und Finden

Für das Auffinden archivierter Elemente stellen beide Produkte ausgefeilte Suchfunktionen zur Verfügung. Die Suche ist bei Inboxx standardmäßig auf die eigene Mailbox beschränkt. Wenn ein Benutzer das Recht hat, die Mailbox eines anderen Mitarbeiters in seine Outlook-Software einzubinden, kann er auch dessen Archiv durchsuchen. Der Inboxx-Server lässt sich so einstellen, dass er alle Zugriffe auf die archivierten Dokumente protokolliert. Nearpoint erfasst ebenfalls alle Aktivitäten im Archivsystem und erstellt hierzu auf Wunsch einen Report.

Nearpoint bietet mit dem separat zu installierenden Tool "E-Discovery Editor" ein eigenes Werkzeug für umfassende E-Mail-Recherchen, die zum Beispiel im Zuge von Gerichtsverfahren erforderlich werden können. Damit lässt sich genau festlegen, wer in welchen Bereichen suchen darf. Sobald ein Benutzer eingerichtet wurde, erhält er automatisch einen Link, über den er den Discovery-Agent auf seinem Rechner installieren kann.

PST-Migration und Single Instancing

Beide Produkte unterstützen ein Single Instancing sowohl für E-Mail-Anhänge als auch für unstrukturierte Dateien von File-Servern.

Zudem gestatten sie es, PST-Dateien zu migrieren. An der Arbeitsweise der Benutzer ändert sich dabei kaum etwas: Sie können wie gewohnt auf E-Mails zugreifen, obwohl das PST-File nicht mehr auf der lokalen Festplatte liegt. Nearpoint ist zudem in der Lage, eine Mailbox auf eine andere umzuleiten. Dadurch sind Mailbox-Migrationen sehr einfach möglich. Die Mimosa-Software eignet sich darüber hinaus dazu, E-Mails von Blackberry- und Windows-Mobile-Geräten zu archivieren. Beide Testkandidaten können neben E-Mails und Dateien auch die Instant-Messenger-Kommunikationen archivieren.

Gesetzeskonform archivieren

Zu den Kernfunktionen gesetzeskonformer Archivierungssysteme zählen die "Retention Policies". Diese legen fest, wie lange ein Dokument im Archiv gespeichert wird. Nearpoint kann diese Regeln auf verschiedenen Ebenen bis hinunter zu einzelnen Elementen abbilden. Bei Inboxx lässt sich die Aufbewahrungsfrist ("Retention-Time") bislang nur auf Grundlage von "Departments" (Organisationseinheiten eines Unternehmens) einstellen. Laut Hersteller soll es ab Anfang 2009 aber möglich sein, individuelle Aufbewahrungsfristen auch für einzelne Elemente vorzugeben.

Kurz gefasst: Mimosa Systems/Nearpoint

Hersteller: Mimosa Systems.

Produkt: Nearpoint.

Preis: zirka 39 Euro pro Postfach.

Vorteile

  • Single Instancing für E-Mail-Anhänge und andere Dateien.

  • Durch Log-Shipping so gut wie keine Performance-Beeinträchtigung des Exchange Servers.

  • Kann alle Outlook-Elemente inklusive Kalender, Kontakten und Aufgaben archivieren.

  • Umfangreiche Recherchefunktion über separates Werkzeug.

  • Archivfunktionen auch für Blackberry und Windows Mobile.

Nachteile

  • Relativ aufwändiges Backup der Archivdatenbanken.

Die produktunabhängige Wiederherstellung der von Inboxx archivierten Dateien ist mit Hilfe eines selbsttragenden Mediums mit integriertem Viewer möglich. Die auf dem Medium, zum Beispiel einer DVD, gespeicherten Daten lassen sich dann von beliebigen Rechnern aus einsehen. Für Ende 2008 hat GFT eine Funktion in Aussicht gestellt, mit der archivierte Dokumente in das neue PDF-Langzeitarchivierungsformat PDF/A umgewandelt werden können. Damit wird es dann unter anderem möglich, in einem Lotus-Notes-Archiv Dokumente aus einem Exchange-Archiv einzulesen und umgekehrt. Dass Inboxx auf einer klassischen Archivlösung basiert, ist auch an den leistungsfähigen OCR-Funktionen (Optical Character Recognition) zu erkennen. Zum Einsatz kommen hierfür der Viewer des von Oracle übernommenen Herstellers Stellent und die OCR-Lösung von Abbyy. Die OCR-Funktion kann an die E-Mails angehängte Faxdokumente oder JPG-Fotos, die Text enthalten, erfassen und so für die Archivierung mit Volltextindizierung vorbereiten.

Nearpoint kann zudem mit einem Cache-Tool für die Archivsynchronisierung von mobilen Anwendern sowie einem WAN-Agenten für die Optimierung der Kommunikation über WAN-Verbindungen aufwarten. PDF/A unterstützt Nearpoint bislang noch nicht, dies dürfte aber nur eine Frage der Zeit sein.

Outlook-Integration

Auf die Archivfunktionen kann der Benutzer bei beiden Herstellern sowohl über den nativen Outlook-Client als auch via Outlook Web Access (OWA) zugreifen. Mit OWA stehen dem Benutzer dieselben Funktionen zur Verfügung. Beide Archivsysteme lassen sich nicht nur als Einzellösung nutzen, sondern unterstützen auch den mandantenfähigen Betrieb für mehrere Kunden. Somit können auch Dienstleister diese Software nutzen, um die E-Mails mehrerer Clienten auf einer einzigen Plattform zu archivieren. Jede Firma erhält dabei ihren eigenen abgetrennten Bereich.

Backup der Archive

Das Backup der Archivdaten beschränkt sich bei Inboxx darauf, den aktuellen Container zu sichern, der maximal 4 GB groß ist. Sobald ein Container vollgeschrieben wurde, verändert er sich nicht mehr und muss daher nicht mehr neu gesichert werden. Mit der nächsten Inboxx-Version soll es auch möglich sein, den Archiv-Server im laufenden Betrieb zu sichern. Bei Nearpoint müssen dagegen alle SQL-Datenbanken gesichert werden, wobei das hierfür erhältliche NP-Backup-Utility bei der Optimierung der Backup-Prozesse hilft.

Kurz gefasst: GFT Inboxx

Hersteller: GFT Inboxx.

Produkt: Inboxx.

Preis: zirka 40 Euro pro Benutzer.

Vorteile

  • Single Instancing für E-Mail-Anhänge und andere Dateien.

  • Index-Reorganisation im laufenden Betrieb möglich.

  • Umfangreiche OCR-Funktionen.

  • Basiert auf traditionellem Archivsystem mit großem Funktionsumfang.

Nachteile

  • Journaling erzeugt zusätzliche Last auf dem Exchange Server.

  • Aufbewahrungsfristen (Retention Policy) lassen sich bislang nicht für einzelne Elemente festlegen.

Fazit

Mit Nearpoint bietet Mimosa eine E-Mail-Archivierungslösung an, die das Exchange-System aufgrund ihrer Log-Shipping-Architektur so gut wie nicht belastet. Die Lösung von GFT Inboxx verwendet dagegen den traditionellen Journaling-Ansatz, der den Exchange Server weit mehr beeinträchtigt. Dafür kann Inboxx mit einer auf Indexierung spezialisierten Datenbank punkten, die sowohl beim Backup als auch bei Restores und der Reorganisation der Indizes ihre Vorteile hat.

Für Mimosa wiederum spricht, dass die Software alle Outlook-Elemente archivieren kann, einen spezialisierten Such-Client bietet und sich die Regeln für Aufbewahrungsfristen feiner abstufen lassen. (fn)

*Christoph Lange ist als IT-Consultant tätig und auf Server- und Speichertechnologien spezialisiert.