Archive heute auch ohne Aktenschränke vorstellbar

24.08.1990

Neue Systeme zur Dokumentenverwaltung und -archivierung speichern heute Unterlagen wie Korrespondenz Betriebsanleitungen, Schaltpläne, Wartungsunterlagen, Zeichnungen, Grafiken oder Entwürfe elektronisch ab. Peter Pahl* schildert, welche Anwendungsmöglichkeiten durch den Einsatz verschiedener Techniken bereits erschlossen werden können. Für ihn gehören moderne Image-Bearbeitung, automatisches Indexieren und das Fehlen von Wartezeiten zu den wesentlichsten Forderungen.

*Peter Pahl ist Vertriebsleiter Distribution der IBS Systemvertrieb GmbH, Garbsen.

Magneto-optischer Durchbruch

Mit der raschen Entwicklung der Rechnersysteme und ihrem immer breiteren Anwendungsspektrum wird auch die Forderung der Anwender nach leistungsfähigeren und preisgünstigeren Massenspeichersystemen immer drängender.

Dies ist aber nur ein Grund, warum der Markt für traditionelle Speichermedien in Bewegung geraten ist. Auch immer leistungsfähigere Speichertechniken machen den "alten" Medien Konkurrenz.

Diese Entwicklung spiegelt sich in den unterstehenden Grafiken. Zum Beispiel hat die CD-ROM-Technologie als Informationsträger für Verlage und sonstige Informationsanbieter schon ihren Markt erobert und sich darüber hinaus in vielen ähnlichen Anwendungsbereichen in eine sichere Position gebracht.

Und nachdem jetzt auch für die WORM-Technik verbindliche Standards geschaffen worden sind und diesem Medium darüber hinaus quasi "Dokumentensicherheit" bestätige worden ist - WORM wurde gesetzlich als Archivmedium zugelassen -, steht einer weiteren Ausbreitung nichts mehr im Wege.

Während die ROM- und WORM-Technik von Branchenkennern noch als sinnvolle Ergänzung zu den herkömmlichen Bändern, Platten und Disketten gesehen wird, steht die neue Generation der CD, die Rewritable, in direktem Wettbewerb zu den traditionellen Speichermedien. Wie aus rechtsstehender Grafik hervorgeht, könnte die Rewritable bis 1993 über den gleichen Marktanteil verfügen, wie Bänder und Disketten gemeinsam.

Die skizzierte Entwicklung und die Vielfalt der am Markt befindlichen Systeme unterstreichen die Tatsache eines überaus lebendigen Marktes. Auf der anderen Seite hat der Anwender aber die Qual der Wahl. Gerade bei optischen Systemen wird sehr leicht übersehen, was der Einsatz dieser neuen Systeme - die Fachleute sprechen von "Optical Filing" - für die Unternehmen bedeutet.

Mit der kleinen CD-ROM oder auch der WORM-Platte, um nur zwei Beispiele zu nennen, winken nicht nur die Unterbringung großer Plattenstapel auf kleinstem Raum. Dahinter lauern auch beträchtliche Umstrukturierungen und, wenn man nicht aufpaßt, deftige Kosten.

Die permanente Ergänzung von Akten, Ablagen und Archiven ist in konventionellen Büroumgebungen stets mit wachsenden Personal-, Material-, Raum- und Zugriffskosten verbunden. Mit einem elektronischen Dokumenten- und Archivierungssystem ließe sich Kosten und Schwächen herkömmlicher Papierverwaltungen wirkungsvoll begegnen.

Die Einsparungen von Material- und Raumkosten lassen sich an einem Beispiel verdeutlichen: Der Inhalt eines gewöhnlichen Aktenschrankes mit 30, 40 oder mehr vollgefüllten Ordnern kann auf einer einzigen WORM-Disk untergebracht werden. Auch die gleichzeitige Verfügbarkeit von Schriftstücken für mehrere Personen, ohne Anfertigung von Fotokopien, und nicht zuletzt der sekundenschnelle Zugriff auf Dokumente sind entscheidende Vorteile moderner Dokumentenverwaltung.

Ein solches System verwaltet Dokumente elektronisch - genauso wie man es vom Papier her gewohnt ist. Firmenlogos, Randnotizen, Eingangsstempel, Unterschriften und andere Detailinformationen eines Schriftstückes bleiben als elektronische Abbildung des Originals erhalten. Die Lebendigkeit der bildhaften Darstellung bewirkt eine außergewöhnlich hohe Akzeptanz durch die Anwender.

Über Scanner, die als Eingabemedium jede beliebige Schrift- und Bildvorlagen abtasten, erkennen und in digitale Signale umwandeln können, werden die Vorlagen erfaßt. Eine DIN-A4-Seite besteht aus bis zu 16 Millionen Bildpunkten. Diese "Bilddaten" werden vor der Speicherung zwecks Platzeinsparung auf dem Datenträger nach dem Verfahren CCITT-G-III und -IV (Telefaxnorm) komprimiert. Die Kompression sollte verlustfrei erfolgen und bei einem Kompressionsverhältnis von bis zu 1:40 eine deutliche Minimierung des Speicherbedarfs bewirken. Ein weiteres Kriterium für ein solches Dokumenten-Ablagesystem ist die Leistungsfähigkeit, die in der extrem schnellen Bewältigung und Darstellung der Bilddaten sichtbar wird.

Bild und Text sind zwei Welten im Computer

Die Systeme müssen anwendungsneutral einsetzbar sein - in fast allen Branchen, Betrieben und Abteilungen. Jedes Bild oder Schriftstück sollte durch ein Inhaltsverzeichnis, in dem die zum Auffinden des Dokumentes nötigen Suchbegriffe enthalten sind, "gelistet" werden. Dokumente und Inhaltsverzeichnis bilden zusammen eine Datenbank, die der Anwender nach verschiedensten Kriterien absagen kann. Vorhandene Gliederungen bestehender Akten lassen sich durch die hierarchische Struktur einer integrierten Datenbank weitgehend übernehmen, wodurch eine grundsätzliche Neukonzeption einer ansonsten funktionierenden Papierverwaltung entfällt. Der Weg zum Aktenschrank und das oft mühselige Blättern nach der gewünschten Information gehören damit der Vergangenheit an. Ist das Inhaltsverzeichnis aufgelistet, kann der Benutzer die gesuchten Dokumente auswählen beziehungsweise ansprechen. Nach dem Auffinden lassen sich die Seiten am Bildschirm durchblättern oder, wenn es denn sein muß, sofort mit dem Laserdrucker ausdrucken.

Bei der bildhaften Dokumentenverwaltung sind Schriftstücke als Bildpunkte abgelegt. Ein Computer ist von seiner technischen Konzeption her nicht in der Lage, in Bildern nach Texten, Begriffen oder Zahlen zu suchen. Um Bildinformationen später wieder abrufen zu können, müssen Suchbegriffe bei der Bildspeicherung miteingegeben werden. Diese Suchbegriffe können ganze Sätze, einzelne Stichworte, Nummern oder Kalenderdaten sein. Aus ihnen soll der Inhalt des gespeicherten Bildes hervorgehen, um die Suche nach einem bestimmten Dokument so effizient wie möglich zu gestalten.

Text und Grafik sind zwei verschiedene Welten für den Computer. Die Eingabe von Suchbegriffen kann wie bei anderen Anwendungen über die Tastatur erfolgen. Als Besonderheit bieten einige Systeme, beispielsweise Megastore von IBS, Garbsen, eine vollautomatische Erfassung von Stichworten, ganzen Textpassagen und Nummern.

Die in ein System integrierte OCR (optische Zeichenerkennung) soll die automatische Erfassung von Texten und Nummern aus dem zu speichernden Bilddokument heraus ermöglichen. Strukturen aus Bildpunkten, die in ihrer Gesamtheit ein Zeichen in der Dokumentvorlage bilden, werden von OCR durch Mustervergleich im Text interpretiert. Dies erfolgt mit einer Sicherheit von mindestens 99,7 Prozent - und das bei einer Geschwindigkeit von 160 Zeichen pro Sekunde. Druckschriften in den Schriftgrößen zwischen 6 und 24 Punkt kann das System schnell lernen, sie stehen dann immer wieder abrufbar zur Verfügung.

OCR eröffnet damit viele neue Möglichkeiten. So lassen sich beispielsweise bestimmte Felder in normierten Bestellscheinen, Rechnungen und anderen formularähnlichen Dokumenten gezielt einlegen. Die eingelesenen Daten werden von modernen Systemen gleich automatisch in die Datenbank übernommen und gespeichert, gleichgültig, ob Adressen, Kunden- und Rechnungsnummern oder Datumsangaben als Suchkriterien verwendet werden. Mit der Stapelverarbeitung können große Dokumentmengen bedienerlos erfaßt werden, die Sekunden später in der Datenbank zur Verfügung stehen.

Moderne Texterkennung bietet noch andere Vorzüge. Falls beispielsweise der Inhalt eines gespeicherten Zeitungsartikels oder eines Vertragstextes als Grundlage für einen neuen Text dienen soll, kann OCR den gesamten Text selbst erfassen. Mit der Texterkennung entsteht eine ASCII-Datei, die mit nahezu jedem handelsüblichen Textprogramm weiterverarbeitet werden kann. Selbst wenn das Bilddokument nicht archiviert werden soll, kann man es mit der OCR behandeln.

Einfach, modular und professionell

Neuartige Entwicklungen sind als modulares und offenes System entworfen. Systembasis ist zweckmäßigerweise ein 386er- oder 486er-PC, die als leistungsfähige Arbeitsplatz-Rechner ausreichen. Mit speziell entwickelten ASIC-Komponenten zur Bildverarbeitung setzte beispielsweise Megastore auf die Basishardware auf und kann somit professionelle Ablaufgeschwindigkeiten realisieren. Beispielsweise Echtzeit-Bilderfassung, sekundenschnelle Speicherung, Wiederanzeige oder Druckausgabe werden durch solche Komponenten, die auf einer zusätzlichen Koprozessorkarte untergebracht werden, ermöglicht.

Die ebenfalls dazu gehörende Betriebssoftware steuert das Gesamtsystem und bietet dem Benutzer eine überschaubare Menge sinnvoller, komfortabler Funktionen, die leicht und ohne Spezialkenntnisse anzuwenden sind. Wer zum Beispiel aus Zeitungen nur bestimmte Informationen benötigt oder Artikel und Bilder einer Vorlage neu zusammenstellen will, kann dies mit einer Clipping-Version auf sehr einfache Weise bewerkstelligen: Die Clipping-Version bedient zwei Bildschirme, wovon einer das Scanner-Bild zeigt, aus dem einzelne Bildelemente auf dem zweiten "freien" Bildschirm neu angeordnet werden können. Nach dem Prinzip des "Cut and Paste" (Ausschneiden und Einfügen) werden Elemente mit der Maus eingerahmt und anschließend neu positioniert.

Mit dieser Funktion können also auf einfachste Weise über mehrere Seiten verstreute Informationen auf einer einzigen "Archivseite" zusammengefaßt werden.

Die Lösung zur reinen Dokumentenverwaltung und -Archivierung ist die neueste Errungenschaft der Technik. Um den handels- und steuerrechtlichen Bestimmungen zu entsprechen, empfiehlt sich die Speicherung sensibler Dokumente und Geschäftsunterlagen auf der einmal beschreibbaren WORM. Die mit dem Laserstrahl eingebrannten

Informationen sind dann nach allen technischen Erkenntnissen fälschungssicher gespeichert. Darüber hinaus können Zugriffsrechte vergeben werden, damit sensible Unterlagen nur berechtigten Personen zugänglich sind.

Die dauerhafte Speicherung der Datenträger wird von den Herstellern zugesichert, weshalb auch die Behörden keine Bedenken gegen den Einsatz dieser Technologie zur Dokumentenverwaltung haben.

Der Einstieg in die elektronische Dokumentenverwaltung erfolgt zweckmäßigerweise mit einem Einzelplatz-System, das aus Rechner, Ganzseiten-Bildschirm, Scanner, Laserdrucker und natürlich der speziellen Hard- und Software besteht. Die erforderliche Konfiguration ergibt sich aus dem Arbeitsumfeld und der Funktion der jeweiligen Abteilung.

In einem Einzelplatz-System werden die jeweiligen Verwaltungsstrukturen für den praktischen Arbeitsablauf eingerichtet. Moderne Systeme, die auf ,Softwaretechnik basieren und vor allem modular aufgebaut sind, erfordern nur einen geringen Lernaufwand.

Die mit dem Scanner erfaßten Dokumente werden in einer oder mehreren Datenbanken organisiert abgelegt. Zu jedem Bild kann eine Reihe von Suchbegriffen gespeichert werden, um die gewünschten Dokumente per Stichwort abrufbar zu machen.

Die Erfassung von Stichworten oder vollständigen Sätzen als Suchbegriffe können neue Systeme selbsttätig, also vollautomatisch vornehmen. Dazu wird einfach eine Feldmaske über ein Dokument gelegt und das Archivierungssystem übernimmt Nummern, Worte oder ganze Sätze als Suchbegriffe direkt in die Datenbank. Dieser Vorgang wird als automatische Indizierung (AI) bezeichnet. Nahezu jedes Formblatt oder formularähnliche Dokument, das geeignete Indizes enthält, kann damit bedienerlos archiviert werden.

Wer formatfreie Dokumente, wie zum Beispiel Tagespost ablegen möchte, kann durch automatische Indizierung mit Datum und Uhrzeit eine ebenfalls bedienerlose Stapelerfassung starten. Die Vergabe weiterer individueller Suchbegriffe ist dann später via Tastatur möglich. Selbstverständlich können auch handschriftliche Dokumente per Tastatureingaben indiziert werden.

Die Datenbank sollte leistungsfähig sein. In der Grundversion sind bis zu zehn Schlüsselinformationen je Dokument möglich. Die Informationen können ebenso numerisch, alphanumerisch oder auch das Datum und die Uhrzeit sein. Mit einer maximalen Feldlänge von 255 Zeichen bei Alpha-Sucheinträgen steht auch für ausführlichere Inhaltsbeschreibungen genügend Platz zur Verfügung. Anzahl, Typ und Bezeichnung der Suchfelder können in diesem Rahmen frei bestimmt werden.

Die Organisation sollte hierarchisch gegliedert sein, und mit einer maximalen Anzahl von mehr als zwei Milliarden Datensätzen je Datenbank werden praktisch keine Grenzen gesetzt. Alle Suchbegriffe sind auf dem optischen Speichermedium und zusätzlich in einer ISAM-Verwaltung (Index Sequential Access Method) auf der System-Festplatte gespeichert. Bei eventuellem Verlust der Indexstruktur ist die gesamte Verwaltung automatisch reproduzierbar.

Bilderfassung mit handelsüblichen Scannern

Zur Bilderfassung können handelsübliche Scanner die Systeme unterstützen. Bei der Auswahl des Scanners sind Faktoren, wie Abtastgeschwindigkeit, Auflösungsvermögen und Vorlagenformate, zu berücksichtigen. Mit beispielsweise dem Hochgeschwindigkeits-Scanner Fujitsu M3095E oder vergleichbaren Geräten anderer Hersteller stehen flexible Apparate zur Verfügung, die wahlweise als Flachbett- oder Einzug-Scanner für Vorlagenformate bis DIN-A3 genutzt werden können. Die Abtastung ist mit bis zu 400 dpi (Dots per Inch) und in verschiedenen Kontraststufen möglich. Die zum Archivierungssystem gehörende Koprozessorkarte kann den Scanner direkt und in Echtzeit ansteuern. Das heißt, sofort nach Beginn der Abtastung wird das Bild sichtbar.

Die gesamte Bildverarbeitung führt die Prozessorkarte durch. Echtzeit-Scanning, Drehung, Verschiebung, Kompression und Dekompression von Dokumenten werden neben anderen Funktionen in professioneller Ablaufgeschwindigkeit realisiert.

Die Koprozessorkarte besitzt einen eigenen Arbeitsspeicher, der in der Grundversion mit 4 MB bestückt und bis auf 12 MB erweiterbar ist. Der Speicherbedarf ermittelt sich aus Vorlagengröße, Bildauflösung und der jeweiligen Konfiguration.

Die Betriebssoftware unterstützt Standard-Grafikmonitore und hochauflösende Ganzseiten-Bildschirme. Wegen der deutlich besseren Darstellung und für eine professionelle Arbeitsweise werden flimmerfreie Ganzseiten-Monitore mit hohen Bildauflösungen empfohlen.

Je nach gewählter Konfiguration, also automatisches Indexieren oder Clipping, sind unterschiedliche Monitorkonstellationen möglich. Die Archivierung ist als Einschirmlösung konzipiert. Für ein Clipping-System sollten zwei Bildschirme vorgesehen werden.

Sofort liegt das Ergebnis gedruckt vor

Die Ausgabe, archivierter Bilddokumente erfolgt zweckmäßigerweise über den Laserdrucker, der von der Koprozessorkarte mit Höchstgeschwindigkeit angesteuert wird. Bei einer Druckqualität von bis zu 300 dpi dauert der Ausdruck nur Sekunden und entspricht qualitativ dem Original. Für die Druckersteuerung sind verschiedene Koprozessorkarten auf dem Markt, die jeweils bestimmte Drucker unterstützen.

Bilddaten werden von der zur Archivierung vorgesehenen Datenbank in der Grundversion auf einer 800-MB-WORM-Wechsel-Cartridge (WORM = Write Once Read Multiple) gespeichert und stehen dort abrufbereit zur Verfügung. Die per Laserstrahl beschreibbare WORM ist ein sicheres und ausgereiftes Speichermedium.

Die Speicherkapazität von 800 MB reicht beispielsweise für bis zu 16 000 Seiten im Format DIN A4 bei ausgezeichneter Bildauflösung von 400 dpi. Die Kapazitätsberechnung basiert auf dem durchschnittlichen Kompressionsverhältnis von 1:40. Der Kompressionsfaktor ist wesentlich vom Schwarzanteil des Dokumentes abhängig und kann daher bei Vorlagen mit umfangreichen Illustrationen geringer ausfallen.

Mehr Massenspeicher und Speicherkonzepte

Neue Systeme sollten nicht an die WORM-Speichertechnik gebunden sein. Die Kapazität kann durch Auswahl anderer, vorzugsweise optischer Speichersysteme nahezu unbegrenzt erhöht werden.

Für den Ausbau der Speicherkapazität stehen sogenannte Juke Boxen (Platten- Wechseleinheiten) zur Verfügung, die sowohl in WORM-Technologie als auch in Form von wiederbeschreibbaren optischen Speicherplatten erhältlich sind.

Die Konzeption der Massenspeicher ist stets an den Anforderungen zu messen. Es können Einzelplatz-, Abteilungs- und Etagen-Systeme konfiguriert werden, die auf Rechneranbindungen über Netzwerke (LAN) oder in Verbindung mit Zentralrechnern arbeiten. Eine Vernetzungsmöglichkeit des Archivierungssystems sollte Voraussetzung sein.