Server im Vergleich/Server-Technologie verfeinert das Beleglesen

Schnoerkel und Arztklaue landen trotz Krakel in der Datenbank

16.02.1996

Von Horst-Joachim Hoffmann*

Hieroglyphen statt der wohlbekannten Buchstaben sind auch fuer das menschliche Auge ein Graus - genau wie ein zu schwacher Durchdruck bei Formularen. Im Massengeschaeft der automatisierten Belegerfassung stellen diese nicht zu vermeidenden Abweichungen vom Ideal durch den Zwang zu manueller Nachbearbeitung ein kostenintensives Problem dar. Beleglesen per Computer ist weit entfernt von Trivialitaet - clevere Kosmetik und Server-Leistung im oberen Bereich verhelfen der Maschine aber doch zum "Durchblick".

Trotz umfangreicher Computerisierung laesst sich der Homo technicus die Lust an handschriftlicher Aktion nicht austreiben, sei es beim Ausfuellen von Bankauftraegen, bei Anmerkungen auf Lieferscheinen oder der Adressierung von Paketen. Und welcher Banker wagt es schon, diese fast letzte Domaene absoluter individueller Freiheit anzugreifen und einen handverfassten Bankauftrag mit der Bemerkung "Sauklaue" zurueckzuweisen. Der Medienbruch Mensch-Computer ist hier offensichtlich unabwendbar und fordert im heutigen Massenbetrieb ausgekluegelte High-Tech-Loesungen.

Die Belegmengen, die zur Verarbeitung anstehen, sind immens. So ist bei der Gesellschaft fuer Zahlungssysteme GZS in Frankfurt ein System installiert, das ueber die Vernetzung von Parsytec-Parallelrechnern mit intelligenten Schriftenlesern tagtaeglich bis zu 300000 handschriftliche Belege verarbeiten muss. Die GZS ist fuer das gesamte Clearing von Eurocard-Slips zustaendig.

Das Einsatzgebiet des maschinellen Beleglesens erweitert sich indes konstant. Umfrageboegen, Schadensmeldungen, Policen jeder Art, Steuererklaerungen oder Zeiterfassungsboegen sind genauso wie Bestellscheine, Formulare bei Behoerden, Versicherungen und Banken oder Rechnungs- und Lieferscheinen fuer die Beleglesung geeignet - neue Anwendungen letztlich nur eine Frage der Phantasie. In diesem Markt fuer einfache, sich wiederholende, erkennende Arbeiten liegt ein gewaltiges marktwirtschaftliches Potential. Nach Schaetzungen von Beobachtern verschlingen die Kosten, die hier jaehrlich verursacht werden, weltweit den Betrag von gut 100 Milliarden Dollar. Diese Anwendungen werden deshalb erwartungsgemaess in den naechsten Jahren extrem durchrationalisiert.

Doch ob es ums Lesen von Belegen im Geldverkehr oder das Erkennen von Autokennzeichen auf Radarfotos geht - die Probleme bleiben im Prinzip identisch.

Mustererkennung und Beleglesung bedienen sich bei diesen Datenfluten spezialisierter Verfahren und Vorgehensweisen, die aus einem handschriftlichen Stueck das Letzte herausholen.

Dann ist es zur maschinellen Weiterverarbeitung verwertbar. Mit steigendem Volumen der Belege wachsen aber nicht nur die Anforderungen an die Geschwindigkeit der Rechner, auch die Verfahren zur Fehlereingrenzung muessen verfeinert werden. Die GZS zum Beispiel erzielte bereits 1992 eine Erkennungsrate fuer Handschriften von 94 Prozent bei einem Fehlerquotienten von unter zwei Prozent.

Grauwertverarbeitung, Schriftenleser und Datenbankabgleich muessen Hand in Hand arbeiten, um zu einem durchgaengigen Workflow zu gelangen, haben aber jeder fuer sich spezielle Eigenheiten.

So erfolgt die Grauwertverarbeitung bislang in der Regel auf das gesamte Formular bezogen. Die Scanner besitzen einen Farbfilter, der Informationen in der Blindfarbe - meist Rot - entfernt. Dieses sogenannte Nettobild ist lesetauglich. Der Scanner bildet integrativ einen Schwellenwert fuer den gesamten Beleg; auf Schwarz gestellt, wird beispielsweise eine hellere Schrift als Blau nicht mehr abgebildet.

Ein neues System, das aus einer Zusammenarbeit zwischen Parsytec und Unisys hervorging, definiert den Schwellenwert des Scanners nun feldorientiert. Nach Aussage der Spezialisten macht diese Vorgehensweise auch Images lesbar, die nach den bisherigen Standardmethoden manuell nachbereitet werden mussten, und verringert so ganz entscheidend die Fehlerquote. Gleichzeitig eroeffnet die neue Grauwertverarbeitung nun auch neue Anwendungsfelder, zum Beispiel das Lesen von Euroschecks (vgl. die Abbildungen).

Ein zweiter Problempunkt ist der Schriftenleser. Schraeglage des Formulars beim Einzug macht sich ebenso unangenehm bemerkbar und fuehrt zu Fehlern wie Feldueberschreitungen beim Ausfuellen, unterschiedliche Helligkeiten in verschiedenen Feldern, schlechte, unlesbare Durchschlaege, ein Mix aus Gross- und Kleinbuchstaben, Fliesshandschrift oder verschiedene Schriftarten mit ihren speziellen Besonderheiten.

Klassische Belegleseverfahren bedienen sich des Bitmap-Vergleichs, der Polynomklassifikation oder auch der Winkelschnittanalyse. Diese Verfahren segmentieren und klassifizieren einzelne Zeichen nach ihrer Wahrscheinlichkeit. Neue Systeme, die erst mit modernster Server-Technologie realisierbar wurden, arbeiten neuronal. Die Software lernt durch vielfaeltiges Vorlegen die verschiedensten Hand- und Maschinenschriften kennen und wiedererkennen.

Durch Mehrprozessorarchitektur und Parallelverarbeitung schaffen die Lesesysteme nach Angaben von Parsytec insgesamt bis zu 1000 Characters per second (cps).

Ein intelligentes Erkennungsverfahren sorgt fuer eine weitere Steigerung der Trefferrate. Es arbeitet kontextsensitiv und erreicht durch Interpretation und integrierte Plausibilitaetspruefungen gute Ergebnisse. Ein Abgleich der Bankleitzahl mit dem genannten Institut, des Namens mit der Kontonummer oder ein felduebergreifender Abgleich mit speziellen Datenbanken steigerte die Qualitaet des Bearbeitungsvorgangs. Eine assoziative Abfragetechnik gewaehrt die erforderlichen Durchsaetze bei hohen Datenvolumina. So bringt es ein Prozessor heutzutage auf etwa 30000 Feldvergleiche pro Stunde. Die Mehrprozessortechnik erlaubt in diesem Bereich zudem eine weitere lineare Leistungssteigerung.

Das Erstellen eines Netto- sowie eines Bruttobilds (zur Archivierung) erforderte bislang einen Scan-Vorgang mit drei Kameras. Die neue Technologie, die von Parsytec und Unisys erarbeitet wurde, verarbeitet ein Kamerabild mit 256 Graustufen in einem Hochleistungsserver so, dass sowohl das Archivbild als auch das Nettobild, dessen Informationen weiterverarbeitet werden, entstehen. Je nach Formular wird als Bruttobild ein TIFF-G4-Binaer-Bild mit einigen zweistelligen Kilobyte oder auch ein Belegbild in JPEG erzeugt. Das bereinigte Nettobild fuer die Intelligent Character Recognition (ICR) beansprucht als TIFF-G4-Image laut Parsytec meist weniger als 10 Kilobyte Speicher.

Verbesserung des Durchsatzes bei weiterer Steigerung der Quote heisst also die Devise. Insbesondere bei der Abwicklung des Zahlungsverkehrs mit Formularen meist im DIN-A6-Format tut sich hier einiges. So unterzeichnete Unisys mit Parsytec einen Rahmenvertrag, nach der die Grauwertverarbeitung aus der Aachener Parallelrechner-Schmiede fester Bestandteil der Scanner DP500 und DP35 aus dem Hause Unisys wird. Die Scanner leisten einen Durchsatz von 500 beziehungsweise 35 DIN-A6-Belegen je Minute.

Geschwindigkeit beim automatisierten Lesen ist also Trumpf, doch ob der Bankenkunde nun spuerbar schneller an sein Geld kommt - das steht auf einem ganz anderen Blatt.

*Horst-Joachim Hoffmann ist freier Fachjournalist in Muenchen.

Kurz & buendig

Mustererkennung ist eine Domaene von Number-Crunchern; das Lesen von "Sauklauen" gehoert auch dazu. Bis zu 300000 handschriftliche Belege werden taeglich bei der Gesellschaft fuer Zahlungssysteme GTZ in Frankfurt von intelligenten Schriftenlesern, die mit Parallelrechnern vernetzt sind, verarbeitet. Das Prinzip ist uebertragbar auf unterschiedliche Arten von Formularen, Radarfotos etc., Unschaerfen sind einkalkuliert.