Mustererkennung

Anschriftenlesen als technisch-wissenschaftliche Disziplin

19.10.1990

Briefverteilanlagen sortieren Briefe automatisch nach Verteilrichtungen. Das setzt voraus, daß zuvor die Anschriften automatisch gelesen wurden. Das Anschriftenlesen ist eine der bedeutendsten Leistungen der Mustererkennung. Diese technisch-wissenschaftliche Disziplin schlägt die Brücke zwischen dem, was technischen Sensoren zugänglich ist, und der Welt der Symbole, mit denen die Informationsverarbeitung umgeht.

Ein besonders anschauliches Beispiel für die Vorgehensweise der Mustererkennung ist die Schriftzeichenerkennung, die beim Lesen von Anschriften eine zentrale Rolle spielt.

Ausgangspunkt ist das Rasterbild des Zeichens, das beim Abtasten der Briefvorderseite entsteht.

Der Bildausschnitt, der ein einzelnes Zeichen enthält, hat je nach Schriftgröße etwa 30 x 20 Bildelemente. Jedes der Bildelemente kann nach Quantisierung mit lokal-adaptiver Schwelle nur noch die Werte Schwarz oder Weiß annehmen, ist damit digitalisiert.

Schriftzeichenbilder kommen mit gleicher Bedeutung in zahllosen Varianten vor. Ein Teil dieser Vielfalt der Erscheinungsformen läßt sich systematisch beschreiben als Variante von Position, Größe und Schräglage.

Ein anderer Teil der Variabilität muß statistisch aufgefaßt werden, so die Vielfalt der Schriftarten und Schriftqualitäten und die Individualität der Handschrift.

Das Problem der systematischen Veränderungen wird durch Normierungsmaßnahmen gelöst. Dabei ist die Positionsnormierung in der Ausschnittsbildung enthalten, die das Bild des Einzelzeichens separiert. Größe und Schräglage werden durch Größen- und Schräglagennormierung ausgeregelt.

Erkennungssystem ist lernfähig

Nach diesen Normierungsoperationen verbleibt ein gewissermaßen standardisiertes, rahmenfüllendes Rasterbild mit Abmessungen von 16 x 16 Bildelementen und 8 Bit Grauwerten. Die Grauwerte werden eingeführt, um Quantisierungsungenauigkeiten entgegenzuwirken.

Diese Daten bilden die Menge von Eingangsvariablen für die Schätzung der Bedeutung. Diese Meßdaten sind die Merkmale, auf die die Erkennung sich stützt.

Das Erkennungssystem ist ein lernfähiges System. Lernen heißt hier Änderung des Systemverhaltens so, daß ein Optimierungsziel erfüllt wird. Optimierungsziel ist, den Unterschied zwischen geschätzter und wahrer Bedeutung zum Verschwinden zu bringen.

Das Erkennen der Einzelzeichen ist beim Anschriftenleser nur eine Teilfunktion in einem Komplex von Mustererkennungsfunktionen. Vor der Schrifterkennung steht die umfangreiche Aufgabe, die Adresse und ihre Bestandteile überhaupt erst in der Menge der übrigen Informationen zu finden; das sind Reklameaufdrucke, Briefmarke und Stempel, Absenderangabe, Beschriftung bei Postkarten und ähnliches mehr. Ausgangspunkt ist dabei das Rasterbild der Briefvorderseite, das bis zu 1024 x 2048 Bildelemente hat.

Auf die Schrifterkennung folgt die Aufgabe, das Gelesene einer der zulässigen Anschriften zuzuordnen; im einfachsten Fall führt das zur Überprüfung der Übereinstimmung von Postleitzahl und Bestimmungsort. Die notwendigen Angaben sind in einer umfangreichen Datenbasis abgelegt, die im Verlauf der Erkennungsprozesse über außerordentlich schnelle Zugriffsverfahren immer wieder abgefragt wird.

Die erreichte Erkennungssicherheit ist zu einem erheblichen Teil der intensiven Nutzung der in Anschriften vorhandenen Gesetzmäßigkeiten zu danken.