Rechner hören und sehen:

Sensoren simulieren Sinnesorgane

21.09.1979

Prof. Dr.-Ing. Eike, Mühlenfeld Inhaber des Lehrstuhls für Regeltechnik und Elektronik der Technischen Universität Clausthal, Clausthal-Zellerfeld

In Anbetracht der Leistungsfähigkeit moderner DV-Anlagen ist man geneigt, ihnen eine gewisse Intelligenz zuzusprechen, auch wenn sie nicht einen der fünf Sinne besitzen, die der Mensch beisammen haben sollte, um als halbwegs intelligent anerkannt zu werden. Wir haben uns daran gewöhnt, daß wir mit Rechnern in einer genau festgelegten Zeichensprache reden müssen, die wir über Schreibmaschinentastaturen eingeben. Wenn technische Geräte zur Informationserfassung auch noch nicht die universelle Leistungsfähigkeit besitzen, die wir von den wichtigsten menschlichen Sinnesorganen, Auge und Ohr, erwarten, so erkennen sie doch Bild- und Schallinformation in speziellen Anwendungen hinreichend zuverlässig.

- Was können Rechner heute hören und sehen?

Die Rentabilität der dazu notwendigen, zum Teil erheblichen Investitionen wird nicht zuletzt von der Beantwortung der Frage abhängen:

- Sind Fortentwicklungen der Erkennungssysteme zu erwarten, die heutige Technologien ablösen werden, bevor sich ihr Einsatz amortisiert hat?

In revolutionärer Entwicklung befinden sich jedoch nicht nur die DV-Technologien, sondern auch die Struktur des Informationsmarktes:

- Sind Strukturänderungen der innerbetrieblichen und gesamtwirtschaftlichen Informationshandhabung zu erwarten, die Erkennungssysteme für die jeweilige Aufgabe im Laufe der 80er Jahre überflüssig machen?

Bildwandlung

Zunächst wollen wir die wandlertechnischen Grenzen von Erkennungssystemen grob abstecken. Bildpunkt für Bildpunkt wird für die Eingabe in Rechner in elektrische Signale gewandelt. Wo es auf Schnelligkeit ankommt, wandeln Rezeptorzeilen das Bild zeilenweise jeweils gleichzeitig. In üblichen Fernsehkameras muß der Elektronenstrahl zyklisch das gesamte Bild auf dem Kameratarget abtasten, da das Target die Helligkeit jedes Bildpunkts bis zur Abtastung aufintegriert, was der Empfindlichkeit zugute kommt. Mit der Image-Dissector-Kamera läßt sich das Bild in beliebiger Weise abtasten, denn hierbei handelt es sich um einen Bildverstärker, dessen Elektronenbild durch Ablenkfelder über der kleinen Apparatur eines Photovervielfachers in beiden Richtungen

bewegt werden kann.

In der Praxis beschränkt die Wandlertechnik die Bildeingabe bisher auf gut ausgeleuchtete Objekte mit starkem Kontrast oder auf Papiervorlagen. In der Forschung bemüht man sich, das Bild mit rein optischen Mitteln so weit vorzuverarbeiten, daß Wandlerinhomogenitäten nicht mehr stören.

Klarschriftleser

Wir wenden uns zunächst Bildmustern der ersten Gruppe zu.

- Markierungsleser: Produktionsgüter oder Verpackung sind maschinell mit optischen oder magnetischen Strichcodes zu markieren. Auch vom Menschen durch Kreuze oder Striche ausgefüllte Formulare werden einwandfrei gelesen.

- Normschriftleser: Maschinell erstellte Belege oder Belegzeilen in Normschrift OCR-A oder OCR-B sind maschinell mit größerer Zuverlässigkeit lesbar, als visuell durch den Menschen, da beim Menschen Ermüdungserscheinungen und Kontextverwechslungen bei länger andauernden, monotonen Tätigkeiten zu Fehlern führen.

Die Erkennungsalgorithmen lassen sich auf Mikrorechnern implementieren. Markierungs- und Normschriftleser sind heute mit einem von Hand frei geführten Lesekopf erhältlich oder integriert in Anlagen für die mechanische Handhabung und Sortierung von Massenbelegen. Die relativ geringen Kosten für die Lesegeräte selbst amortisieren sich schnell.

- Hand-Druckschrift-Leser: Sind die einzelnen Zeichen einer Folge deutlich voneinander getrennt, so lassen sich trotz individuell unterschiedlicher Schreibweise bei Ziffern, die ohne jede einschränkende Vorschrift geschrieben wurden, Fehlerraten von 0,5

Prozent erreichen. Umfaßt der Zeichensatz auch Buchstaben, so nehmen die Verwechslungsmöglichkeiten zu, und die Fehlerrate steigt auf über ein Prozent.

Eine Rückweisungsschwelle halbiert die Fehlerrate, weist aber auch richtig erkannte Zeichen zurück, sodaß die Rückweisungsrate etwa doppelt so hoch ist, wie die ursprüngliche Fehlerrate. Wesentliche Fortschritte sind vorerst nicht zu erwarten. Bei nur zehn alphanumerischen Zeichen pro Beleg wird jeder fünfte Beleg zurückgewiesen, jeder zwanzigste falsch gelesen, wenn in den Belegen keine Redundanz (Prüfzeichen) vorhanden ist, die dem Rechner eine Fehlerkorrektur ermöglicht. Auch wenn diese Fehler und Rückweisungen organisatorisch verkraftet werden können, ist in Anbetracht des hohen Rechenaufwandes, der wiederum nur bei Massenanwedungen mit mechanisierter Beleghandhabung zu vertreten ist, zu fragen, ob im vorgesehenen Anwendungsfall in den 80er Jahren Primärdatenerfassung noch in größerem Umfang handschriftlich vorgenommen werden wird. An innerbetrieblichen Arbeitsplätzen, an Bankschaltern und anderen Kundenkontaktstellen, aber auch in privaten Haushalten werden zunehmend Tastaturen und Sichtgeräte für die direkte elektronische Datenerfassung vorhanden sein.

Sprachdecoder

Außer der Tastatur bietet sich für die primäre Erfassung der von Menschen erzeugten Daten die Sprache an, weil sie in ursprünglicher Form telephonisch zu zentralen Systemen übertragen werden kann.

- Sprechererkennung erlaubt mit befriedigender Sicherheit die Identifikation des Sprechers zur Prüfung seiner Zugangsberechtigung zu Informationen, Konten und Leistungen.

- Worterkennung für einen Wortschatz von 100 einzeln gesprochenen Worten ist bei Auslegung für einen bestimmten Sprecher bereits heute sehr zuverlässig. Probleme durch phonetische Unabhängigkeit vom Sprecher werden im Zuge der raschen Fortschritte auf dem Gebiet der akustischen Mustererkennung in wenigen Jahren gelöst sein.

- Spracherkennung in natürlicher, kontinuierlicher Form wird in absehbarer Zeit wahrscheinlich nicht zufriedenstellen.

Da der Mensch als Informationsquelle beim Sprechen mit dem Erfassungssystem in direkter Verbindung steht, kann das System in Zweifelsfällen zurückfragen, was bei Auswertung schriftlicher Belege nicht ohne weiteres möglich ist.

Erkennung natürlicher Objekte und Szenen

Erkennen heißt nach Minsky, aus einer Fülle angebotener Information die für eine vorgegebene Aufgabe relevante Information zu extrahieren. Primäre und sekundäre Bildinformation sind in technischen Prozessen vielfältiger Art.

- Bildanalyse: Statistische Verteilung vom Formparametern, wie Flächengröße, Längen der Randkonturen und Vorzugsrichtungen der im Bildfeld vorhandenen Objekte werden extrahiert und ausgewertet.

Kritisch sind Objektüberlagerungen und Wandlerfehler bei zu schwachem Kontrast, wenn dabei Objektkonturen nicht mehr lückenlos detektierbar sind.

- Sichtkontrolle: Für die industrielle Prüftechnik und Qualitätskontrolle stehen universell einsetzbare Geräte nur für die Prüfung von Oberflächenhomogenität und Fertigungstoleranzen zur Verfügung.

Universelle Automaten sind in Anbetracht der Vielfalt der Aufgaben vorerst nicht zu erwarten. Für spezielle Aufgaben entwickeln Firmen und Forschungseinrichtungen aber im Kundenauftrag sehr leistungsfähige Geräte. Das hier vorhandene Potential zur Automatisierung monotoner und ermüdender Arbeitsvorgänge wird bisher noch zu wenig genutzt. Ähnliches gilt für

- Akustischge Qualitätskontrolle und Prozeßüberwachung.

Zur Übergabe von Werkstücken in verketteten Fertigungsprozessen, zum Beschicken von Pressen, Stanzen und dergleichen lohnen sich in der Massenfertigung spezielle elektromechanische oder pneumatische Vorrichtungen. Für die Kleinserienfertigung stehen flexibel einsetzbare Handhabungsgeräte zur Verfügung. Um zum automatischen Ergreifen die zuzuführenden Werkstücke nicht in Paletten ordnen oder manuell exakt positionieren zu müssen, sind Bildsensoren für die Lageerkennung erforderlich.

- Bildgestützte Fertigungssteuerung (Auge-Hand-Systeme): Werkstücke werden bei beschränkter Anzahl räumlicher Orientierungsmöglichkeiten, zum Beispiel auf einem Förderband, automatisch erkannt und geortet wenn sie sich nicht berühren oder überlagern.

Sensoren dieser Art sind seit kurzem auf dem Markt, sind in Pilotanwendungen im Einsatz und aufgrund ihrer wirtschaftlichen Bedeutung in kontinuierlicher Fortentwicklung. Durch automatisierungsgerechte Gestaltung von Werkstücken und Verkettungseinrichtungen lassen sich die Voraussetzungen für den Sensoreinsatz in vielen Fällen bereits heute wirtschaftlich erfüllen.