Mobile Computing/Probleme der Handschrifterkennung sind weiterhin nicht geloest - aber: Nach dem Ende der Euphorie lassen neue Methoden hoffen

06.10.1995

Von Agnieszka Kowaluk*

Vor einigen Jahren traten Pen-Computer an, die mobile Datenerfassung zu revolutionieren. Vor allem mit der Handschrifterkennung waren grosse Hoffnungen verbunden. Mittlerweile herrscht heilsamer Pragmatismus vor - und wiederum keimen grosse Zukunftserwartungen.

Bei Markteinfuehrung der stiftbasierten Mobilsysteme lenkten die Hersteller wie NCR, Momenta oder Grid die Aufmerksamkeit einer faszinierten Oeffentlichkeit auf die Moeglichkeit der Geraete zur Handschrifterkennung. Mit einem Stift auf die Bildschirmoberflaeche gemalte Zeichen wurden als Buchstaben erkannt und in ASCII-Zeichen verwandelt. Marketing-Parolen der Art "Endlich ein Computer, der Sie versteht" und der Slogan von der "elektronischen Tinte auf intelligentem Papier" taten ein uebriges, die Erwartungen so hoch zu treiben, dass sie zwangslaeufig enttaeuscht werden mussten.

Mittlerweile sind selbst die hartnaeckigsten Propagandisten davon abgekommen, die Schrifterkennung als Abloesung der Texteingabe per Tastatur anzupreisen. Laengere Texte und auch kurze Saetze lassen sich auf herkoemmlichem Wege nicht nur schneller, sondern auch mit einer geringeren Fehlerrate erfassen. Doch auch wenn die Schrifterkennung nicht die Bedeutung erlangt haben mag, die ihr einige vor Jahren zugesprochen haben, gibt es Situationen, in denen sie durchaus Vorteile bieten kann.

So kann es bequemer sein, Zahleneingaben direkt in dafuer vorgesehene Eingabekaestchen einzutragen oder Verbesserungen an Texten vorzunehmen, indem man den korrekten Buchstaben einfach ueber den fehlerhaften schreibt. Auch koennen sich die auf den Bildschirm eingeblendeten Softwaretastaturen stoerend auswirken, da sie immer einen Teil der dargestellten Information verdecken.

Eine Reihe von Softwarefirmen hat sich von den anfaenglichen Misserfolgen nicht entmutigen lassen und immer weiter verbesserte Versionen von Erkennungsmodulen auf den Markt gebracht, die mit immer raffinierteren Features aufwarten konnten. Waren die ersten Recognizer auf eine klar in einzelne Buchstaben segmentierte Eingabe angewiesen, koennen einige der heutigen Systeme wie der "Inkwriter" oder das "Calligrapher"-Modul von Paragraph bereits Eingaben in Schreibschrift verarbeiten.

Sonderzeichen wie Umlaute oder Buchstaben mit Akzentuierungen stellen fuer multilingual ausgerichtete Erkennungsalgorithmen ebenfalls kein Problem dar. Und auch die Trainierbarkeit der Software ist inzwischen besser. In der Regel wird sie bereits "vortrainiert" ausgeliefert, so dass der Benutzer nur mehr eine kleine Anzahl problematischer Buchstaben an die persoenliche Schreibweise adaptieren muss.

Einige Recognizer, zum Beispiel der von Microsoft in der Pen- Erweiterung von Windows 3.1 integrierte, bieten die Option, dieses Benutzerprofil in einer Datei abzuspeichern. So koennen mehrere Benutzer mit einem Geraet arbeiten und finden dennoch jeweils eine auf den individuellen Schreibstil hin personalisierte Umgebung vor.

Wer nun auf die Idee kommt, durch exzessives Trainieren die Erkennungssoftware immer weiter zu verbessern, um eines Tages - zumindest fuer die eigene Handschrift - eine 100prozentige Erkennungsleistung zu erhalten, verkennt grundlegende Probleme.

Zum einen werden durch "Uebertrainieren" einige Zeichen zugunsten von anderen weniger gut erkannt. So wuerde der Buchstabe "S" die aehnlich aussehende Ziffer "5" verdraengen. Ferner besteht die Schwierigkeit, dass die eigene Handschrift keineswegs ein konstantes Aussehen aufweist, sondern je nach aeusseren Bedingungen oder psychischem Zustand Schwankungen unterworfen ist. Vor allem aber erfordert die eindeutige und fehlerfreie Zuordnung von per Hand gemalten Linienzuegen zu den tatsaechlich gemeinten Buchstaben kognitive Leistungen, die gemeinhin als Ausdruck menschlicher Intelligenz gelten.

Wir haben keinerlei Schwierigkeiten, die Zeichenfolge "Oboe 970,- DM" zu entziffern. Einen Erkennungsalgorithmus hingegen wuerde die Entscheidung, ob es sich bei dem kreisfoermigen Zeichen um den Grossbuchstaben "O", den Kleinbuchstaben "o" oder um die Ziffer "0" handelt, jeweils vor grosse Probleme stellen. Aehnlich verhaelt es sich bei einem senkrechten Strich, bei dem oft nur aus dem semantischen Kontext ersichtlich ist, ob er als "I", als "l" oder als "1" zu deuten ist.

Herkoemmliche Recognizer basieren auf dem Konzept, dem Benutzer bei der Eingabe weitestgehende Freiheiten zu lassen und alle nur moeglichen Buchstabenvarianten und Schreibweisen zu erkennen. So lassen sich die Linienzuege eines "E" auf mehrere hundert verschiedene Arten schreiben.

Jeff Hawkins, Chef der amerikanischen Softwarefirma Palm Computing, der mit dem "Palmprint"-Recognizer eines der bis dato erfolgreichsten Erkennungsmodule entwickelt hat, erkannte, dass dieser Ansatz in eine Sackgasse fuehrt. In einem neuen Projekt setzte er die Erkenntnis um, dass man nicht das Unmoegliche versuchen, sondern lieber realistische Ziele bestmoeglich erfuellen solle.

Ergebnis dieser Einsicht war ein Erkennungsmodul namens "Graffiti", das auf einem alten und zugleich radikal neuen Ansatz basiert. Bei Graffiti muss sich der Benutzer rigoros an die von der Software gewuenschte Schreibweise anpassen.

Dies klingt dramatischer, als es in Wirklichkeit ist: Die meisten Zeichen entsprechen ohnehin dem gewohnten Aussehen, lediglich einige wenige Buchstaben - zum Beispiel "A", "F", "T" - weichen vom gewohnten Schema ab. Jedes Zeichen besteht aus genau einem "Stroke" (Linienzug) und unterscheidet sich so stark von allen anderen, dass eine Zuordnung normalerweise einwandfrei moeglich ist.

Spaetestens nach 20minuetigem Training hat der Anwender alle Zeichen verinnerlicht und kann in natuerlichem Tempo die Buchstaben in ein spezielles Eingabefenster malen, von wo aus sie in die jeweils aktive Applikation uebernommen werden. Bei Graffiti stellt sich zum ersten Mal das Gefuehl ein, nicht jedes eingegebene Zeichen nachkontrollieren zu muessen. Die Handschrifterkennungs-Software ist auch auf einem Rechner geringer Leistung in der Lage, die Zeichen schneller zu erkennen, als sie sich schreiben lassen.

Die Qualitaet von Graffiti ueberzeugte sogar die Ingenieure von General Magic, dem Unternehmen, von dem "Magic Cap" kommt. Da dieses Betriebssystem kommunikationsorientiert angelegt war, wollten die Entwickler zunaechst auf jegliche Handschrifterkennung verzichten und setzten allein auf Popup-Tastaturen und den Datentyp "elektronic ink". Angesichts des Erfolges von Graffiti ist nun aber auch die Moeglichkeit der Integration des Graffiti- Moduls in Magic Cap vorgesehen.

Neben den vorhandenen Versionen fuer Magic Cap, Pen/Geos und das Newton-Betriebssystem ist auch eine Windows-Variante von Graffiti in Entwicklung. Wohl aufgrund der Tatsache, dass es von Windows 95 ebenfalls eine Pen-Ausfuehrung geben wird, schaetzen einige Marktforscher die Chancen fuer Pen-Windows aber nicht allzu rosig ein. Daher sollen Plaene fuer die Weiterentwicklung der Windows- Version erst einmal auf Eis liegen.

Alternative Eingabemoeglichkeiten

Mittlerweile existieren neben der Handschrifterkennung mehrere andere Verfahren, mit denen mobile Nutzer Daten eingeben koennen:

- Am populaersten sind Listen, aus denen man die gewuenschten Eingaben durch Antippen auswaehlt. Bei umfangreichen, unstrukturierten oder von vorneherein nicht bekannten Daten ist dieses Verfahren allerdings nicht immer ohne weiteres praktikabel.

- Reine Zahleneingaben lassen sich auch durch Schieben eines Softwarereglers auf einer beschrifteten Skala vornehmen.

- Virtuelle Softwaretastaturen bilden in miniaturisierter Form eine vollwertige AT-Tastatur - oder einen Teil, zum Beispiel nur den numerischen Zehnerblock - auf dem Bildschirm ab. Die Eingaben erfolgen durch Tippen mit dem Stift auf die einzelnen Tasten, wobei auch Sondertasten wie die Cursor-Steuerung oder die Shift- Taste ihre Funktion beibehalten. Alternativ lassen sich auch anwendungsspezifische Softwaretastaturen in die Applikation integrieren.

- Eine neuartige Predicta-key-Tastatur zeigt in Abhaengigkeit von bereits eingegebenen Zeichen diejenigen sechs Buchstaben an, die mit groesster Wahrscheinlichkeit als naechstes benoetigt werden. Falls sich das gewuenschte Zeichen nicht unter der Auswahl befindet, bringt das Antippen eines Buttons die naechstwahrscheinlichen Buchstaben auf den Bildschirm.

Uebersicht ueber Handschrift-Erkennungsmodule

Modul: 1. Hersteller, 2. Betriebssystem, 3. Geraet

Palmprint: 1. Palm Computing, 2. DOS, Pen/Geos, 3. Gridpad, Zoomer

Graffiti: 1. Palm Computing, 2. Pen/Geos, Newt-OS, Magic Cap, 3. Zoomer, Envoy, Messagepad, PIC-1000 Magiclink

Calligrapher: 1. Paragraph, 2. Newt-OS, 3. Messagepad

n/A: 1. Texas Instruments, 2. Eden OS, 3. Penpad PDA 600

Handwriter: 1. CIC 2. Pen-DOS, Pen-Windows, 3. alle Notepads

n/A: 1. Microsoft, 2. Pen-Windows, 3. alle Notepads

Longhand: 1. Lexicus, 2. Pen-Windows, 3. alle Notepads

* Agnieszka Kowaluk ist als freie Autorin und Uebersetzerin in Muenchen taetig.