Die Qualitaet der Schrifterkennung ist "verblueffend, aber nicht perfekt"/Schluss

Stiftcomputer leiden weiter an Entwicklungsrueckstaenden

22.10.1993

"Des Ersten Tod, des Zweiten Not, des Dritten Brot". Legt man diese Entwickungslinie zugrunde, befindet sich der Markt fuer stiftbasierte Systeme derzeit an der Schwelle von der zweiten zur dritten Phase. Nachdem die ersten Unternehmen - mit viel Elan und Enthusiasmus begonnen - inzwischen von der Bildflaeche verschwunden sind, zeichnet sich fuer die "Ueberlebenden" in der Pen-Arena ein Ende der Durststrecke ab.

Was die Handschrifterkennung anbelangt, hat sich mittlerweile bei den Anwendern die Erkenntnis durchgesetzt, dass die im Slogan "Der Computer versteht, was Sie schreiben" zusammengefassten Erwartungen nicht zu erfuellen sind. Abgesehen davon, dass sich laengere Texte ohnehin schneller per Tastatur eingeben lassen als mit einem Stift, stoesst die Erkennungssoftware an prinzipielle Grenzen, die sich auch durch ausgefeiltere Algorithmen, groesseren Speicherplatz und schnellere Prozessoren nicht ueberschreiten lassen.

Die Entscheidung darueber, ob es sich bei einem vom Benutzer gezeichneten Kreis um eine Null, ein kleines oder ein grosses "O", um ein grafisches Element oder um eine Gesture, also eine spezielle Kommandogeste, handelt, kann nicht allein aufgrund der isolierten Eingabe erfolgen. Dafuer sind vielmehr heuristische Verfahren notwendig, welche den Kontext beruecksichtigen, in dem die Eingabe erfolgt.

Damit befindet man sich aber sofort in jenem Problembereich, mit dem sich die kuenstliche Intelligenz seit Jahrzehnten erfolglos herumschlaegt: Fuer derartige Entscheidungen sind ein Wissen und kognitive Leistungen notwendig, die denen menschlicher Intelligenz entsprechen. Ob es sich bei der Zeichenfolge "ROSI" um einen Vornamen oder eine Bestellnummer (R-Null-S-Eins) handelt, erschliesst nur der Bezugsrahmen, in dem die Zeichenkombination auftritt.

Die Software-Entwickler haben dies schon seit laengerem realisiert. Sie konzentrieren ihre Anstrengungen darauf, in ihren Applikationen den Einsatz handschriftlicher Eingaben auf ein Minimum zu beschraenken und nach Moeglichkeit die einzugebenden Daten aus bereits vorhandenen Listen selektieren zu lassen. Dies kann bei umfangreichen Datenbestaenden mit vielen tausend potentiellen Auswahlmoeglichkeiten eine durchaus nicht triviale Herausforderung an das Design der Benutzeroberflaeche darstellen.

Es waere jedoch verfehlt, der Handschrifterkennung Versagen vorzuwerfen und sie insgesamt zu verteufeln. Programme zur Umsetzung handschriftlicher Eingaben in ASCII-Zeichen wie das inzwischen auf mehrere Betriebssysteme portierte Modul der kalifornischen Firma Communica- tions Intelligence Corporation (die zugleich Anbieter eines Unterschriften-Verifikationssystems ist) oder das in der Entwick- lungsumgebung Penright Pro verwendete Modul "Palmprint" der Firma Palm Computing weisen Erkennungsraten auf, die weit ueber 90 Prozent liegen.

Erfolgt der Input in applikationsspezifischen Eingabefeldern, sind durch deren Unterteilung in einzelne Boxen klare Grenzen fuer die einzelnen Zeichen vorgegeben. Ist zusaetzlich die Eingabe auf spezielle Zeichen wie Grossbuchstaben oder Ziffern beschraenkt, laesst sich eine nahezu perfekte Erkennung erzielen.

Handschrifterkennung mit einigen Schwaechen

Auch hierzulande weniger bekannte Firmen wie Nestor ("Nestorwriter") oder Concept Technologies ("Stroke of the Hand") entwickeln und vermarkten Handschrifterkennungs-Programme, die sich aufgrund des modularen Aufbaus von Pen-Betriebssystemen wie Penwindows oder Penpoint alternativ oder ergaenzend zum Standard- Recognizer verwenden lassen. Erste Module wie das erwaehnte "Stroke of the Hand", "Longhand" von Lexicus oder das im Apple Messagepad verwendete Erkennungsmodul "Calligrapher" des russisch- amerikanischen Joint-ventures Paragraph reklamieren fuer sich, nicht mehr auf die klar segmentierte Eingabe von Druckbuchstaben angewiesen zu sein, sondern Eingaben in Schreibschrift erkennen zu koennen. Den Eindruck ueber die Qualitaet der Erkennung fasst der Branchendienst "Penplan Report" folgendermassen zusammen: "verblueffend, aber nicht perfekt".

Insbesondere bei Ansaetzen wie dem des Calligrapher, der sich beim Erkennungsprozess auf ein Woerterbuch stuetzt, treten Schwierigkeiten auf, wenn man Fremdwoerter oder ausgefallene Eigennamen eingibt - ganz zu schweigen von einer Sprache, fuer die noch kein entsprechendes Woerterbuch zur Verfuegung steht. Ein nahezu unfehlbarer Test des Autors besteht darin, seinen eigenen Namen einzugeben, um festzustellen, wie gut das Erkennungsprogramm mit willkuerlichen Zeichenfolgen umgehen kann.

Man sollte jedoch nicht uebersehen, dass eine Umsetzung in ASCII- (respektive Unicode-) Zeichen gar nicht immer notwendig ist. In vielen Faellen reicht es voellig aus, die Eingabe ohne Trans- lation zu uebernehmen und als "elektronische Tinte" abzuspeichern, beispielsweise bei handschriftlichen Notizen. Noch lassen sich auf diesem Datentyp allerdings keine klassischen Operationen wie "Suchen" oder "Vergleichen" durchfuehren. Es duerfte allerdings nur eine Frage der Zeit sein, bis entsprechende Utilities zur Verfuegung stehen.

Unterstuetzt wird dies dadurch, dass mittlerweile ein vereinheitlichender Standard fuer den Datentyp "Electronic ink" besteht. Man scheint aus den Fehlern bisheriger Standardsoftware gelernt zu haben. Egal ob bei Textverarbeitung oder Grafikprogrammen hat hier nach dem Motto: "Ein Standard ist gut, viele Standards sind besser" jeder Hersteller sein eigenes proprietaeres Sueppchen gekocht.

Datenaustausch zwischen einzelnen Programmen ist nur umstaendlich ueber Konvertier- und Filterprogramme moeglich, wobei oft ein Teil der in den Daten enthaltenen Information auf der Strecke bleibt. Dessen eingedenk haben sich sechs der massgeblichen Firmen im Pen- Bereich - Slate, Go Corp., General Magic, Apple, Lotus und Microsoft - zu einem Komitee zusammengetan und die groesstenteils in der Programmiersprache C verfassten Spezifikationen fuer elektronische Tinte erarbeitet.

Der unter dem Namen "Jot 1.0" veroeffentlichte Standard legt unter anderem fest, in welchem Format Informationen ueber Tintenfarbe, raeumliche und zeitliche Aufloesung der einzelnen Punkte oder die verwendete Stiftspitze bereitzustellen sind. Der Austausch handschriftlicher Notizen, Unterschriften, Grafiken oder Skizzen zwischen verschiedenen Software- und Hard- wareplattformen soll damit problemlos moeglich werden.

Beispielsweise liessen sich dann handschriftliche Aufzeichnungen Betriebssystem-unabhaengig in bereits bestehende Dokumente einfuegen und mit einem Stiftrechner erfasste Daten auf einem Zentralrechner weiterverarbeiten. Auch die Moeglichkeit, E-mail-Nachrichten mit handschriftlichen Kommentaren zu versehen, rueckt in greifbare Naehe. Die Marktmacht der dahinterstehenden Firmen duerfte dafuer sorgen, dass sich Jot zum De-facto-Standard entwickelt, an dem kein Entwickler Pen-spezifischer Software vorbeikommt.

Die Anwender scheren sich allerdings nicht allzusehr um solche technischen Details. "Was sie wollen, sind brauchbare und angemessene Loesungen", konstatiert der Branchendienst "Penplan Report". Hersteller und Systemhaeuser sollten einen entsprechenden Bewusstseinswechsel vollziehen.

Dann bestehen gute Chancen, dass stiftbasierte Technologien einen zwar nicht steilen, aber stetigen Aufschwung erleben und nicht von der Oberflaeche verschwinden wie viele andere grossen Ideen, deren Zeit noch nicht gekommen war.

* Fereydun Khanide ist geschaeftsfuehrender Gesellschafter der Muenchner Penplan Consulting.