OCR-Software reduziert Fehlerquote deutlich Neues Omnipage 5.0 analysiert Texte anhand von Grauwerten

19.11.1993

MUENCHEN (CW) - Mit einer komplett reorganisierten Engine zur optimierten Texterkennung hat die Muenchner Caere GmbH die neue Windows-Version 5.0 ihrer OCR-Software "Omnipage" vorgestellt. Das Update soll die in Deutschland noch relativ niedrigen Marktanteile erweitern helfen.

Bei der Beurteilung der Marktentwicklung fuer OCR-Produkte gibt sich Caere optimistisch: Gemessen am gesamten Hardware-Umsatz, soll das Wachstum im Segment der Flachbettscanner etwa 250 Prozent ausmachen, so der Hersteller. Im OCR-Geschaeft liegt der Marktanteil von Omnipage laut Caere zwischen 65 und 75 Prozent, sowohl bei PCs als auch auf dem Mac. In Deutschland versucht sich das Unternehmen mit derzeit noch etwa 35 Prozent (PC) gegen den Rivalen Recognita durchzusetzen.

Als Argument soll dabei die mit einer "3D-OCR-Technik" verbesserte Vorlagenerkennung dienen. Die Fehlerquote laesst sich damit laut Hersteller auf deutlich unter ein Prozent reduzieren. Das 3D- Verfahren beruht darauf, dass die Software nicht nur die Umrisse einzelner Buchstaben analysiert, sondern auch unterschiedliche Grauwerte, sofern Texte in Grauwertskalen eingescannt wurden. Damit sei es moeglich, Buchstabenkombinationen wie "r n", die bei direkter Abfolge auch als "m" interpretiert werden koennten, sauber zu trennen.

Ergaenzend dazu erfolgt die Interpretation von Buchstaben und Symbolen durch eine verbesserte neuronale Analysemethode. Bestandteil dieses Systems ist beispielsweise das "Anyfax-Modul", das speziell fuer die Arbeit mit gering aufloesenden Faxen im Standardmodus entworfen wurde. Mit Hilfe dieses Bildoptimierungsprozesses sollen sich verschmolzene Zeichen trennen und Risse verringern lassen. Die bei rauschender Telefonverbindung auftretende Zeilenauslassung soll das Programm anhand der Ermittlung fehlender CCITT-Codes rekonstruieren koennen.

Weitere Unterstuetzung erhaelt die Texterkennung durch einen "Language Analyst", der mit Hilfe von Woerterbuechern und der Tri- Gram-Analyse (Dreierkombination von Buchstaben) ganze Woerter ueberprueft. Integriert wurde auch das 24-Bit-Bildbearbeitungsmodul "Image Assistant" zur nachtraeglichen Bildgestaltung. Ab Januar 1994 ist Omnipage 5.0 in deutscher Version verfuegbar.u