Texterkennungssoftware Fine Reader 9.0 im Test

06.12.2007
Von Thomas Hümmler
Die Texterkennungssoftware Fine Reader 9.0 erwies sich in unserem Test als durchaus brauchbar.

OCR steht für Optical Character Recognition. OCR-Programme erkennen Text und wandeln diesen in ein Dokument, das der Benutzer bearbeiten kann. Der Ursprungstext kann ein Brief sein, ein Fax, eine Zeitungsseite oder ein PDF. Die Profiversion 9 von Abbyy Fine Reader scannt sogar mit einer Digitalkamera abfotografierte Dokumente.

Die Zeichenerkennung vom Foto einer Digitalknipse ist allerdings nicht neu, sondern nur verbessert worden. Zum ersten Mal hingegen ist die sogenannte ADR-Technik dabei, mit der die Seiten eines Textes im Ganzen analysiert und rekonstruiert werden. Dabei will die Software das Ergebnis im ursprünglichen Layout rekonstruieren – mit Überschriften, Spalten, Tabellen und Abbildungen und den ursprünglichen Formatierungen.

Das wollen wir genau testen: Mit einer Canon-EOS-Digitalkamera fotografieren wir eine Doppelseite aus der PC-Welt und füttern anschließend damit Fine Reader. Der hat zumindest kein Problem, das Dokument zu lesen – Fine Reader kennt 17 verschiedene Bildformate. Anschließend präsentiert das Programm sein Ergebnis. Das kann sich sehen lassen: Zum einen ist es erstaunlich, wie gut das Erkennen der Textelemente funktioniert.

Das gilt nicht nur für weit vom Text abgesetzte Dachzeilen und Vorspänne, sondern auch für Textkästen, die mitten im Text oder über ein Bild laufen. Eine auf der Seite vorhandene Tabelle wird ebenfalls richtig umgesetzt. Auch mit unterschiedlichen Schriften hat das Tool keine Schwierigkeiten. Und obwohl die Zeitschrift nicht exakt eben auf der Unterlage lag, werden sogar die Buchstaben nahe am Bund korrekt erkannt.

Dennoch gibt es ein paar Kritikpunkte: Nicht alle Buchstaben werden richtig interpretiert. Der durch Kästen aufgelockerte Lauftext wird zwar in Spalten angeordnet, aber nicht komplett zusammenhängend. Ein Nachbearbeiten des Dokuments ist also unbedingt erforderlich.

Fazit: Erstaunlich, was OCR-Software inzwischen kann. Auch, wenn es nicht ohne nachträgliche Bearbeitung geht, werden verschiedene Elemente des Textes doch relativ gut erkannt und getrennt.

Alternative: Nuance (www.nuance.de), ehemals Scansoft, bietet das vergleichbare OCR-Produkt Omni Page in der Basisversion für 120 Euro an.

BEWERTUNG

Leistung (50%): Note 2,5
Bedienung (35%): Note 2,0
Dokumentation (5%): Note 3,0
Installation/De-Installation (5%): Note 2,0
Systemanforderungen (5%): Note 3,0

GESAMTNOTE: 2,4

Anbieter:

Abbyy

Weblink:

www.abbyy.de

Preis:

150 Euro

Betriebssysteme:

Windows 2000, XP, 2003, Vista

Plattenplatz:

ca. 280 MB