Scanner - Eingabemedien für Desktop-Publishing:

Erkennung von Schriften bleibt weiterhin ein Problem

06.11.1987

Für Desktop-Publishing ist es inzwischen nicht mehr wegzudenken, auch vorhandene Texte, Grafiken und Fotos zu verwenden. Damit diese in digitalisierter Form vorliegen, messen sie entsprechend umgewandelt werden. Hierzu bieten sich verschiedene Verfahren an. Mit der Videokamera, einem Tisch- oder Handscanner lassen sich heute gute bis sehr gute Ergebnisse erzielen.

Für alle, die bisher viel Zeit und Geld bei der manuellen Eingabe von Text und Bild aufwenden mußten, gibt es nun Abhilfe oder zumindest eine Verringung der Kosten bei der Text- und Bilderfassung. Die meisten Scanner sind heute in der Lage, Bilder oder Texte in Schreibmaschinenschrift in digitalisierte Form, also für den Computer verständlich, umzuwandeln.

Durchzugs- oder Flachbettscanner sind ähnlich leicht zu bedienen wie die uns allen bekannten Kopiergeräte. Ebenso einfach, dazu aber noch billig, läßt es sich mit Handscannern arbeiten. Einmal über die Vorlage streichen und schon ist das Bild im Computer (wenn auch nur für gewisse Breiten). Wer eine normale Videokamera besitzt, kann diese ebenfalls verwenden. Hierbei spart man sich noch die Zwischenstufe über die Fotografie. Digitalisierungstabletts dagegen sind wegen der aufwendigen Arbeiten weniger gut geeignet, Bilder in den Computer zu bringen.

Die meisten Scanner kennen die zwei Vorlagenarten Strich (Line) und Halbton (Halftone). Bei Strichvorlagen gibt es nur schwarz und weiß, während bei Halbtonvorlagen (Fotos) Zwischentöne, hell und dunkel, vorhanden sind.

Der prinzipielle Arbeitsablauf beim Scannen ist fast überall gleich. Die Vorlage wird auf den Scanner gelegt und über das Menü "Scannen" sein Probelauf aufgerufen. Die Seite wird mit hoher Geschwindigkeit (wenige Sekunden) digitalisiert. Auf dem Bildschirm erscheint dann ein Proofscan, eine grobe Vorabversion. Mit einem entsprechenden Werkzeug legt man jetzt den endgültigen Scanbereich fest.

Über ein zusätzliches Fenster wird der Anwender jetzt nach Größe, Auflösung, Kontrast und Heiligkeit gefragt. Bei der ersten Anwendung sollte man hier die vorgegebenen Einstellungen übernehmen. Bei manchen Programmen ist es auch möglich, festzulegen, für welches Ausgabemedium (Bildschirm, Drucker oder Laserprinter) der Rasterpunkt aufgebaut werden soll.

Das Ergebnis des gescannten Bildes erscheint jetzt in einem Fenster. Je nach Programm kann der Rohscan noch bearbeitet werden wie mit einem Malprogramm (Paint). Hierzu kann das Bild auch bis auf Pixeldarstellung (Bildschirmpunkt) vergrößert werden.

Nach der Bearbeitung muß das Dokument gespeichert werden. Hierbei sind verschiedene Formate möglich. Eines hat sich in diesem Bereich bereits als Standard erwiesen: das TIFF-Format (Tag-Image-File-Format). Inzwischen hat man zusätzlich das EPS-Format entwickelt (Encapsulated Postscript), also eine direkte Post-Script-Datei. Außerdem sind verschiedene Formate für Paintprogramme möglich und, sofern Platz auf der Platte gespart werden muß, noch in einem komprimierten Format.

Von den meisten Programmen kann direkt im scannereigenen Format ausgedruckt werden, sonst über ein DTP-Programm wie Pagemaker, Ventura Publisher oder andere.

Einige Bemerkungen zu marktgängigen Produkten:

Der Hand-Scanner ADS Anker 40.2076 für POS-Systeme (Point Of Sales) liest alle gängigen Barcode-Symbole der verschiedenen Waren unter fast jedem Winkel. Dieses Gerät ist aber nicht für Desktop-Publishing geeignet. Gut geeignet ist jedoch der Handscanner von Mechatronic mit 400 Punkten pro Zoll, 16 Graustufen und rund 70 Millimeter Scanbreite für unter 900 Mark mit Interfacekarte.

Agfa mit dem Modell S 200 PC hat einen Flachbettscanner mit einer Auflösung von 400 Punkten pro Zoll und 64 Graustufen, Preis etwa 9000 Mark. Anschluß über serielle Schnittstelle. Schrifterkennung ist noch nicht möglich. Software existiert für Macintosh und PCs.

Computer Modular bietet den Scanner "Como Reader" als Zusatzgerät an. Die Raster-Scaneinrichtung ist in Form einer CCD-Kamera in die Farbbandkasette eingebaut. Auflösung: 300 Punkte pro Zoll mit 256 Graustufen.

Scanner und Drucker in einem System bietet Daisy Systems. Das Modell "M45 Scan" digitalisiert und druckt Dokumente jeder Art. Nach dem Scannen kann am Bildschirm noch Text hinzugefügt werden und zusammen mit dem ursprünglichen Text wieder ausgedruckt werden.

Das Modell 7 3 0 von Datacopy wird mit der Software "PCImage" betrieben, die unter Microsoft Windows läuft. Eingescannte Vorlagen (Fotos bis 16 Graustufen) können bei der maximalen Auflösung von 300 Punkten pro Zoll mit dem Programm in begrenztem Umfang weiterverarbeitet werden. Für die Speicherung sind verschiedene Datenformate, beispielsweise für Ventura Publisher und Pagemaker, anwählbar. Außerdem gibt es Hard- und Software für Telefax der Gruppe 3 nach CCITT auf dem PC. Auch OCR-fähige Software mit Lernsoftware ist laut Compace vorhanden. Der Gesamtpreis beträgt etwa 14 000 Mark.

Die Firma DEST bietet einen Walzenscanner, den PC Scan Plus mit 300 Punkten pro Zoll, für rund 7500 Mark an. Mit dem entsprechenden Programm, für Mac oder PC, kann Grafik und Text digitalisiert werden. Danach können die markierten Textstellen in ASCII-Zeichen umgewandelt und für die bekannten Textprogramme aufbereitet werden. Preiswerte OCR Lösung.

Ein Epson-Drucker, Modell EX800-/1000 oder LQ-2500, wird durch eine Abtasteinheit mit ROM-Modul zum Scanner. Der Druckerkopf muß dabei nicht abgenommen werden. Die Auflösung, 60 bis 144 Punkte pro Zoll, ist beim Einlesen einstellbar.

Hewlett-Packard bietet mit seinem Scanjet eine optimale Ergänzung zu seinem Vectra Publisher-System an. Der Flachbettscanner tastet Vorlagen, Bilder und Texte ab und gestattet diese unter der Benutzeroberfläche MS Windows zu bearbeiten. Halbtonvorlagen werden in 16 Graustufen aufgelöst. Vergrößern und Verkleinern ist ebenfalls über das Menü einstellbar.

Der Scan-CAD-Scanner von Houston Instrument mit der Software "HI-Scan" erlaubt es, Zeichnungsdateien im Rasterformat zu bearbeiten. Danach besteht auch die Möglichkeit, eine Vektordatei im Autocad-Format -DXF zu erzeugen.

Das Scanner-System von Kurzweil Computer Inc. besteht aus ICR-Software für intelligente Zeichenerkennung (zur Zeit lauffähig auf IBM-PC/ AT-kompatiblen Rechnern), einem Coprozessor-Board mit 2 MB RAM, der Scanner-Schnittstelle sowie einem modifizierten Einzugsscanner von Ricoh. "ICR" steht für Intelligent Character Recognition. Damit ist ein Verfahren aus dem Bereich der Künstlichen Intelligenz (KI) gemeint, das nahezu jede gedruckte lateinische Schrift in einer Größe von 8 bis 24 Punkten lesen kann. Zur Verbesserung der Lesequalität hilft ein vom Benutzer zu pflegendes Ausnahmelexikon. Die Grafikverarbeitung ist in einer Auflösung von 180 bis 300 Punkten pro Zoll einstellbar. Preis: unter 30 000 Mark.

Microtek Modelle 300, als Flachbett- oder Walzenscanner auf 300 Punkte pro Zoll und bis zu 32 Graustufen ausgelegt, kosten bis zu 8900 Mark. Zusätzlich wird Hard- und Software für Telefax angeboten.

Der Flachbettscanner FX-RS505 von Panasonic übersetzt bei einer Auflösung von 400 Punkten pro Zoll in 16 Grauwerte. Der Preis liegt bei 3500 Mark. Er ist mit einer Höhe von 12,4 Zentimetern einer der flachsten Scanner.

Der LS-300 Image-Scanner von Princeton scannt Vorlagen in den PC mit einer Auflösung von 300 Punkten pro Zoll. Bei Halbtonvorlagen arbeitet er mit 32 Graustufen. Eine OCR-Option zur Konvertierung von Schreibmaschinenschrift ist ebenfalls verfügbar.

Der ST400 von Siemens setzt in zweierlei Hinsicht Maßstäbe. Zum einen spricht man vom Rasterpunkt und dem ihm zugeordneten physikalischen Meßwert. Und zum anderen bringt man diesen Flachbett-Auflage-Scanner ganz klar in Verbindung mit Telefax. Die Auflösung von 400 Punkten pro Zoll gilt als zukünftige internationale FAX-Norm der Gruppe IV. Bei der Digitalisierung von Halbtonvorlagen (Fotos) bekommt man auf einer Skala von 64 Quantisierungsstufen einen entsprechenden physikalischen Meßwert für jeden Rasterpunkt. Der Grau- oder Helligkeitswert je Meßfeld, zum Beispiel eine Matrix von 8 mal 8 Punkten, bestimmt die Anzahl der Pixel und diese wiederum die Größe des Rasterpunktes. Je kleiner diese Pixel beziehungsweise Laserpunkte sind, umso besser ist das gerasterte Bild. Bei der Darstellung, Bildschirm oder Drukker, wird dann ein entsprechend großer Rasterpunkt, wie in der konventionellen Reprofotografie, aufgebaut. Das System kostet rund 9000 Mark.

Der Thunderscan von Thunderware für den Macintosh benützt den Apple-ImageWriter beziehungsweise dessen Mechanik und Steuerung. Beim Drucker wird die Farbbandkassette durch eine kleine Kassette mit integrierter Optik ausgetauscht, und schon können Vorlagen digitalisiert werden. Die neueste Version schreibt PostScript (EPSF) und einige andere Formate wie PICT (MacDraw), TIFF (Tag Image File Format) oder PNTG (MacPaint).