Bei Bell in Murray Hill:Computer sucht Tipfehler

04.04.1975

MURRAY HILL, N.J. - Für das Unix-Time-Sharing-System der Bell-Laboratorien in Murray Hill - selbständige Forschungsabteilung des US-Konzerns AT&T (American Telephone and Telegraph Company) - wurde von R. Morris und L. Cherry ein Programm zur Suche nach Schreibfehlern entwickelt.

Das System wird in beträchtlichem Umfang für die Textverarbeitung und Satzproduktion eingesetzt. Mit der existierenden Hard- und Software konnte zwar ein erheblicher Teil der Arbeiten automatisiert werden - übrig blieb aber unter anderem die mühselige Arbeit des Korrekturlesens. Einen Teil dieser Arbeit kann man jetzt dem Computer übertragen. Der Text wird zunächst maschinell gelesen; dabei unterdrückt das Programm Großschreibung, Apostrophe und Bindestriche. Mehrfach vorkommende Wörter werden aussortiert, so daß im Speicher jedes Wort nur einmal verbleibt. Diese Worte vergleicht man dann mit einer Tabelle von 2726 üblicherweise vorkommenden Begriffen aus dem technischen Englisch - bei Übereinstimmung wird die Ausgabe des Wortes unterdrückt. Diese Tabelle wurde auf die Bell Bedürfnisse zugeschnitten und enthält als "üblichen Begriff" sonst so selten vorkommende Worte wie "murray" und "abstract". Der Rest wird als Liste ausgedruckt und zwar so daß die gemäß einer Wahrscheinlichkeitsrechnung am seltensten vorkommenden Worte ganz am Anfang der Liste stehen. Die Liste wird vom Autor durchgesehen; er kennzeichnet Tipp- und/oder Rechtschreibefehler. Ein 108seitiges Dokument umfaßte beispielsweise 19 917 Worte; enthalten waren 1207 verschiedene Worte - davon gehörten 821 zu den "üblichen Begriffen", die restlichen 386 wurden ausgedruckt. Darunter waren 30 falsch geschriebene Worte wie etwa "pesudonym" statt pseudonym.

Die 30 Fehler anders zu suchen, wäre eine kaum zumutbare Aufgabe - Bell hat festgestellt, daß der Autor in einem über 20 Seiten langen Manuskript höchstens die Hälfte aller Rechtschreibfehler findet. Schwierig ist es bislang festzustellen, wo im Text denn nun eigentlich der Tippfehler steckt - und ob er nur einmal oder öfter vorkommt.

Natürlich ersetzt das Verfahren das Korrekturlesen nicht, sondern vereinfacht es nur: fehlende oder überflüssige Worte fallen dem Computer so wenig auf wie ein Unsinn der im Text steht - solange er richtig geschrieben ist.

Und richtig geschriebener Unsinn erweist sich in zunehmendem Maße als das Hauptübel für den Leser.