Minicomputer-Einsatz in der Sprachforschung:

Griechisch-Datenbank mit 90 Millionen Worten

25.06.1976

IRVINE/KALIFORNIEN - Die elektronische Datenverarbeitung ermöglicht eines der bisher größten Forschungsprojekte auf dem Gebiet der antiken Sprachen, für das ohne elektronisches Instrumentarium ungefähr 1000 Mannjahre erforderlich wären: An der University of California, Irvine/USA, arbeitet ein Team von Wissenschaftlern unter der Leitung von Dr. Theodore F. Brunner am Aufbau einer Datenbank für den gesamten bekannten Wortschatz der alt-griechischen Sprache mit umfangreichen Textbeispielen für jede mögliche Wortkombination sowie ausführlichen semantischen Erläuterungen.

90 Millionen Wörter

Dazu stehen der Forschergruppe ein Varian 620-L-Minicomputer mit angeschlossenem Statos 3111 Electrostatic Printer/Plotter sowie eine Sigma 7 zur Verfügung. Der Name des Millionenprojektes: Thesaurus Linguae Graecae: (TLG).

Die Arbeiten der US-Wissenschaftler um Dr. T. F. Brunner umfassen mehrere Phasen: Zunächst wird das Material für die Datenbank von einer "TLG-Beratungsstelle" zusammengestellt, die dabei auf weltweite Unterstützung von Forschern und Bibliotheken angewiesen ist. Berücksichtigt werden nur Texte aus der Zeit von 850 vor bis 600 nach Christus. Aus diesem Zeitraum sind heute ungefähr 90 Millionen Wörter der griechischen Sprache bekannt.

Ist eine bestimmte Menge an Textmaterial vorhanden, wird sie unter Verwendung eines speziellen Codes abgelocht. Zur Fehlerreduzierung werden von jedem Text zwei Kartensätze erstellt, die anschließend auf Magnetbänder übertragen werden. In einem Rechner-Prüflauf werden dann die Bänder miteinander verglichen. Treten Abweichungen auf, wird der Programmlauf unterbringen und die betreffende Stelle korrigiert. Die so nicht eliminierten Fehler sind verschwindend gering: "Nur ein falsches Zeichen unter 25 000", erklärt Projektleiter Dr. T. F. Brunner.

Eines der geprüften Bänder wird im Anschluß daran im Universitäts-Rechenzentrum in Irvine weiterverarbeitet: Der Sigma-7-Rechner checkt die gespeicherten und codierten Texte nach orthographischen Regeln durch und überträgt fehlerhafte Stellen auf Bildschirmgeräte in den TLG-Büros. Das Korrekturprogramm läuft erst nach erfolgter Verbesserung weiter.

Zusätzliche Informationen über jedes gespeicherte Wort kommen von Sprachforschern aus aller Welt. Erst dann werden die Texte in die Datenbank aufgenommen.

Die Ausgabe der griechischen Texte übernimmt der Varian-Mini. Seine Aufgabe besteht dabei vor allem darin, die codierten Informationen zu konvertieren und dem angeschlossenen Statos Printer/Plotter graphische Daten zur Erzeugung der griechischen Symbole zu liefern. Eine Textausgabe in Englisch und Russisch ist ebenfalls möglich.

Es ist beabsichtigt, die Ergebnisse des Projektes "Thesaurus Linguae Graecae" in Form eines mehrbändigen Nachschlagewerkes zu veröffentlichen.