Per "lnformationsbereitstellungssystem" regieren?

09.07.1976

Mit Dr. Gerhard Kohnen vom Bundespresseamt in Bonn sprach CW-Chefredakteur Dr. Gerhard Maurer

- Seit zehn Jahren arbeitet man im Bundespresseamt an dem, was heute "Informationsbereitstellungssystem IBS" heißt. Wie weit ist man denn heute mit der Entwicklung von Systemen der Speicherung und zum Wiederfinden von Volltexten? Hat es mittlerweile in der linguistischen Datenverarbeitung den großen Durchbruch gegeben?

Zehn Jahre werden sicher manchen erschrecken, wir selbst bekommen deswegen aber keine roten Ohren. Als wir vor zehn Jahren anfingen, gab es in den Bereichen Hard- und Software nur geringe Unterstützungen durch die Herstellerfirmen, und wir waren gezwungen, mit einigen anderen, die an ähnlichen Informationssystemen arbeiteten, Grundlagen für das Speichern und Wiederauffinden von nicht formatierten Texten zu finden. Immerhin sind wir jedoch schon seit drei Jahren dabei, unsere Benutzer - das sind die Regierung, das Parlament und weitere Stellen, auch wissenschaftliche Einrichtungen und Redaktionen übrigens - mit Informationen zu versorgen und stellen dabei zu unserer Freude eine ständig steigende Benutzerzahl fest. Wir haben heute auf unserem Siemenssystem 4004/151 mit einer Kernspeicherkapazität von 512 KBytes und einer Plattenkapazität von 13 Laufwerken Ó 100 Mio Bytes cirka 120 000 Dokumenteinheiten gespeichert. Jede Dokumenteinheit umfaßt etwa fünf bis zehn Seiten Text. Die Originaltexte werden mikroverfilmt. Gespeichert werden inhaltliche und formelle Angaben in ca. 30 Kategorien, freie Deskriptoren und Zusammenfassungen oder Abstracts, die gleichzeitig die Mikrobildnummer enthalten und somit also die Brücke zum Original herstellen. Aus diesem Datenbestand haben wir im vergangenen Jahr 450 Anfragen beantwortet. Auf jede Anfrage werden etwa 50 Dokumente an den Anfrager dokumentarisch aufbereitet übermittelt. Ich bin sicher, daß wir im -laufenden Jahr, also 1976, auf die doppelte Anzahl an Anfragen kommen werden.

- Was für Dokumente sind denn im IBS des Bundespresseamtes gespeichert, und welche Anfragen von Regierung, Parlament und Organisationen können Sie beantworten?

Wir speichern in erster Linie Verlautbarungen der Bundesregierung, der politischen Parteien, der Verbände, Niederschriften von Pressekonferenzen, Interviews von Politikern, ausgewählte Zeitungsartikel und etwa seit anderthalb Jahren Meldungen von Nachrichtenagenturen. Diese Texte beginnen zeitlich etwa 1967/1968.

Eine typische Anfrage wäre zum Beispiel die Frage nach Äußerungen bestimmter Opositionspolitiker zum gegenwärtigen Besuch des südafrikanischen Ministerpräsidenten.

- Mit dieser Recherchen-Problemen mußten Ihre Kunden zuvor ja auch ohne EDV fertig werden. Lohnt denn der Einsatz eines primär für das IBS

genutzten 4004/151-Großrechners und die Arbeit von etwa drei Dutzend Leuten Ihrer Gruppe tatsächlich, wenn es gilt, jährlich 1000 Anfragen zu beantworten?

Um diese Frage exakt beantworten zu können, müßte man in der Lage sein, den Wert einer Information zu messen. Im übrigen bauen wir ja auch dieses System für retrospektive Recherchen in der Zukunft auf, und je mehr Material gespeichert ist, desto wertvoller wird ein solches System im Laufe der Jahre. Schließlich sollte ich noch darauf hinweisen, daß ähnliche Systeme ja auch in der privaten Wirtschaft betrieben werden. In diesem Zusammenhang möchte ich nur auf die chemische Industrie verweisen, die große elektronische Datenbanken für Texte aus ihrem Fachbereich betreibt und ständig weiter ausbaut.

- Von wenigen Projekten abgesehen, etwa dem New-York-Times-Index oder der Steuerrechts-Datenbank der DATEV, wird vorwiegend nicht vollautomatisch per Software-Programm indexiert, sondern halbautomatisch, zwar computerunterstützt, aber letztendlich durch intellektuelle Leistung der Sachbearbeiter. Wie sieht das IBS aus?

Wir machen beides. Materialien mit differenzierten Inhalten werden von unseren Indexierern intellektuell am Bildschirm im Dialog mit dem Rechner aufbereitet, dann über das System GOLEM in unser Informationsbereitstellungssystem eingespielt. Daneben werden bei uns aber etwa seit anderthalb Jahren am Tage etwa 70 bis 100 Meldungen von Nachrichtenagenturen mit Hilfe des Systems PASSAT automatisch indexiert und gelangen so über das System GOLEM wiederum in das IBS.

- Arbeiten Sie noch halbautomatisch, weil die vollautomatische Ermittlung der relevanten Sachverhalte von Texten noch keine zufriedenstellenden Ergebnisse zeigt?

Bei der Agenturmeldungen verwenden wir eine eingespeicherte Vergleichswortliste mit cirka 35 000 Wörtern, die dazu dient, die relevanten Stichworte in den einzuspeichernden Agenturmeldungen durch Wortvergleiche zu erkennen. Diese Methode kann eigentlich nur bedingt als automatische Indexierung bezeichnet werden, weil hier lediglich eingespeicherte Zeichenketten (Worte) mit den in das System hineinlaufenden Zeichenketten (Agenturmeldungen) auf ihre Deckungsgleichheit überprüft werden. Das System liefert allerdings nach der sogenannten automatischen Indexierung dem Sachbearbeiter die Worte, die es in der Vergleichswortliste nicht gefunden hat. Dieser entscheidet dann, ob sie in diese Liste aufgenommen werden sollen.

- Welche Schwierigkeiten verhindern, daß der andere Datenbestand der offiziellen und offiziösen Texte nach Vorlage der Abstracts ebenso - quasi vollautomatisch - bearbeiten wird?

Für die automatische Indexierung verwenden wir zur Zeit nur Texte von Agenturmeldungen, weil diese knapp und klar abgefaßt sind und einen genau umrissenen Sachverhalt schreiben. Die Schwierigkeit bei Speicherung von Texten beste hauptsächlich darin, daß unsere Sprache lebendig ist und ständig neue Wortschöpfungen hervorbringt und sich der Inhalt bestimmter Worte wandelt.

- Dafür können Sie sicherlich Beispiele geben?

Nehmen Sie zum Beispiel das "Signal". Das kommt eigentlich aus dem Eisenbahnbereich oder aus der Physik, hat jedoch seit einigen Jahren Eingang in die politische Sprache gefunden im Sinne von "Signalwirkung", zum Beispiel das "Signal von Tiflis". Oder nehmen Sie das Wort "Droge". Früher war Droge der Gesamtbegriff für all das, was ich in einer Apotheke oder Drogerie kaufte, heute hat es einen sehr viel kleineren Wortinhalt, nämlich nur noch "Rauschgift". Diese Probleme jedoch kann man nicht mit der Maschine, sondern nur intellektuell lösen. So haben wir zum Beispiel bei derzeit etwa 120 000 gespeicherten Dokumenteinheiten einen Thesaurus von (...) 110000 verschiedenen Deskripturen. Wenn nun neue Begriffe auftauchen wie zum Beispiel "Technologietransfer" oder "Nord-Süd-Gefälle", werden diese von unseren Thesaurus-Sachbearbeitern geprüft und gegebenenfalls dem Thesaurus als neue Deskriptoren beigefügt.

- Das hat ja gewisse politische Brisanz. Haben Sie Franz Josef Strauß' Parole vom "Saustall" als Deskriptor auf Platte gespeichert?

Jedes Informations- und Dokumentationssystem lebt davon, daß es den Bereich, den es dokumentieren will, vollständig dokumentiert. Das bedeutet, daß für ein echt brauchbares System nicht Dokumente oder Deskriptoren unterdrückt werden dürfen.

Ministerialrat Dr.

Dr. Gerhard Kohnen (43) ist Ministerialrat im Bundespresse- und Informationsamt. Kohnen studierte Jura und Volkswirtschaftslehre und arbeitete danach in der Allgemeinen und Inneren Verwaltung des Landes 'Nordrhein-Westfalen, Düsseldorf'. 1966 wechselte er ins Bundespresseamt und kam über die Organisationsabteilung zur Datenverarbeitung. Unter Kohnens Leitung wurde im Bundespresseamt das Informationsbereitstellungssystem IBS und das Nachrichten-Verteilungssystem MSS (Message Switching System) auf Basis von zwei Honeywell Bull 316-Prozeßrechnern realisiert.

Informations-Bereitstellungs-System (IBS)

Nach mehrjährigen Vorbereitungen hat das BPA das IBS vor gut drei Jahren zur Benutzung durch Regierung, Parlament und Öffentlichkeit freigegeben. Gespeichert wird in erster Linie offizielles und offiziöses Material zur Politik der Bundesregierung. Hinzu kommen noch Mitteilungen von Parteien und Verbänden sowie ausgewählte Agenturmeldungen und Zeitungsartikel.

Zum Betrieb des IBS benutzt das BPA z. Z. einen Rechner des Typs Siemens 4004/151 mit Kernspeicherkapazität von 512 kB und dem Betriebssystem BS 2000. Zur Peripherie dieses Rechners gehören u. a. dreizehn Magnetplattengeräte mit einer Kapazität von je 100 Mio Bytes und z. Z. etwa dreißig Bildschirme.