Künstliche Intelligenz: ein weites Feld mit verschwimmenden Grenzen, Teil 9

Syntaktisches und semantisches Wissen

04.11.1988

Im Gegensatz zu relationalen arbeiten temporale Datenbanken mit Zuständen, beziehungsweise Intervallen. Damit lassen sich Probleme, die aus der Flexibilität unserer Sprache resultieren, leichter lösen. Dennoch fällt es dem Computer schwer, zeitliche Abläufe zu "verstehen", und vage Begriffe wie "bald" erfordern eine genaue Analyse des Kontextes.

Bei der Beschriftung mit der Künstlichen Intelligenz befaßt man sich zwar intensiv mit der Repräsentation und der Verarbeitung von Wissen doch nur wenige Forscher fanden bisher anscheinend die Zeit, sich dabei auch mit der "Zeit" zu befassen. Was um so seltsamer ist, als man zwar vielleicht in einer Werkstoff-Datenbank auf die zeitliche Komponente kaum weiter achten muß, während doch beispielsweise die Wissensbasis über den Standort und die Bewegungen einer Flotte von Schiffen geradezu extrem zeitabhängig ist.

Daß man auf die Einbeziehung der Komponente Zeit nicht auf Dauer verzichten kann, das hat Drew McDermott, einer der bekannten KI-Wissenschaftler des MIT in Cambridge, schon 1982 ins Bewußtsein seiner Fachkollegen zu heben versucht.

Denn wie sollen KI-Programme zur medizinischen Diagnose denn sonst etwas über den Verlauf einer Krankheit aussagen beziehungsweise "verstehen"? Und wie sollen Programme, die "Geschichten verstehen" können, begreifen, daß die Prinzessin "erst" den Frosch küssen mußte, ehe er "dann" als Prinz vor ihr stehen konnte . .

Auf zeitliche Information verzichtet wird in aller Regel und seit jeher bei den bekannten, relationalen Datenbanken, erläutert Professor Christian Rohrer von der Stuttgarter Uni. Denn bei ihnen, so erinnert der Inhaber des Lehrstuhls für Computerlinguistik, geht man ja im allgemeinen davon aus, "daß sie immer auf dem neuesten Stand sind'. Es wird eben einfach immer eine alte Information - etwa die über den Bestand an Motorblöcken in einem Lager - gelöscht und die aktuelle an ihre Stelle gesetzt.

Diese Art von herkömmlichen Datenbanken hat nun allerdings Nachteile: Den, daß man nicht erkennen kann, ob eine Veränderung der Daten eigentlich entsprechenden Vorgängen in der realen Welt folgt, die in der Datenbank abgebildet wird? Oder mußte nur einfach ein Datenfehler korrigiert werden? Und zweitens gehen hier eben die Informationen über frühere Zustände einfach verloren, selbst, wenn sie vielleicht in Zukunft mal wieder interessieren könnten.

Zustände machen die Zeit sichtbar

Im Gegensatz zu relationalen Datenbanken mit ihrer, aus der Prädikatenlogik stammenden Notation arbeiten temporale Datenbanken mit Zuständen beziehungsweise Intervallen, sagt Rohrer. Diese Zustände gelten jeweils, bis ein Ereignis sie beendet (siehe Bild 1), und ein neuer Zustand anhebt.

Temporale Datenbanken lassen sich einfacher aktualisieren als relationale, denn hier kommen zu den alten Ereignissen, die weiterhin gespeichert bleiben, nur Einträge über neue Ereignisse hinzu. "Allerdings", so betont der Stuttgarter Computerlinguist, muß hierbei die Frage geklärt werden, welche alten Zustände durch ein Ereignis "e" beendet werden. Und welche neuen werden durch "e" eingeführt?"

Betrachtet man etwa das Beispiel eines simplen Hausverkaufs,

verkauft (Müller, Schmid,

Einfamilienhaus 1) = e

Nach (e, besitzt (Schmid,

Einfamilienhaus 1))

Nach (e, besitzt (Müller, Geld))

Nach (e, eingetragen

(Schmid, Grundbuch))

so stellen sich zahlreiche Fragen. Denn es ist zu klären, welche der Zustände, die in diesem Exempel mit dem Ereignis "e" verknüpft sind, denn eigentlich "zur Bedeutung der Verbalgruppe ,ein Haus verkaufen' gehören?" Gilt dies beispielsweise überhaupt für den - durchaus üblichen - Eintrag einer Grundschuld?

Weitere Fragen betreffen unter anderem die Zeitspannen, während der die neuen Zustände für gewöhnlich vorherrschen, und die beim Hauskauf meist größer sein dürften, als etwa nach dem Erwerb eines Autos.

Man wird sie bei einer temporalen Datenbank meist dadurch beantworten, meint Rohrer, daß man mit den einzelnen Zuständen durchschnittliche Laufzeiten assoziiert, denn so erhält man dann auf Fragen wie etwa "Wem gehört Objekt x?" mit größter Wahrscheinlichkeit eine zutreffende Antwort. Und außerdem wird man so eine Datenbank sinnvollerweise auch gleich noch mit Angaben darüber versehen, welche Ereignisse einen bestimmten Zustand für gewöhnlich beenden.

Gehört TA noch zu Olivetti

Will im Beispiel von Bild 1 also jemand wissen, ob Olivetti eigentlich noch TA besitzt, so muß die vorliegende Wissensbasis eben nach Ereignissen "e" durchsucht werden, die diesen Zustand hätten ändern können, also nach einem weiteren Verkauf, nach einer Pleite und so weiter.

Finden wir kein Ereignis dieser Art, so kann man vermuten, daß der alte Besitz-Zustand immer noch besteht. Dabei wird hier eine ähnliche Art von "default-reasoning" angewandt, wie sie auch in nontemporal strukturierten Wissensbanken benutzt wird. Allerdings: Will man völlig sicher sein, daß die aktuelle Auskunft über das Besitzverhältnis Olivetti-TA noch stimmt, so hätte man der Datenbank eine vollständige Liste aller Ereignisse "e" bekanntgeben müssen, die den alten Zustand beenden können. Doch so eine Liste läßt sich praktisch nur in ganz speziellen Bereichen aufstellen; dort, wo man sich ihrer Vollständigkeit dann auch wirklich sicher sein kann.

Frame-Problem des Roboters

Die Frage, welche Zustände beendet, ein bestimmtes Ereignis und welche läßt es unberührt, wird von der Gilde der KI-Forscher als "Frame-Problem" bezeichnet, wobei es mit der sogenannten "Frame-Repräsentation" nicht verwechselt werden darf. Bild 2 verdeutlicht, worum es dabei geht.

Hier hat ein Roboter R die Aufgabe, Klötzchen einzeln so zu transportieren, daß sie schließlich im Sinne des "Zielzustands" übereinander liegen. Dabei sieht man, daß der Ausgangszustand bequem auch als Zustand in einer temporalen Datenbank aufgefaßt werden kann, und daß jede Handlung des Roboters in ihr einen neuen Zustand erzeugt.

Bild 3 zeigt, wie ein bestimmtes Ereignis einen neuen Zustand einführt und einen alten beendet. Doch nicht nur allein diese konkrete Aufgabe interessiert den KI-Wissenschaftler, sondern vielmehr will er wissen, wie er durch generelle Regeln ausdrücken kann, welche Zustände ein Ereignis "e" berührt und welche nicht? Bild 3 illustriert dies für den obigen konkreten Fall, denn Ereignis "1" tangiert ja nur die Zustände "auf (A, B)", "frei (q)" und "frei (c)".

Lehrreich am Exempel der kleinen Klötzchen ist, daß hier "ein wichtiger Zusammenhang zwischen temporalen Datenbasen und der Planung von Handlungen für Roboter" aufscheint. Denn die gleiche Folge von Zuständen, die hier zum gewünschten Ziel führt, ist ja "sowohl eine temporale Datenbank, als auch ein Plan für einen Roboter".

In der Linguistik, so bemerkt Rohrer, hat man den skizzierten Zusammenhang zwischen Ereignissen die durch Verben ausgedruckt werden - und Zuständen schon oft untersucht. Doch erst jetzt wird versucht, dieses linguistische Wissen auch für die Arbeit an temporalen Datenbanken zu nutzen. Das geschieht im Rahmen des IBM-Projekts Lilog, das zudem demonstrieren will, wie man das Erarbeiten von Plänen unterstützen kann, indem man Ergebnisse und Verfahren aus der Zeitlogik zur Unterstützung heranzieht.

Mit der Zeit versteht man mehr von der Zeit

Zu den zentralen Forschungszielen des Lilog-Projekts gehört, daß Computer aus natürlichsprachlichen Texten selbsttätig Wissen erwerben sollen. Und zwar auch temporales Wissen, wie man es etwa automatisch gewinnt, liest man etwa ein Buch über den Freiheitskampf der Schwarzen in Südafrika . . .

Oft ist es für einen Leser nicht einfach, die Ereignisse und Zustände, die ein Text beschreibt, zeitlich richtig einzuordnen. Er muß dazu auf Zeitformen, auf Zeitverbien und auf die Bedeutung von Verben achten und daraus jeweils andere Schlüsse ziehen, wie das folgende Beispiel zeigt:

Hans folgte dem Fußweg und kletterte dann auf die Böschung und auf die Straße.

a) Er dachte an seine Freundin, die nicht gerne wanderte.

b) Er überquerte die Straße und kam in einen prachtvollen Mischwald.

Hier überlappt der Zustand, den der Satz "a" bezeichnet, zeitlich mit den Ereignissen des Vordersatzes, während Satz "b" zwei neue, auf die des Vordersatzes folgende Ereignisse einführt. Doch "obwohl wir in beiden Fällen die gleiche Zeitform haben, erlaubt uns die Bedeutung des Verbs, die Ereignisse und Zustände korrekt auf der Zeitachse anzuordnen".

Ereignisse ändern Zustände - aber was ist ein "Ereignis"? Haben Ereignisse nicht in den meisten Fällen auch noch eine interne Struktur, die man genau beachten muß? Wie im folgenden Beispiel:

Sepp wanderte auf die Moosalm.

a) Dort kaufte er Bier und Käse.

b) Unterwegs kaufte er Bier und Käse.

Hier sieht man, daß die Sätze a und b sich nur in den Worten "dort" beziehungsweise unterwegs unterscheiden - aber mit was für Folgen! Denn in jenem Zustand beziehungsweise Intervall, das die Wanderung beschreibt, kann man ja eine Menge von Teil-Ereignissen unterbringen, wie speziell Satz "b" zeigt. Dort nämlich wird das Ereignis "Wanderung auf die Moosalm" aufgebrochen und um Teil-Ereignisse bereichert.

Erst den Nippel durch die Lasche ziehen?

Lilog, so Rohrer, verarbeitet sowohl zeitliches wie räumliches Wissen, weshalb man in diesem Beispiel hier "aufgrund der Bedeutung der Ortsadverbien auf die zeitliche Abfolge schließen" kann. Fehlten diese Ortsadverbien hingegen, so "könnten die Sätze "a" und "b" in bezug auf den ersten Satz vor-, gleich- oder auch nachzeitig sein".

Aus Gebrauchsanleitungen und technischen Abhandlungen kennt man das Phänomen, daß oft eigentlich nur derjenige erkennen kann, in welcher Reihenfolge Dinge geschehen oder getan werden müssen, der sich mit der Materie bestens auskennt. Während jeder andere stundenlang darüber rätseln darf, ob man etwa erst noch den Nippel durch die Lasche . . .

Problematisch für Implementierungen sprachverstehender KI-Systeme ist unter anderem auch jene Flexibilität unserer Sprache, die einmal aus der Aussage,

Klaus hat von eins bis sechs gearbeitet,

klar entnehmen läßt, daß auch die Aussage

Klaus hat um drei Uhr gearbeitet

richtig ist, läßt man das Thema Brotzeit hier mal bewußt beiseite.

Zum anderen aber ist aus der Aussage

Sepp ist in sechs Stunden auf den Watzmann gegangen

nie der Schluß erlaubt, Sepp sei deshalb also auch in einer Stunde in jene frischen Höhen vorgedrungen. Was letztlich zeigt, so Rohrer: "Es gibt Aktivitäten und Zustände, die homogen sind." Und von denen man weiß: Gilt ein Zustand "z " in einem Intervall "i ", so gilt er auch in jedem Teil-Intervall von "i".

In diesem Sinne ist der Zustand des - brotzeitfreien! - Arbeitens ein "homogener", während dies für die Aussage über den Bergsteiger Sepp nicht gilt. Sie muß ausdrücklich in

eine andere Klasse von Ereignissen beziehungsweise Zuständen eingeteilt werden, soll ein Rechner korrekte Schlußfolgerungen ziehen können.

Aussagen über Zustände sind oft eher vage als präzise, denn ein hoher Berg ist für einen Hamburger oft ganz etwas anderes, als für einen Österreicher. Diese Art von unscharfen Aussagen findet man auch im zeitlichen Bereich, wie die folgenden Beispiele Rohrers illustrieren:

a) Der Vortrag ist bald zu Ende.

b) Herr Maier geht bald in den Ruhestand.

c) Wir bekommen bald eine neue Eiszeit.

Das immer gleiche Wörtchen "bald" sagt im ersten Falle aus, daß wohl von zwei bis drei Minuten die Rede sein dürfte, im zweiten Falle, daß es sich noch uni Monate oder gar Jahre handeln mag, wie Maiers Untergebene befürchten, und im dritten, daß wir wohl noch 10000 bis 20000 Jahre Geduld aufbringen müssen, ehe wir auf Kühlschränke werden verzichten können . . .

Es hängt also auch bei dieser Art von temporalen Aussagen der natürlichen Sprache strikt vom Kontext ab, was mit ein- und demselben Wort im Einzelfall gemeint sein mag. Und dies wiederum zwingt bei der Implementierung natürlichsprachlicher Systeme mit der Fähigkeit, einen Text zu verstehen, zu entsprechend aufwendigen Maßnahmen.

Bei der Betrachtung der Repräsentation zeitlicher Zusammenhänge in natürlichsprachlichen Systemen darf auch nicht vergessen werden, in Prozesse des temporalen Schließens auch die Verneinung mit einzubeziehen. Denn der Rechner muß ja beispielsweise ebenso gut wie ein Mensch begreifen können, daß der Satz

Gestern hat es nicht geregnet

genau dann wahr ist, wenn es in keinem einzigen Teil-Intervall des Intervalls "gestern" geregnet hat. Wobei hier nun wieder bewußt außer acht gelassen wird, ab wieviel Tropfen Wasser pro Zeit- und Flächeneinheit man überhaupt von "Regen" sprechen soll, oder aber von bloß ein paar Spritzer . . .

Negierte Sätze schaffen Probleme

Wichtig für die Behandlung der Negation ist die Feststellung, daß "negierte Sätze sich offensichtlich anders als Sätze ohne Negation" verhalten, wie Rohrer betont. Denn ganz im Gegensatz zum letzten unserer Aussagebeispiele ist der Satz

Gestern hat es geregnet

ja schon dann wahr, wenn es gestern nur für ein paar Minuten "geregnet" hat.

Man muß bei der Entwicklung sprachverstehender und sprachgenerierender Systeme also sicherstellen, daß beispielsweise ein System, das den vorletzten Beispielsatz gespeichert hat, die Frage, "Hat es gestern geregnet?", zuverlässig mit "Nein" beantwortet, während es ganz anders reagieren muß, hat es den zweiten, nicht negierten Satz in seinem Wissensschatz. Denn dann sollte es eigentlich "klug" genug sein, auf die leicht verklausulierte Frage

Hat gestern die Sonne geschienen?

korrekt mit "vermutlich nicht" oder aber mit "Ich weiß nicht" zu antworten.

Rohrer und seine Mitarbeiter befassen sich im Forschungsprojekt Lilog mit der automatischen Extrahierung von zeitlichen Informationen aus Texten sowie ferner mit der Übersetzung dieses Wissens in eine formelle Darstellungsform, auf der dann wiederum Inferenzregeln operieren, also Schlüsse ziehen können. Dabei, so sei am Rande noch kurz angemerkt, arbeiten die Forscher mit einem laut Rohrer "unifikationsbasierendem Formalismus" namens STUF, der wichtige Vorteile verspricht. Denn mit seiner Hilfe soll man "syntaktisches und semantisches Wissen einheitlich deklarativ darstellen" können, was wiederum die Implementierung der gewünschten Systeme erleichtern soll . . .