Künstliche Intelligenz: ein weites Feld mit verschwimmenden Grenzen, Teil 5

Wie weiß der Rechner, was er weiß?

30.09.1988

Vom Rechen-Knecht zur intelligenten Maschine

Künstliche Intelligenz, Expertensysteme, Lernende Maschinen, Neuronale Netze, Konnektionismus - das sind nur einige der Stichworte, unter denen eines der interessantesten Gebiete der aktuellen Computer-Technik behandelt wird: jenes nämlich, das die Weiterentwicklung der früheren Rechen-Knechte zu - scheinbar - intelligenten Maschinen behandelt.

Mit dem aktuellen Stand und den weiteren Tendenzen befaßt sich die COMPUTERWOCHE im Zuge einer losen Folge, von Beiträgen (Bisher erschienen Beiträge in CW 29, 32, 34 und 37.) Sie sollen eine plastische Vorstellung von einigen der Probleme geben, mit denen der wachsende Kreis der KI-Experten täglich zu kämpfen hat.

Wer immer sich mit Künstlicher Intelligenz und mit Rechnersystemen, die auf Wissen basieren, näher befaßt - den beschäftigt gewiß bald eine der zentralen Fragen der KI: Wie eigentlich wird Wissen im Rechner dargestellt? Wie also weiß der Rechner das alles, was er wissen muß?

Die Gilde der KI-Fachleute behandelt diesen ganzen Fragenkomplex unter dem Stichwort "Wissensrepräsentation", erläutert der IBM-KI-Fachmann Rudi Studer. Und zwar wird dabei vor allem nach Wegen gesucht, sogenanntes "Weltwissen" abzubilden; wobei damit hier einschränkend "nur" Wissen über einen ganz bestimmten. Gegenstandsbereich gemeint ist: nicht mehr und nicht weniger an Wissen also, als man benötigt will man "ein mehr oder weniger genaues Modell des vorliegenden Gegenstandsbereichs" schaffen (Abb. 3).

Die KI kennt heute eine ganze Reihe von Sprachen zur Darstellung eines solchen Modells der echten Welt beziehungsweise eines Ausschnitts von ihr; und man muß auch sehen, daß man beim Beschreiben eines bestimmten Gegenstandsbereichs zwischen verschiedenen Arten von Wissen zu unterscheiden hat: So benötigen sprachverarbeitende Rechnersysteme beispielsweise erstens linguistisches und zweitens arbeitsgebietsspezifisches Weltwissen. Denn wie sonst sollten sie denn "verstehen", was ein Text wohl bedeuten mag. Und es stellt sich, etwa im Rahmen des IBM-Forschungsprojekts Lilog, mithin jeweils aufs Neue die Frage: Mit welchen Formalismen beschreibe ich am besten all' jene verschiedenen Arten von Wissen, mit denen ein gegebenes beziehungsweise projektiertes natürlichsprachliches System es nun mal zu tun hat?

Bei der modernen KI unterscheiden die Wissenschaftler heute zwischen Aussagen über "Zustände" wie etwa "Sokrates ist ein Mensch" und über "regelhafte Zusammenhänge" wie etwa "Alle Menschen sind sterblich". Dabei verblüfft ein wenig, daß im ersten Fall von Fakten und im zweiten von Regeln gesprochen wird - so, als wäre die Sterblichkeit aller Menschen nicht eben auch ein Faktum. Und noch ein wenig verwirrender wird dieses Bild dann schließlich, wenn Studer betont: "Etwas kann ein Faktum, aber dennoch unsicher sein" und dann noch weiter sagt: "Regeln lassen sich benutzen, um neue Fakten abzuleiten." . . .

Eine weitere Unterscheidung trennt zwischen explizitem und implizitem Wissen. So weiß ein System aufgrund der obigen Aussagen explizit, daß - erstens - Sokrates ein Mensch ist und daß - zweitens - alle Menschen sterblich sind. Durch Anwenden von Regeln (nach obiger Definition) auf Fakten kann es nun außerdem das - implizit bereits vorhandene - weitere Wissen explizit machen, daß auch Sokrates, da ein Mensch, sterblich ist. Und mithin ist implizites Wissen jenes, das aus der Wissensbasis eines Systems hergeleitet werden kann.

Das Wissen, das in einer Wissensbasis einen bestimmten Gegenstandsbereich beschreibt, ist im allgemeinen unvollständig; große und bedeutungsvolle Teile fehlen oft. Deshalb muß man hier nun zwischen Systemen mit zwei verschiedenen Arten von, sagen wir mal, "Vorurteilen" unterscheiden; nämlich zwischen jenen, die eine "offene" und jenen, die eine "geschlossene" Welt annehmen.

Steht in der Wissensbasis beispielsweise nur "Rom ist eine Stadt" und "München ist eine Stadt", so antwortet ein System der ersten Art auf die Frage, ob London eine Stadt sei, mit "Es ist nicht bekannt, ob ... ". Während ein KI-System der zweiten Gruppe - oder auch eine typische Datenbank - schlankweg behauptet: "London ist keine Stadt."

Man sieht also, daß Systeme mit eingebauter Vermutung einer geschlossenen Welt all' das, was ihnen nicht - explizit oder implizit - als "wahr" bekannt ist, als "falsch" bezeichnen. Hier gilt aber, daß - bei vergröberter Betrachtung - KI-Systeme diese Unart meist nicht zeigen, Datenbanksysteme aber, wie gesagt, sehr wohl.

Nix Genaues weiß man eben nicht ...

Wissen liegt oft nur in bayrisch-ungenauer, statt in preußisch-exakter Form vor; denn beispielsweise wissen die Münchner ja nur, ihre Stadt habe "viele Biergärten". Man muß deshalb, betont Studer, scharf zwischen vagem und exaktem Wissen unterscheiden und darf nie vergessen, daß im Biergarten-Beispiel letztlich eben offen bleibt, ob es 50 sind oder vielleicht gar schon 500 ... ?

Eine ähnliche Unterscheidung ist ferner zwischen sicherem und unsicherem Wissen zu treffen, wie die ebenso klare wie unsichere Aussage verdeutlichen soll: "Karl kommt wahrscheinlich übermorgen." Und dann gibt es da auch noch das sogenannte "Default"-Wissen, für das die Regel gilt: Es trifft zwar in den meisten Fällen zu, aber nicht in allen. So gehört der Satz "Alle Vögel können fliegen" eindeutig zum Default-Wissen; man denke doch nur mal kurz an Pinguine ...

Besonderes Interesse kommt in dieser Auflistung der verschiedenen Arten von Wissensbasis-Wissen zweifellos dem sogenannten Meta-Wissen zu, das laut Studer "Eigenschaften des in der Wissensbasis abgelegten Wissens beschreibt"; und das damit gleich auch "weitere Möglichkeiten zur Ableitung expliziten Wissens" aus implizitem bereitstellt.

Ein schönes Beispiel des Referenten für Meta-Wissen ist der knappe Satz, "Die Vorgesetzten-Beziehung (in der Wissensbasis) ist transitiv." Denn aus ihm und aus - beispielsweise - den beiden Sätzen "Huber ist Müllers Vorgesetzter" und "Müller ist Maiers Vorgesetzter" kann der Rechner nun sofort ersehen: Huber ist auch Maiers Vorgesetzter.

Deklarative und prozedurale Ansätze

Betrachtet man die gängigen Ansätze zur rechnerinternen Repräsentation von Wissen, so lassen sich zwei grundlegende Klassen unterscheiden. Dabei beschreiben die sogenannten "deklarativen" Ansätze laut Studer "Sachverhalte unabhängig von den Methoden zur Anwendung dieses Wissens", während prozedurale Ansätze "zusätzliche Informationen zur Anwendung und Verknüpfung von Wissen enthalten". Hier fehlt also jene strenge Trennung zwischen Daten und ihrer Verarbeitung, die den deklarativen Ansatz in all' seinen Ausführungsweisen so schön kennzeichnet.

Zur Klasse der deklarativen Ansätze gehören die Prädikatenlogik, die semantischen Netze und die sogenannte Frame-Repräsentation, während Studer als Beispiel für den prozeduralen Ansatz nur die sogenannten Produktionssysteme erwähnte.

Immer noch als sozusagen klassisches Beispiel für die deklarative Repräsentation von Wissen gilt in Kreisen der Wissenschaft der erste der vier erwähnten Formalismen, die Prädikatenlogik. Will man mit ihrer Hilfe etwa das Faktum darstellen, München ist eine Stadt, so können wir schreiben: "Stadt (München)". Dabei ist "Stadt" das Prädikat und "München" das Argument.

Die Prädikatenlogik stellt Wissen also in einer Form dar, bei der Prädikate jeweils zusammen mit Argumenten verwendet werden. Sie bietet den großen Vorteil, daß in ihr, so Studer, "wohldefinierte Regeln zur Ableitung von explizitem Wissen existieren", hat aber andererseits den Nachteil, daß es oft schwer ist, eine gute Auswahl an Prädikaten zu

treffen.

Für die obige Aussage wäre es beispielsweise auch möglich, so Studer, das "zweistellige Prädikat" der Form "Ist-Exemplar-von" zu verwenden und mithin zu schreiben: "Ist-Exemplar-von (München, Stadt)". Wobei nun beide in der KI er stehenden Wörter als Argument auftreten. Die zweite Form der deklarativen Repräsentation bedient sich der recht beliebten semantischen Netze, in denen Knoten Objekte darstellen und verbindende Linien zwischen den Knoten jene Beziehungen ausdrücken, die zwischen den Knoten beziehungsweise Objekten bestehen. Abbildung 1 zeigt, wie so ein semantisches Netz die Tatsache ausdrückt, daß sowohl Sokrates als auch Plato Menschen sind.

Semantische Netze bieten die Möglichkeit, relevantes Wissen über ein bestimmtes Objekt - wie beispielsweise Plato - dadurch aufzufinden, daß das System einfach jenen Kanten nachgeht, die vom entsprechenden Knoten wegführen. Allerdings muß auch hier wieder sorgsam ausgewählt werden, welche Knoten und Kanten man nun eigentlich benützen will, denn dies sind ja nun mal "die elementaren Bausteine für die Darstellung eines Gegenstandsbereichs".

Erspart die mehrfache, umständliche Darstellung

Will man in einem semantischen Netz Beziehungen zwischen Objekten darstellen, so muß man nur entsprechende, weitere Kanten einbauen. Diese stellen vielfach Beziehungen der Gestalt "Ist-Exemplar-von" oder "Hat-Teil" oder "is-a" dar, wobei die häufig vorkommende "is-a"-Beziehung beispielsweise besagt, eine Klasse von Objekten sei allgemeiner als eine andere.

Abbildung 2 zeigt ein semantisches Netz, das nicht nur zeigt, daß sowohl Professoren als auch Studenten Menschen sind, sondern drückt durch die Eigenschaft der sogenannten "Vererbung", die jeder "is-a"-Beziehung innewohnt, auch noch aus: Da jeder Mensch ein Alter und einen Wohnort hat, haben eben auch Studenten und Professoren sowohl Wohnort als auch ein Alter. Und damit erspart es die umständliche, mehrfache Darstellung gleichen Wissens.

Slots repräsentieren bestimmte Eigenschaften

Der dritte hier interessierende Ansatz zur Repräsentation von Wissen auf deklarativem Wege ist als "Frame"-Repräsentation bekannt. Er stellt die objektorientierte Strukturierung von Wissen in den Vordergrund, indem es hier zu begrifflichen Einheiten beziehungsweise Objekten zusammengefaßt wird.

Systeme nach diesem Ansatz bündeln die Menge jener Eigenschaften, die auf ein bestimmtes Objekt zutreffen, zu einem sogenannten Frame, der beispielsweise so aussieht:

FRAME Stadt

SLOTS:

hat-Alter: Alter

hat-Einwohnerzahl: Zahl

Die hier auftauchenden "Slots" dienen dazu, jeweils eine bestimmte Eigenschaft des Objekts zu repräsentieren. Dazu erhält der Slot erstens einen Namen wie etwa "hat-Alter" und zweitens eine Wertangabe wie etwa "Alter".

Bei Frame-Systemen, so Studer, unterscheidet man im allgemeinen zwischen einerseits der Beschreibung einer ganzen Objektklasse und andererseits der Beschreibung der individuellen Objekte, die nach obigem Muster erfolgt.

Zu den prozeduralen Formalismen, mit denen man Wissen in einem Computersystem darstellen kann, gehören die sogenannten Produktionssysteme; sie sind vielfach von Expertensystemen her bekannt. Hier wiederum findet sich in der grundlegenden Wissensbasis die schon oben skizzierte Trennung zwischen sogenannten Fakten und sogenannten Regeln, wobei letztere nun als "Produktionsregel" bezeichnet werden.

Eine Produktionsregel besteht erstens aus einem Bedingungs- und zweitens aus einem Aktionsteil, wobei der erstere die Form

WENN Bedingung

und letzterer die Gestalt

DANN Aktion

aufweist.

Im konkreten, exemplarischen Fall kann eine solche Produktionsregel beispielsweise die Form und den Inhalt der folgenden annehmen:

WENN Temperatur (Raum)

kleiner 20 Grad

DANN Füge-Hinzu (Kalt (Raum))

Diese Produktionsregel veranlaßt, daß immer dann, wenn die Temperatur eines Raums unter 20 Grad sinkt, zum "Wissenselement" Raum die Eigenschaft hinzugefügt wird, es sei in ihm "kalt".

Dieses Beispiel zeigt, daß Produktionsregeln immer dann angewandt werden können, wenn der aktuelle Zustand der Wissensbasis - den ja die Menge der Fakten beschreibt - die Bedingung der Regel erfüllt. Wobei man unter "Anwenden" der Regel hier einfach jenen maschineninternen Vorgang versteht, bei dem die vorgeschriebene Aktion ausgeführt wird und der die Wissensbasis des Computers mithin in einen neuen, anderen Zustand überführt.

Im Vergleich zu anderen Wegen der Repräsentation von Wissen bestechen Produktionssysteme vor allem durch die Tatsache, daß ihre Wissensbasis modular aufgebaut ist. Denn die einzelnen Regeln sind ja in hohem Maße unabhängig voneinander aufstellbar, was wiederum beim Erweitern der Wissensbasis ausgesprochen vorteilhaft ist. Denn dadurch kann man in eine gegebene Basis relativ leicht neue, zusätzliche Regeln einfügen.

Das Lilog-Forschungsprojekt von IBM und mehreren Hochschulen stellt Wissen in Form eines Ansatzes dar, der auf der oben beschriebenen Prädikatenlogik basiert; doch wurde außerdem ein sogenanntes Sortenkonzept eingeführt. Es erweitert die Prädikatenlogik um eine sogenannte Sortenhierarchie mit der oben skizzierten Eigenschaft der Vererbung, die hier nun zur Klassifizierung der Objekte der realen Welt dient.

Da die Lilog-Forscher ihre Sorten mit dem gleichen Formalismus beschreiben, wie das linguistische Wissen ihres Systems, läßt sich das gesamte systeminterne Wissen in homogener Form darstellen.

Außerdem bestehen bereits Ansätze, das für Lilog benutzte System der Wissensrepräsentation noch um weitere Modellierungsmöglichkeiten zu ergänzen. Sie könnten beispielsweise der Beschreibung unsicheren Wissens, aber auch anderen Zwecken dienlich gemacht werden.

(wird fortgesetzt)