Konventionelle Wissensakquisition ist nicht mehr angesagt:

Induktive Systeme folgern zuverlässiger

01.04.1988

Auch die Knowledge-Ingenieure haben bereist Ihres Anwendungsstau. Mit den konventionellen Methoden der Wissensakquisition, so Joachim Stender*, kann dieser Engpaß nicht bewältigt werden. Eine bereits in die Praxis umgesetzte Verbesserungsmöglichkeit stellten hier jedoch die Induktiv lernenden Systeme dar.

Die Fähigkeit des Menschen, aus wenigen unzulänglichen Fakten gültige Verallgemeinerungen zu ziehen oder eine Struktur in scheinbar chaotischen Ansammlungen von Daten oder Beobachtungen zu erkennen, ist seit Jahrtausenden ein faszinierendes Thema für Wissenschaftler und Philosophen. Das Verständnis dafür ist auch im Bereich der Künstlichen Intelligenz von großer praktischer Bedeutung. Hier liegt nämlich der Schlüssel zu einer dramatischen Verbesserung der Methoden verborgen, durch die ein Rechner in die Lage versetzt wird, menschliches Wissen zu akquirieren.

Induktives Lernen ist der Schlüssel zum Erfolg

Der Ruf nach einer solchen Verbesserung ist in den vergangenen Jahren nicht zuletzt aufgrund der Diskussionen um die "Knowledge-Engineering-Bottlenecks" immer stärker geworden. Tatsächlich stellen die bei der klassischen Wissensakquisition angelegten Limitationen gegenwärtig den bedeutsamsten Hemmschuh in der Entwicklung moderner wissenbasierter Systeme dar.

Die Fähigkeit, Schlüsse aus wenigen unzulänglichen Pakten zu ziehen, wird als induktives Lernen bezeichnet. Diese Form des Lernens ist eine der zentralen Gegenstände der "Machine-Learning"-Forschung, die ihrerseits eine wesentliche Rolle im Gesamtkomplex der "Artificial Intelligence" spielt.

Es ist sinnvoll, sich einmal das Potential möglicher Anwendungen dieser induktiv lernenden Systeme zu verdeutlichen. Eine der gegenwärtig bedeutsamsten Applikationen ist die automatische Generierung von Wissensbasen für Expertensysteme.

Die konventionelle Erstellung solcher Wissensbasen setzt eine Formalisierung des Expertenwissens und seine Codierung in einem Wissensrepräsentationssystem voraus, also einem Produktionsregelsystem oder einem semantischen Netz. Dieser Prozeß ist sehr komplex. Induktiv lernende Systeme sind demgegenüber in der Lage, sowohl zu einer Erweiterung beizutragen, als auch die Basis für die Entwicklung alternativer Wissensakquisitionsmethoden bereitzustellen.

Bereits heute werden induktive Systeme dafür eingesetzt, Entscheidungsregeln durch Induktion aus Beispielen realer Expertenentscheidungen zu ermitteln. Das Ziel dieser Projekte besteht im wesentlichen darin, den Transfer des Expertenwissens in einer durch den Rechner verarbeitbaren Form zu erleichtern.

Diese Art der Wissensakquisition wurde bereits 1980 mit dem von Michalski und Chilausky entwickelten Expertensystem "Plant/DS" demonstriert, das der Diagnose spezifischer Pflanzenkrankheiten dienen sollte. Die in diesem System verwandten Regeln wurden hierbei auf zweierlei Weise gewonnen: einerseits durch die traditionelle Formalisierung des vorhandenen Expertenwissens, zum anderen durch die induktive Regelgenerierung aus Beispielen.

Diese beiden Regelmengen wurden nun gegen einige hundert reale Falldaten getestet. Das Ergebnis war - zumindest für die Vertreter des konventionellen Ansatzes - verblüffend: Die auf induktive Weise gewonnenen Regeln erwiesen sich als deutlich zuverlässiger als die auf konventionelle Weise gewonnenen.

Eine weniger direkte, aber ebenso vielversprechende Methode, induktive Systeme im Bereich des Knowledge-Engineering einzusetzen, besteht darin, die auf konventionelle Weise erstellten Wissensbasen durch einen Prozeß induktiver Filterung zu optimieren. Hierbei werden induktiv lernende Systeme dazu verwandt, Inkonsistenzen innerhalb der Wissensbasen zu entdecken und zu eliminieren, Redundanzen auszuschließen, die aus unsicherem Wissen resultierende Lücken zu füllen sowie die durch einen Experten entwickelten Entscheidungsregeln zu vereinfachen.

Wendet man einen Induktionsalgorithmus etwa auf eine Datenmenge an, die aus den ursprünglichen Expertenregeln sowie Beispielen korrekter und nicht korrekter Resultate besteht, so können diese Regeln in einem inkrementellen Prozeß verfeinert werden, ohne daß hierzu eine umfangreiche Hilfestellung von seiten des Knowledge-Engineer erforderlich wäre.

Einen weiteren wesentlichen Anwendungsbereich induktiver Systeme finden wir in zahlreichen experimentellen Wissenschaften, etwa der Biologie, der Chemie, der Psychologie oder der Medizin. Dort unterstützen diese Systeme den Anwender bei der Suche nach konzeptionell interessanten Mustern oder bei der Aufdeckung von Strukturen in Beobachtungs- oder Experimentalreihen. Die bislang weitverbreiteten traditionellen mathematischen und statistischen Verfahren der Datenanalyse, beispielsweise die Regressions- oder die Faktoranalyse, haben sich als für solche Aufgabenstellungen ungeeignet erwiesen.

Dies ist nicht weiter verwunderlich: Benötigt werden Methoden für eine konzeptionelle Datenanalyse, mit denen nicht primär mathematische Formeln, sondern logische Beschreibungen generiert werden. Ferner sollten diese Methoden erlauben, Daten in hochsprachlichen, am Menschen orientierten ("Human Window") Begriffen und Beziehungen auszudrücken.

Symbolische Beschreibung als Endprodukt angestrebt

Induktive Programme können prinzipiell in zwei unterschiedlichen Weisen verwendet werden: Zum einen sind sie als interaktive Werkzeuge zur Akquisition des Wissens aus Fakten oder Beispielen, also als induktive "Knowledge-Engineering-Front-Ends" einsetzbar, zum anderen dienen sie jedoch in vielen Fällen selber als jenes Werkzeug, das unmittelbar zur Erstellung eines lauffähigen Expertensystems genutzt werden kann.

Betrachtet man die vorhandenen Forschungsansätze, so liegt der Schwerpunkt generell auf dem Prozeß des konzeptionellen, induktiven Lernens. Dieser Begriff wird dazu verwendet, um induktives Lernen zu bezeichnen, dessen Endprodukte aus symbolischen Beschreibungen bestehen, also in hochsprachlichen Konzepten ("Regeln"), ausgedrückt werden. Die Beschreibungen beziehen sich typischerweise auf Objekte und Phänomene der realen Welt, nicht etwa auf abstrakte mathematische Konzepte oder Berechnungen.

Die in der Geschichte des "Machine-Learning" am häufigsten untersuchte Variante des konzeptionellen induktiven Lernens ist das "Lernen von Konzepten aus Beispielen", welches auch als "Konzeptakquisition" bezeichnet wird. Hierbei geht es darum, Beschreibungen von Konzepten aus spezifischen Beispielen solcher Konzepte zu induzieren.

Diese Variante des induktiven Lernens wurde bereits in den fünfziger Jahren untersucht; Meilensteine auf diesem Gebiet setzten jedoch Hunt mit der Entwicklung des CLS-Algorithmus 1966, Miachalski mit dem AQ111-Algorithmus (1978) und schließlich Quinlan, der den ID3-Algorithmus einführte (1979). Diese Algorithmen werden mittlerweile in einer Vielzahl von Expertensystem-Werkzeugen eingesetzt.