Vom Data- zum Knowledge-Warehouse

16.05.2001
Von 
von Sopra Steria Consulting
MÜNCHEN (COMPUTERWOCHE) - Für die Steuerung von Unternehmen gewinnt die Ressource Wissen zunehmend an Bedeutung. Heutige Entscheidungs-Tools müssen deshalb drastisch erweitert werden, damit sich dieses wertvolle Gut sinnvoll verwalten und nutzen lässt.

In den letzten Jahren haben viele Unternehmen unter enormen Anstrengungen Data Warehouses aufgebaut. Nicht alle konnten die Ziele realisieren, die mit den zugehörigen Projekten verknüpft waren. Neben den technischen und organisatorischen Schwierigkeiten, die sich beim Bau derartiger Systeme ergeben, sind Anwender häufig von den angebotenen Inhalten und Möglichkeiten zur Weiterverarbeitung und Nutzung enttäuscht. Insbesondere fehlt die Möglichkeit, die Inhalte des Data Warehouses an sich ändernde Forderungen von Nutzern anzupassen und Wissen als Grundlage für Entscheidungen abzuleiten. Dies führt zur Frustration. Das Data-Warehouse-Konzept sollte deshalb erweitert werden, in Hinblick auf das bewusste Management der Ressource "Wissen". Die Idee eines Knowledge Warehouses ist davon geprägt, den Anwender gespeichertes Wissen kontinuierlich adaptieren und verbessern zu lassen. Hersteller bieten mittlerweile Produkte an, die sich auf einzelne Aspekte davon spezialisieren. Eine umfassende Komplettlösung "von der Stange" existiert hingegen nicht und wird aufgrund der heterogenen Aufgabenstellungen in der Praxis auch nicht zu erwarten sein. Einheitliche Definition: Fehlanzeige Im Zusammenhang mit Knowledge Management (KM) werden Data-Warehouse-Systeme inzwischen um Aspekte der gezielten Wissensverarbeitung erweitert. Technisch handelt es sich dabei zumeist um eine Integration der Basistechnologien des Knowledge Managements. Darunter versteht man IT-Lösungen, mit denen sich Wissen sammeln, organisieren und verteilen lässt. Mittels Internet-Intranet-Technologien, Workflow- und Workgroup-Systemen sowie Dokumenten-Management-Systemen lässt sich Wissen beispielsweise im Unternehmen publik machen.   Wissen nutzen:

Aus Daten Aktionen ableiten Triebfeder vieler KM-Projekte ist die gestiegene Komplexität von Produkten, mehr Wettbewerb und die Globilisierung von Geschäften. Eine einheitliche Definition von Knowledge Management existiert aber zur Zeit noch nicht. Ziel dieses Ansatzes ist es, Geschäftsstrategien, Prozesse und Informationssysteme auf die Ressource Wissen auszurichten und unternehmensweit zur Verfügung zu stellen. Zur Begründung, warum Wissen in den Mittelpunkt der Betrachtung rückt, lassen sich viele Aspekte heranziehen: So ist eine Zunahme von wissensintensiven Produkten zum Beispiel im Dienstleistungsbereich zu beobachten, bei denen der Anteil der Material- und Fertigungskosten nur einen Bruchteil der Gesamtkosten ausmacht. Durch neue Medien wie dem Internet kommt es darüber hinaus zu einer Datenüberflutung, die nur durch geeignete organisatorische und technische Maßnahmen in den Griff zu bekommen ist, damit sich daraus relevante Wissensbestandteile ableiten lassen. Für eine erfolgreiche Unternehmensführung stellt die Ressource Wissen allerdings keine neue Größe dar. Schließlich bildet das Wissen seit jeher in Form von Patenten, geheimen Produktionsverfahren oder speziellen Geschäftsprozessen einen entscheidenden Wettbewerbsvorteil. Neu ist allerdings, sich damit auseinanderzusetzen, wie man Wissen im Betrieb generieret und bereitstellt. Wissen: ein geheimes Gut Data-Warehouse-Lösungen, die eine Erweiterung im Sinne des Knowledge Managements erhalten, sollten ihre Funktionsvielfalt hinter einer intuitiv zu bedienenden Benutzeroberfläche verbergen. Das User-Interface sollte für jeden Anwender individuell gestaltbar sein und mit seinen Fähigkeiten wachsen. Damit sich Information gemeinsam nutzen und daraus Wissen erzeugen lässt, sind zusätzliche Methoden und Tools erforderlich. Dazu benötigt man ein einheitliches Klassifizierungsschema, um Informationen einzuordnen und gleichzeitig danach suchen zu können. Eine weitere Anforderung stellt die Integration sowohl strukturierter als auch unstrukturierter Daten ohne Rücksicht auf ihre Herkunft dar. Im Bereich der Wissensentwicklung wird es wichtiger, auch unstrukturierte Informationsobjekte in das Knowledge Warehouse einzubeziehen. Analysten schätzen, dass diese Form der Informationen, zum Beispiel als Dokumente, E-Mails, HTML-Texte, Präsentationen, Newsgroups oder Diskussionsdatenbanken rund 80 Prozent der unternehmensrelevanten Informationen ausmachen, während nur 20 Prozent in strukturierter Form in Datenbanken liegen. Das Verhältnis dürfte sich durch den zunehmenden Einsatz des Internet zur Kommunikation und Abwicklung geschäftlicher Transaktionen eher noch weiter zugunsten unstrukturierter Information verschieben. Eine Entscheidungsunterstützung erfordert daher nicht nur die Integration interner und externer quantitativer Daten, sondern auch qualitativer Daten in einem einzigen System. So muss der Entscheidungsträger die benötigten Informationen nicht aus diversen computergestützten und nicht-computergestützten Systemen zusammensuchen und anschließend zu einem Gesamtbild zusammenführen. Ein wesentlicher Aspekt für den Aufbau von Data-Warehouse-Systemen ist die Datenmodellierung. Dabei wird ein einheitliches unternehmensweites Verständnis aufgebaut und zumeist in Form von Star-Schemata implementiert. Insbesondere wenn es um die Integration der unstrukturierten Daten geht, versucht man häufig, das Metadatenbanksystem des Data Warehouses mit dem des Dokumenten-Management-Systems zu verbinden, um zusammenhängende Informationsobjekte zu verknüpfen. Wenn aber eine unternehmensweite, einheitliche Ordnungs- und Begriffsbestimmung entstehen soll, ist davon abzuraten, verschiedene Metadatenbanksysteme diverser Systeme verbinden zu wollen. Die für den Aufbau von Data-Warehouse-Systemen im Zusammenhang mit der Bildung geeigneter Dimensionsstrukturen geleistete Arbeit lässt sich insbesondere auch zur Wissensidentifikation unstrukturierter Daten nutzen. Auch wenn man nicht immer alle unstrukturierten Daten eindeutig innerhalb aller Dimensionen eines Multi-Cube einsortieren kann, so sind doch Zuordnungen anhand einzelner Dimensionen möglich (zum Beispiel Kunden, Kundengruppen, Produkte, Produktgruppen oder entlang der Zeitdimension). Wissen identifizieren und strukturieren Der Anwender muss selbst eingreifen, um unstrukturierte Informationsobjekte Schlagworten und Definitionen des Data Warehouses zuzuordnen. Solche Systeme werden derzeit unter dem Begriff Redaktions-Leitstand intensiv erforscht und stehen kurz vor der Marktreife. Text-Mining-Methoden finden unbekannte, aber potenziell nützliche Informationen, die implizit in großen Textsammlungen enthalten sind. Die Anwendungsbereiche sind analog zum Data Mining in der Klassifikation von Dokumenten zu bekannte Gruppen oder in der Segmentierung von Dokumenten in a priori unbekannte Gruppen zu sehen, die in sich möglichst homogen, zueinander aber möglichst heterogen sind. Indem man Verschiebungen innerhalb von Textinhalten betrachtet, kommt es zu Zeitreihenanalysen. Bei der Assoziationsanalyse versucht man, interessante Beziehungen zwischen gemeinsam auftretenden Begriffen innerhalb von Dokumenten und zwischen unterschiedlichen Dokumenten zu untersuchen. Dies hilft insbesondere innerhalb der Phase der Wissensidentifikation zum Aufbau von begrifflichen Netzen. Ein weiterer Anwendungsbereich von Text Mining bildet die Zusammenfassung von Texten (Abstracting). Wenn man davon ausgeht, dass jede Interaktion zwischen dem Anwender und einem Analyse-System als Sequenz von Abfragen innerhalb einer Arbeitssitzung erfolgt und jede analytische Zielsetzung ein charakteristisches Interaktionsmuster besitzt, kann man dieses Wissen ebenso in vielerlei Hinsicht verwenden. Neben dem Einsatz zur Performance-Steigerung, indem absehbare nächste Navigationsschritte schon in einem Cache-Speicher vorgehalten werden, können auch Mitarbeiter das Navigationswissen nutzen, welche die Aufgabe zum erstenmal erledigen, indem sie nachvollziehen, wie Kollegen bei gleicher Aufgabenstellung vorgegangen sind. Dabei ist es denkbar, dieses Muster zu einem interpersonellen Workflow auszubauen. Push und Pull kombinieren Bisherige Data-Warehouse-Lösungen setzen allerdings einen aktiven Anwender voraus. Wenn er einen bestimmten Tatbestand untersucht, liegt es an ihm, die Initiative zu ergreifen und mit Hilfe der vorhandenen Informationen im Warehouse seine Thesen zu verifizieren. Der Konsument holt sich seine Informationen selbst im Warehouse ab, was impliziert, dass der Anwender auch einen Überblick über die angebotene Informationsmenge hat. Dieser Pull-Ansatz wird im Rahmen des "Publish-and-Subscribe"-Paradigmas teilweise umgekehrt und führt zu einer Kombination aus Pull- und Push-Konzepten. Der Anwender hat dadurch nur einmalig ein individuelles Informationsbedarfsprofil zu erstellen, und das Knowledge Warehouse kümmert sich um die entsprechende Informationslieferung (Push-Ansatz).

In diesem Zusammenhang kommen auch vermehrt intelligente Softwareagenten für die Wissensverteilung zum Einsatz. Ein solcher Baustein ist ein autonomes, selbstlernendes, zielorientiertes Softwareprogramm, das flexibel mit seiner Umgebung kommuniziert. Die Agenten filtern Informationen, um einen Information Overload zu verhindern. Zudem könnten sie auch gezielt nach relevanten Information in der Datenbasis suchen (information agents) oder den unerfahrenen Anwender bei der Applikationsbedienung unterstützen (user interface agents). Data Warehouses können ihre Informationen in Web-Browsern darstellen. So lassen sich die Vorteile der Internet-Technologie auch im Bereich analytischer Informationssysteme ausnutzen. Der Weg der Integration des Knowledge Warehouses in ein Business Information Portal (BIP) ist somit vorgezeichnet. Dieser zentrale Einstiegspunkt in die umfassende Sammlung von unternehmensrelevanten Informationen versteckt komplexe Anwendungslogik hinter einfacher Mausnavigation und liefert eine Vorstrukturierung der Informationsvielfalt. Der Anwender kann dabei eine individuelle Gestaltung der Struktur festlegen. Zu den wesentlichen Bestandteilen solcher Lösungen zählen aktive Dienste nach dem erwähnten Paradigma "Publish and Subscribe". In Kombination der aufgezeigten innovativen Methoden und der zunehmenden Einbindung von unstrukturierten Informationsinhalten in ein Knowledge Warehouse liegen erhebliche Potenziale in Hinblick auf eine logische Gesamtsicht aller vorhandenen Informationen im Unternehmen.

Nach der Integrationswelle der letzten Jahre in den operativen Bereichen wird auch die Zusammenführung der verschiedenen Technologien der analytischen Informationssysteme fortschreiten. In Zukunft können Unternehmen somit auf ein faszinierendes Spektrum von Anwendungsmöglichkeiten zugreifen. Was ist Wissen? Abgrenzen lassen sich die Begriffe Daten, Informationen und Wissen mit Hilfe der drei Dimensionen Syntax, Semantik und Pragmatik. Die einzelnen Elemente des Zeichenvorrats avancieren zu Daten, indem sie in einer bestimmten Syntax zueinander angeordnet werden. Somit bilden Daten zum Beispiel in Form einer Dezimalzahl einzelne objektive Fakten zu Vorgängen oder Ereignissen ab. Aus Daten entstehen dann Informationen (semantische Ebene), indem die Beziehung zur Realität hergestellt wird und die Angaben in einen Kontext eingeordnet werden. So entsteht aus einer Dezimalzahl durch Hinzufügen einer sachlichen Beschreibung eine Kennzahl, deren inhaltliche Zuordnung zum Beispiel als Vermögensstrukturzahl oder Liquiditätskennzahl dem Controller Aufschluss über die Bedeutung der Zahl liefert. Die Information allein befähigt den Menschen aber noch nicht zu handeln. Durch den zweckbezogenen Einsatz von Informationen (Pragmatik) entsteht Wissen, das zu Entscheidungen und Aktionen führt. Durch entsprechende Interpretation kann ein Controlling-Mitarbeiter Maßnahmen vorschlagen, um zum Beispiel eine Veränderung der Kennzahl in die gewünschte Richtung herbeizuführen. Wissen hängt somit immer vom Betrachter und vom Kontext ab, in dem es gewonnen wird. Im Vergleich zur Information kennzeichnen Wissen ein hoher Vernetzungsgrad und eine höhere Komplexität. Denn es umfasst nicht nur Faktenwissen, sondern ist zum Beispiel auch in Form von schwer beschreibbarem Erfahrungswissen an einzelne Individuen gebunden.