Ratgeber Wissensmanagement

Wie Ontologien verstreute Geschäftsinformationen zusammenführen

09.07.2008 von Dr.Christoph Tempich
Mit der richtigen Methodik ist der Aufbau einer Enterprise Ontology keine Geheimwissenschaft. Auch lassen sich Zeit und Kosten gut abschätzen.

Jedes Unternehmen braucht heute ausgewählte Daten und Informationen aus internen und externen, oft Internet-basierenden Anwendungen, um seine Geschäftssituation richtig einzuschätzen oder die Produktentwicklung zu planen. Unternehmensontologien (Enterprise Ontologies) unterstützen die hierfür nötige Informationsintegration, indem sie mit Hilfe von Elementen wie Klassen, Relationen, Attributen, Instanzen und Regeln die Bedeutungen und Beziehungen von Daten und Informationen beschreiben. Anwender können dadurch Rückschlüsse aus den vorhandenen Daten ziehen, Widersprüche in ihnen erkennen und auch fehlendes Wissen identifizieren.

Ein erfolgreiches Vorgehen beim Aufbau von Enterprise Ontologies hat sich im Zusammenhang mit der Einführung Service-orientierter Architekturen (SOA) entwickelt (siehe zum Thema SOA auch unseren SOA Expertenrat). Danach sollten Unternehmen den Projektablauf in fünf Abschnitte unterteilen - nämlich die Phasen Setup, Anforderungsanalyse, Glossaraufbau, Modellierung und Test.

Setup-Phase

In der Setup-Phase definiert das Projektteam zunächst Ziel, Umfang und Domänen der Ontologie. Im Fall eines internationalen Großunternehmens wurden hierfür die Domänen "Kunde", "Produkt", "Supplier/Partner", "Market/Sales" und "Service" ausgewählt. Zudem ist festzulegen, ob die Ontologie zur Integration mehrerer Anwendungen oder zur Beschreibung einer einzelnen Anwendung dienen soll, wobei Letzteres aufwändiger ist.

Schematisch dargestellt sind die zyklischen Arbeitsschritte zum Aufbau einer Ontologie.

Durch die Definition von Themen und Art der Ontologie lässt sich bereits in der ersten Projektphase der Aufwand als Anzahl der erwarteten Modellierungselemente abschätzen. Zudem sind zu diesem Zeitpunkt die zu integrierenden Anwendungen auszuwählen, um in der späteren Testphase realistische Daten nutzen zu können.

Modellierungsmuster sparen Zeit

Werden in der Setup-Phase Modellierungsrichtlinien und Namenskonventionen definiert, kann dies die Vorgabe von Modellierungsmustern wesentlich beschleunigen. Wenn eine Integrationsontologie entwickelt wird, müssen beispielsweise nicht sämtliche für den Datenaustausch nötigen Attribute modelliert werden. Im Praxisbeispiel ließ sich beispielsweise das "Entity Characteristic Pattern" nutzen. Dieses wurde vom internationalen Industrieverband Tele Management Forum als Domänenmodell für das "NGOSS Shared Information/Data Model" (SID) definiert. ist Der Industriestandard NGOSS beinhaltet Richtlinien und Spezifikationen zur Umsetzung von SOAs in Unternehmen der Informations- und Telekommunikationstechnik.

In dieser frühen Projektphase sind zudem Quellen zu analysieren, die bei der eigentlichen Modellierung behilflich sein können. Hierzu gehören Oberontologien (Upper Ontology) wie beispielsweise Gist von Semantic Arts, das SID sowie andere Glossare, Thesauri und qualitätsgeprüfte Ontologien, die Standardisierungsgremien wie Oasis oder das W3C anbieten (siehe auch den Beitrag über die Unstructured Information Management Architecture UIMA).

Wahl der Entwicklungswerkzeuge

Ein weiteres wesentliches Element der ersten Phase ist die Festlegung der Entwicklungsumgebung. Für die Glossarentwicklung bietet sich etwa das "Semantic Mediawiki" an, da die dort definierten Begriffe in eine Ontologieentwicklungsumgebung exportiert werden können. Dies kann etwa mit Hilfe von Anwendungen wie OntoStudio von Ontoprise, TopBraid Composer von TopQuadrants oder dem IBM Rational Software Modeler geschehen. Für die Speicherung großer Instanzmengen oder die Auswertung von Regeln und die Konsistenzüberprüfung bieten sich die semantischen Datenbanken Sesame von Aduna, OntoBroker von Ontoprise, OWLIM von der Sirma Group oder AllegroGraph von Franz Inc. an.

Im Rahmen des SOA-Projekts wurden zusätzlich Web-Services auf Basis der Enterprise Ontology erstellt, wobei die Tool-Unterstützung in diesem Bereich noch nicht ausgereift ist. Zwar bieten die Sirma Group mit dem WSMO Studio oder Ontoprise mit dem OntoStudio erste Ansätze hierfür an, aber dabei ist mit manuellem Aufwand zu rechnen. Generell empfiehlt sich in diesem Projektabschnitt, sich auf eine Tool-Kette festzulegen und prototypisch die Funktionsweise zu überprüfen.

Genaue Aufwandsschätzung

Eine Aufwandsschätzung schließt die in der Regel zwei bis vier Wochen währende Setup-Phase ab. Im genannten Projekt wurde die Tool-gestützte Methodik zur Kostenschätzung Ontocom verwandt. Sie bezieht Inputfaktoren wie Größe, Komplexität, Wiederverwendbarkeitsgrad, verfügbare Informationsquellen und die Team-Erfahrung in die Kalkulation ein. So ließ sich beispielsweise abschätzen, dass eine Entwicklung von 12 000 geplanten Elementen zwischen 18 und 34 Personenmonate dauern würde. Tatsächlich blieb man im Projekt mit 30 Personenmonaten noch unter dieser Vorgabe. Im Verhältnis zu der mit 700 Personenmonaten veranschlagten Entwicklungszeit für die Prozessmodelle des übergeordneten SOA-Projekts stellte der Ontologieaufwand damit eine vernachlässigbare Größe dar (siehe auch den Beitrag über das Semantic Web und Web Services).

Schrittweise Weiterentwicklung

Nach dem Setup sollte die Weiterentwicklung der Ontologie zyklisch in kleinen Schritten stattfinden. Die Praxis hat gezeigt, dass es sich empfiehlt, für die sich anschließende Anforderungsanalyse einen Domänen- oder Prozessteil auszuwählen, der in den weiteren Phasen vollständig entwickelt und getestet wird, bevor der nächste Domänenbereich in Angriff genommen wird. Ein Entwicklungszyklus ist dabei so zu wählen, dass er sich innerhalb eines Monats abschließen lässt. Dieser inkrementelle Ansatz stellt ebenso frühe Erfolge sicher, wie er auch eventuelle Fehler in der Planung erkennen lässt.

Glossar schafft Brücke zwischen Beteiligten

Das in der nächsten Phase aufzubauende Glossar beschreibt die in einem Unternehmen verwendeten Begriffe, stellt Referenzen zu Prozessen her und erfüllt wichtige Dokumentationsaufgaben. Im besagten Projekt wurde hierfür das Semantic MediaWiki genutzt, um die Begriffsanforderungen der Ontologie zu identifizieren und informell zu beschreiben.

Die Wiki-Technik bietet sich einerseits an, weil sie für den möglichst kollaborativen Aufbau des Glossars die Einbeziehung der Fachseite erlaubt. Dabei lassen sich Diskussionen über Aufgaben einzelner Glossarobjekte wie zum Beispiel Kunde, Auftrag oder Produktkatalog nachvollziehbar im Wiki-Kontext führen. Andererseits erlaubt der Einsatz semantischer Techniken den Export der erfassten Begriffe in die Modellierungsumgebung, ohne den Bezug zwischen den Begriffen der Fachseite und den modellierten Klassen und Attributen zu verlieren.

Einsatzgebiete von Ontologien

Derzeit sind Ontologien vor allem in den folgenden Bereichen einsatzfähig:

• Im Rahmen von Datenintegrationsprojekten wie etwa nach Firmenzusammenschlüssen kann eine Ontologie das übergreifende Datenmodell repräsentieren.

• Unternehmen, die interne Daten über eine Web-Schnittstelle der Öffentlichkeit zur Verfügung stellen wollen, können diese mit Hilfe einer Ontologie beschreiben. So dient beispielsweise XBRL als Ontologie, um Finanzberichte von Firmen einheitlich und maschinenverstehbar darzustellen.

• Das Semantic MediaWiki wird neben der Pflege von Glossaren teilweise auch für Projekt- und Wissens-Management in Organisationen eingesetzt.

Twine und Tripit sind Web-Portale, die semantische Techniken nutzen, um wissensbasierende Social Networks oder die Organisation von Reisen zu erstellen beziehungsweise zu vereinfachen.

Modellierung und Konsistenzprüfung

Die eigentliche Modellierung erfolgt in der nächsten Phase. Als Startpunkt empfiehlt es sich, eine Upper Ontology zu wählen, die die oberen Hierarchien der hier noch abstrakten Begriffe wie "materiell" oder "natürliche Person" zusammenhängend definiert. Die konkreteren Begriffe, die im Glossar stehen, werden danach den Klassen der Upper Ontology zugeordnet. Anhand der somit entstehenden formalen Einschränkungen lassen sich weiterhin auch Konsistenzüberprüfungen der Enterprise Ontology vornehmen.

Mit diesem entscheidenden Vorteil bei der Verwendung von Ontologien sind Unstimmigkeiten zwischen den Daten zweier Anwendungen schnell erkennbar. Insgesamt können Anwender durch den Einsatz von Modellierungsmustern beliebige Klassen und Attribute semantisch einordnen, ohne sie explizit modellieren zu müssen. Daher sind insbesondere bei einer Integrationsontologie nur die wesentlichen Informationsobjekte und nicht alle im Unternehmen gebrauchten Informationen zu modellieren.

Qualitätskontrolle und Test

Schwierig ist es hingegen, Modelle qualitativ bewerten zu wollen, da bisher akzeptierte Standards fehlen. Dadurch hängt die Bewertung nach wie vor in erster Linie von den Fähigkeiten und der Erfahrung der Modellierer ab. Dieser muss zumindest ein gutes Abstraktionsvermögen, Kenntnisse von Modellierungsmustern sowie ein Wissen um die Fachprozesse und die sich ableitenden Informationsobjekte mitbringen. Wie gelungen die Ontologie ist, lässt sich zudem in der Testphase unter Verwendung echter Daten prüfen.

Manche Tools bieten hierfür die Möglichkeit, analog zu Unit-Tests in der Softwareentwicklung Testfälle für die Ontologiemodellierung zu definieren. Sind alle Prozessabläufe und die Anwendungsintegration geprüft sowie ein Abgleich mit den Projektanforderungen erfolgt, sollten die Projektverantwortlichen dafür sorgen, dass die gemachten Erfahrungen möglichst vielen Modellierern zur Verfügung stehen. Da es derzeit noch relativ wenig erfahrene Ontologieentwickler gibt, kann sich eine breite Streuung des gewonnenen Wissens später als Wettbewerbsvorteil für das Unternehmen erweisen. (as)