Semantik als Schlüssel für Content-Management

24.01.2003

XML als etablierte Basistechnologie für Content-Management beschreibt die Struktur von Dokumenten. Für die intelligente Verknüpfung von Inhalten, die kontextspezifische Auswahl oder für fortgeschrittene Abfragetechniken bedarf es aber Hinweise auf den Inhalt der Daten. Damit die Bedeutung von Dokumenten maschinell ausgewertet werden kann, wurde eine Reihe von semantischen Technologien entwickelt, darunter das Resource Description Framework (RDF) oder Ontologien. Semantische CMS, die auf Ontologien basieren, bieten darüber hinaus die im Folgenden beschriebenen Funktionen. Inhaltliche Integration heterogener Datenquellen Die Voraussetzung für einen nachhaltigen Erfolg von CMS ist es, möglichst einfach und nachhaltig alle relevanten Datenquellen integrieren zu können. Damit kann der Aufbau isolierter Wissensinseln und somit Redundanz vermieden werden. Neben der physischen Zusammenführung der Daten können bei der inhaltlichen Integration heterogene Strukturen über Ontologien aufeinander abgestimmt werden. Dabei werden sowohl Namens- als auch Wert- und Strukturkonflikte, die zwischen unterschiedlichen Datenquellen bestehen, über Ontologien aufgelöst. Intelligenter Wissenszugriff für Mensch und Maschine Bis zu 80 Prozent der in Unternehmen vorhandenen Information liegen unstrukturiert in verschiedenen Dokumenten vor. Die Bedeutung und Zusammenhänge dieser Dokumente erschließt sich dem menschlichen Anwender über ihren Kontext, Maschinen steht bisher das Wissen darüber nicht zur Verfügung. Ein CMS muss jedoch die relevanten Informationen für unterschiedliche Zielgruppen effektiv und intelligent kombiniert zur Verfügung stellen. Der Einsatz von Semantik in Form von Ontologien löst oben aufgeführte Forderungen ein und fügt den Dokumenten eine für Systeme verwertbare Struktur und Bedeutung hinzu. Bestehende Metadaten wie , oder können den entsprechenden Begriffen der Ontologie zugeordnet werden.

Am Beispiel einer Suchanfrage soll dies näher ausgeführt werden. Die Beantwortung einer Suchanfrage wird durch die Strukturen der Ontologie (Unterbegriffe, Synonyme etc.) und die Nutzung von Beziehungen und Regeln angereichert. Personalisierung und Adaption der Inhalte Auch die Darstellung des Content für unterschiedliche Zielgruppen, Schnittstellen und Oberflächen (Cross-Media-Publishing) wird inhaltlich über Ontologien gesteuert. Dies er-möglicht die Bereitstellung verschiedener Sichten auf die gleiche Datengrundlage. Da-durch ist auch eine medienbedingte, notwendi-ge Reduzierung von Information möglich, wenn etwa ein Handheld die Darstellung vollständiger Information nicht gestattet, sondern nur die Darstellung wesentlicher Aussagen zulässt. Produkte zum Aufbau semantischer Content-Management-Systeme Die zum Aufbau semantischer CMS eingesetzten Produkte finden zunehmend Verbreitung. In der Regel entstanden solche Inferenzmaschinen, Ontologie-Modellierungsumgebungen und die entsprechenden Suchmaschinen im akademischen Umfeld. Ab Ende der 90er Jahre wurde die Weiterentwicklung und Vermarktung von kommerziellen Unternehmen aufgegriffen. So wird beispielsweise die am Institut für Angewandte Informatik und formale Beschreibungsverfahren (AIFB) der Universität Karlsruhe entstandene Inferenzmaschine "Ontobroker" seit 1999 von der Ontoprise GmbH weiterentwickelt und in kommerziellen Projekten eingesetzt. Inferenzmaschinen bilden als Server die informationsliefernde Schicht, die heterogene Quellen integriert, und sind damit der Kern ontologiebasierender Anwendungen. Über eine wohldefinierte Abfragesprache wird hierbei auf die Wissensmodelle und die damit verknüpften Informationen zugegriffen. Für den Aufbau von Ontologien existieren eine Vielzahl von Entwicklungsumgebungen. Zu nennen wären hier unter anderem die Produkte "Ontoedit" der Ontoprise GmbH und "Coherence" von Unicorn Solutions sowie das Open-Source-Produkt "Protégé 2000" der Stanford University. Semantische CMS nutzen Ontologien, um Anwender bei ihrer Suchanfrage über die flexiblen Navigationsmöglichkeiten zu unterstützen und per Expansion der Begriffe aus der semantischen Umgebung (Synonyme, verwandte Begriffe, Unterbegriffe etc.) sinnvoll zu erweitern. Die Verknüpfung von Content und Ontologien erfolgt über Annotierungswerkzeuge, welche die Spezifikation von entsprechenden strukturierten Metadaten ermöglichen. Ein Beispiel für ein derartiges Annotierungswerkzeug ist das am Institut AIFB entwickelte Tool "Ontomat-Annotizer". Einsatz und Fazit Die semantischen Technologien gliedern sich als Middleware nahtlos in ein CMS ein. Inhalte können dezentral gehalten, aber über eine semantische Schicht flexibel verknüpft und zentral abgefragt werden. Die einheitliche Beschreibung von Strukturen unterstützt und beschleunigt zahlreiche Wissens- und Innovationsprozesse innerhalb des Unternehmens. Neben den Kostenvorteilen durch die Verbesserung der Arbeitsabläufe entstehen weitere Einsparungen. Mit der Verwendung offener Standards wie RDF sind Unternehmen in der Lage, in der Auswahl von Komponenten kostengünstig nach dem "Best-of Breed"-Ansatz vorgehen zu können.