Cinnamon-Projekt von IBM

XML-Dokumente schnell in Content umwandeln

18.07.2003
SOMERS (CW) - IBM-Forscher arbeiten unter dem Codenamen "Cinnamon" an einer Technik, XML-Dokumente mit unterschiedlichen Formaten so zu speichern, dass sie sich ohne großen Aufwand in anderen Content integrieren lassen.

Der "Content Manager" von IBM, aktuell in Version 8, ist in der Lage, XML-Dokumente über einen XML-Extender, der ihre "Dokument Type Definitions" (DTD) in "Data Access Definitions" übersetzt, in der Datenbank DB2 abzulegen. Die Einzelteile eines Dokuments werden dabei "geschreddert", um sie in das relationale System einpassen und aus ihm wieder extrahieren zu können. Dieses Verfahren ist nicht nur speicherfressend, sondern verlangt auch eine aufwändige Programmierung der Recherche nach Dokumenten, die ein Content-Management-System aufrufen können soll. Besonders kompliziert wird es, wenn Teile unterschiedlich definierter XML-Dokumente zusammenzuführen sind.

Es ist absehbar, dass sich in einem Content-Management-System schon nach kurzer Zeit XML-Dokumente befinden, die verschiedene Autoren mit nicht einheitlichen DTDs und Schemes verfasst haben. Die Gefahr besteht, den Überblick darüber zu verlieren, welcher Content zur Verfügung steht. Das Cinnamon-Projekt verfolgt zum einen das Ziel, ein komplettes und einfaches Mapping der XML-Dokumente samt ihrer DTDs und Schemes zu ermöglichen. In einem zweiten Schritt möchten die IBM-Forscher die Extraktion der Dokumente oder Dokumentteile möglichst automatisieren, um sie schnell und gegebenenfalls auch zu neuem Content aufbereiten zu können.

Im Prinzip geht es also bei Cinnamon darum, den steigenden Administrationsaufwand für Content-Management in erträglichen Grenzen zu halten. "Das wird ein Problem", erklärt Stephen O''Grade, Analyst von Red Monk aus Bath im US-Bundesstaat Maine, "denn die Anwender müssten genau wissen, wie sie jeweils mit der Indexierung und dem Aufruf von Dokumenten verfahren." Größere Unternehmen könnten damit schon in naher Zukunft Schwierigkeiten bekommen. Das Cinnamon-Projekt soll in ein Administrations-Tool münden, das IBM im nächsten Jahr mit einer neuen Version des DB2 Content Manager ausliefern könnte. (ls)