Extensible Markup Language (XML)/Vielfältige Anforderungen an Softwarelösungen

Chancen für das Content-Management

08.02.2002
XML-basiertes Redaktions- und Content-Management sind besonders unter zwei Bedingungen sinnvoll: Es fallen große Datenmengen an, oder die Dokumente zeichnen sich durch hohe Komplexität aus. Die Möglichkeiten reichen dann über klassisches Dokumenten-Management hinaus. Von Stefan Freisler*

Grundsätzlich unterscheidet die Branche zwischen Web-basierten (WCMS) und Enterprise-Content-Management-Systemen (ECMS). Bemühte sich Web-Content-Management noch rein um die Inhaltsverwaltung im Internet, ist Enterprise-Content-Management ein umfassenderer Ansatz. Darin sollen alle digitalen Informationen eines Unternehmens in den Informationsfluss einbezogen werden. Content ist heute ein integraler Bestandteil einer Anwendung oder eines Geschäftsmodells. Der Einsatz von XML kann für das Management der Inhalte bedeutende Produktivitätssteigerungen bewirken. War bislang beispielsweise für die Logik der Dokumentenlenkung in einem Dokumenten-Management-System (DMS) eine Workflow-Komponente zwingend notwendig, so können mit XML nun Prozessketten und Transaktionen ohne aufwändige Modellierung in großem Stil realisiert werden. Originäre Eigenschaften eines DMS wie Versionierung, Check-In-Check-Out oder Retrieval gehen mehr und mehr in XML-basierten Funktionalitäten auf.

Branchenspezifische AnforderungenDamit eröffnen sich mit XML neue Möglichkeiten, die nicht nur ein effektiveres Informations-Management einzelner Abteilungen erlauben. So werden auch Synergien zwischen verschiedenen Unternehmensbereichen - vom Pre-Sales- bis hin zum After-Sales-Bereich - und das Erschließen ganz neuer Felder wie zum Beispiel für das Wissens-Management erst möglich. Typische Bereiche für den Einsatz von XML sind besonders kommunikationsintensive Unternehmen oder Abteilungen großer Firmen unterschiedlicher Branchen wie etwa Fachverlage, Maschinenbauunternehmen, Softwarehäuser, Konstruktionsabteilungen oder Halbleiterhersteller.

Die Potenziale beim Einsatz von XML kann man an folgendem Beispiel zeigen: dem Einsatz eines XML-gestützten Content-Management-Systems (CMS) für die technische Dokumentation bei einem großen Maschinenbauunternehmen, dessen Maschinen und Komponenten immer zu bestimmten Zeitpunkten gewartet werden müssen. Die vollständige Dokumentation einer Maschine kann ohne weiteres aus 30000 bis 40000 Seiten bestehen, in denen unter anderem auch Hinweise für die Wartungszeiträume enthalten sind. Diese Teile sind im Rahmen der XML-Syntax und den Formatbeschreibungen mit Tags ausgezeichnet. Mit einem Parser, einem Programm, das Text syntaktisch interpretiert, können nun diese Informationen direkt aus der Dokumentation ausgelesen werden. Das Resultat: Als Extrakt des Dokuments entsteht ein kompletter Wartungsplan, dessen Teilinformationen direkt in einen Workflow eingespeist werden können, um beispielsweise Erinnerungsroutinen für den Service anzustoßen. Die Wartungsdaten selbst werden aktiver Bestandteil eines individuellen Prozesskreislaufs, ähnlich den Feldinhalten einer Datenbank - nur eben mit einer universellen Formatbeschreibungssprache gekennzeichnet. XML-basierte Redaktionssysteme entfalten ihre Produktivität also im Kontext mit den Prozessen der Business-Daten, wenn der Fluss der Daten in einen optimalen Prozess eingebettet ist, egal in welcher Anwendung.

Die Möglichkeit, Daten und Informationen aus unterschiedlichen Applikationen zusammenzuführen und in neuen Konstellationen entsprechend den jeweiligen Erfordernissen aufzubereiten oder weiterzuverarbeiten, ist denn auch der zentrale Vorteil von XML-fähigen CMSen. Multilinguales Informations-Management, Wiederverwendung von Inhalten, verteiltes Arbeiten, Varianten-Management und medienübergreifendes Publizieren sind weitere wichtige Vorteile, die man mit dem geeigneten CMS realiserien kann.

Was XML-CMS beherrschen sollteEinige zentrale Anforderungen sollte ein XML-fähiges Content-Management-System mindestens erfüllen, um den Ansprüchen im Unternehmen gerecht zu werden:

-Standardtechnologie: Die zugrunde liegende Datenbank muss eine Standarddatenbank sein, und zusätzlich verwendete Komponenten sollten über Schnittstellen zur Office-Welt, etwa "Microsoft Word", verfügen. Nur über Standardtechnologien können Wartungskosten in einem sinnvollen Rahmen bleiben und die Schulungskosten gering gehalten werden.

-Integrierbarkeit: Für das System müssen vielfältige Filter zum Datenaustausch mit anderen Standardwerkzeugen vorhanden sein (zu ERP, PPS, EDM, CRM). Außerdem sollten XML-Parser-Technologien integriert sein und die Möglichkeit zur Verwendung beliebiger Texteditoren, Grafikwerkzeuge und Browser bestehen.

-Medienneutrale Datenhaltung: Inhalte müssen für mehrere Formate beziehungsweise Medien (Print, CD-ROM, Inter-/Intranet) aus einer gemeinsamen Datenquelle produziert werden, um Redundanzen und Doppelarbeiten zu vermeiden. Das hierfür bevorzugte Speicherformat ist XML, das auch die getrennte Bearbeitung von Inhalt, Layout und Struktur zulässt. Eine möglichst integrierte Publikationskomponente muss das schnelle Generieren verschiedener Formate für unterschiedliche Zielmedien erlauben.

-Dynamische Publishing-Prozesse: Neben der Produktion von statischen Exportformaten sollte das System eine dynamische Sicht auf den Datenpool mit HTML ermöglichen. Eine Integration in gängige Suchmaschinen oder marktübliche Server (Apache, Microsoft Internet Information Server) sollte gewährleistet oder bereits vorhanden sein. Wünschenswert wäre zudem, wenn die Konfiguration dieser dynamischen Web-Seitengenerierung einfach ausfällt und keinen Einschränkungen in Bezug auf HTML-Versionen und Ähnliches unterliegt. Über eine Auswertung von Benutzerdaten sollte es möglich sein, personalisierte Sichten auf den Datenbestand zu erzeugen. Der Freigabeprozess sollte erlauben, Daten zunächst auf einem Staging-Server zu sehen, um diese nach der endgültigen Freigabe auf den Live-Server zu schalten.

-Parsing und offenes Objektmodell: Grundlage für die genannten Generierungsprozesse sind ein offen gelegtes Objektmodell und eine integrierte, performante Parsingtechnologie, die es erlaubt, auf alle XML-Inhalte und deren Elemente effizient und ereignisbasiert zuzugreifen. Das Parsen der Daten dient sowohl zur Validierung (Überprüfung auf syntaktische Korrektheit) als auch zum Transformieren in andere Strukturen beziehungsweise zum Übersetzen in bestimmte Zielformate.

Auf der einen Seite ist XML eine schnelle und einfache Möglichkeit, Daten für bereits bestehende Anwendungen aufzubereiten. Denn um Daten zu beschreiben und auszutauschen, sind keine Document Type Definitions (DTDs) notwendig. Auf der anderen Seite ist es eine mächtige Technologie, deren Stärken erst in einer tiefen Integration deutlich werden, nach dem Prinzip: Je komplexer es wird, desto mehr ist möglich. XML ist eine äußerst Know-how-intensive Technologie, in der hochgradig spezialisiertes Wissen über Text-Linguistik, Parser, Modellierungstools für DTDs, Betriebssysteme, Massenspeicher, Applikationsarchitektur und Algorithmen zusammengeführt werden. Nicht zuletzt erfordern auch XML-Anwendungen, dass damit die Business-Prozesse abgebildet werden.

Migration von BestandsdatenZudem müssen natürlich bei Einführung eines XML-basierten CMS die Daten und Informationen, die schon vorliegen, in XML umgewandelt werden. Vorhandene Inhalte aus Textverarbeitungs- oder Desktop-Publishing-Systemen können aber, wenn überhaupt, nur teilautomatisch, wie etwa bei MS Word oder "Framemaker", in XML überführt werden. Darüber hinaus werden Umstellungen auf XML gerne für eine Überprüfung der Dokumentationsarten und Strukturen genutzt, so dass die Bestandsdaten in einer weiteren Hinsicht überarbeitet werden müssen.

Fazit: Eine XML-basierte Speicherung von Dokumenten lohnt sich nicht in jedem Fall. So ist eine XML-Archivierung von Standarddokumenten mit einer kurzen Lebensdauer, kurzen Prozessketten und geringerem Informationsgehalt kaum erstrebenswert. Vereinfacht gesagt sind XML-orientierte Redaktions- und Content-Management-Systeme sowie integrative Anwendungen unter zwei Bedingungen sinnvoll: Masse oder, in noch höherem Maße, Klasse. Erst bei einer komplexen Struktur der Prozesse und Dokumente und bei hochwertigen Inhalten, die mit einem Investment einhergehen, sind XML-basierte CMSe erstrebenswert. (ws)

*Stefan Freisler ist Mitarbeiter der Schema GmbH in Nürnberg.

Beispiele für branchenspezifische Anforderungen-Banken: Die Berichte der Wirtschaftsbeobachter müssen sowohl im Intranet als auch in gedruckter Form als Informationsbroschüre zur Verfügung stehen.

-Verlage: Mehrere hundert freie Autoren arbeiten an der Erstellung verschiedener Loseblattwerke. Die Informationen müssen in einer medienneutralen Datenbank gespeichert sein, damit sie von den Produkt-Managern zu neuen Medienprodukten zusammengestellt werden können.

-Maschinen- und Anlagenbauer: Unternehmen müssen kostengünstig mehrsprachige und variantenreiche Produktdokumentationen produzieren. Die Dokumente sollen als PDF- und als InternetVersion vorliegen. Darüber hinaus besteht die Notwendigkeit, dass Produktkurzinformationen zu den einzelnen Bauteilen effizient und korrekt vor der eigentlichen Fertigstellung über das Internet, aber auch in druckbarer Form publiziert werden.

-Softwareentwickler: Die kontextsensitive und zielgruppenspezifische Online-Hilfe muss ständig den aktuellsten Entwicklungen angepasst sein. Das Benutzerhandbuch und die Schulungsunterlagen sollen aus denselben Quelldaten erstellt werden.

Abb: Medienneutrale Datenhaltung

Zu den häufig genannten Anforderungen an XML-fähige CMSe gehört die medienneutrale Datenhaltung. Inhalte können dann für mehrere Formate oder Medien (Print, CD-ROM, Internet) aus einer gemeinsamen Datenquelle produziert werden. XML als Speicherformat bietet dabei den Vorteil, dass es die getrennte Bearbeitung von Inhalt, Layout und Struktur zulässt. Quelle: Schema GmbH