5. XML-Kongress in Darmstadt

Noch immer Kopfzerbrechen beim XML-Einstieg

22.06.2001
DARMSTADT (CW) - Unter dem Motto "Quo vadis XML" wurde vergangene Woche in Darmstadt der mittlerweile schon traditionelle fünfte XML-Kongress abgehalten. Neben technischen Grundlagen lag der Schwerpunkt auf Anwendungsszenarien im E-Business-Umfeld.

Der Informationsbedarf rund um das Thema XML ist nach wie vor groß, das hat die Resonanz der Teilnehmer auf der Darmstädter Veranstaltung gezeigt. Noch herrscht viel Ratlosigkeit, vor allem der noch junge Markt der XML-Software und Dienstleistungen bereitet manchem Anwender Kopfzerbrechen. Entweder ist der Einstieg in die Technik zu kostspielig, oder es ist kompliziert, geeignete Tools zu finden. Ein IT-Spezialist des Chemiekonzerns Merck brachte es auf den Punkt: "Dass wir im Unternehmen XML brauchen, liegt auf der Hand. Aber allein die Einrichtung einer Datenbank inklusive Anpassung kostet uns Hunderttausende Mark. Das reißt mir zwei Beine aus."

Der Widerspruch zwischen dem universellen Ansatz von XML und der gelegentlich mangelhaften Umsetzung dieser Philosophie kam immer wieder zur Sprache. Die Verwendung von offenem XML beispielsweise sei keinesfalls die Regel, wie Klaus Schröter von Danet erläuterte. Zwar sollte der reinen Lehre zufolge jedes Programm fremde XML-Dokumente und DTDs lesen können, doch in der Praxis scheitert das oft an banalen Unzulänglichkeiten. Während XML-Dokumente laut Konvention grundsätzlich auf dem Unicode-Zeichensatz basieren sollten, kommen nicht selten 8-Bit-Zeichensätze zum Einsatz. Vor allem bei US-Unternehmen sei eine Ignoranz gegenüber Nicht-ASCII-Zeichensätzen festzustellen. Eine weitere Empfehlung von Schröter war, offene Standard-DTDs zu verwenden, wobei für Anwender hier das Problem bestehe, sich für einen der vielen Standards zu entscheiden.

Einige Referenten befassten sich ausschließlich oder zumindest teilweise mit dem Thema Verlinkung. Erika Igel von Empolis beispielsweise stellte noch einmal die Möglichkeiten von Xpointer/Xpointer dar. Im Gegensatz zum einfachen Linkkonzept von HTML zeichnen sich mit XML radikal neue Formen der Verknüpfung von Hypertext-Elementen ab. Durch Out-ofLine-Links beispielsweise müssen Links nicht mehr in Quell- und Zieldokumenten verankert sein. Das erleichtert das Management von Links enorm, führt aber gleichzeitig dazu, dass der Autor eines Textes unter Umständen nicht mehr kontrollieren kann, welche Links von seinem Dokument aus wohin gesetzt sind. Damit sind zentrale urheberrechtliche Fragen berührt, für die derzeit keine Lösungen abzusehen sind. Noch fehlt eine populäre Client-Software, welche die neuen Link-Techniken unterstützt. Einen ersten Vorgeschmack auf ein solches Prinzip liefert aber derzeit Microsoft mit seinen neuen Smart-Tag-Links. Die Kontroverse über die Zulässigkeit einer solchen Verlinkung ist bereits voll im Gange und deutet schon jetzt an, dass die externe Verlinkung ein großes Konfliktpotenzial birgt. In dem Maße, in dem die Verlinkung von Hypertext zunimmt, wird aber auch der Bedarf an Link-Management und den entsprechenden Systemen zunehmen, darin waren sich die Referenten einig.

Dass XML nicht nur im Textbereich und zur Anwendungskommunikation geeignet ist, sondern auch im grafischen Bereich Vorteile bringt, zeigte der Vortrag von Erik Meißner über SVG (Scalable Vector Graphics). Es handelt sich dabei um ein Vektorformat in XML, das kleine Dateigrößen ermöglicht und auch Rastergrafiken integrieren kann. Interessant in diesem Zusammenhang war die Vorführung eines Verfahrens, mit dem sich Topicmaps über XSLT-Prozesse in SVG-Dokumente konvertieren lassen. Mit Hilfe eines SVG-Plugins können solche Topicmaps wie auch andere SVG-Grafiken in einem Browser dargestellt werden.

Auf die Problematik des großen Datenumfangs von XML-Dateien ging Hartmut Liefke von Newtron ausführlich ein. Da bei der Archivierung, Datenübertragung und dem Dokumenten-Caching die Datengröße eine nicht unerhebliche Rolle spielt, empfiehlt Liefke die Komprimierung von umfangreichen XML-Daten mit dem XML-Kompressor Xmill. Das Tool trennt Struktur und Daten, gruppiert Daten auf Semantik-Ebene und nutzt semantische Kompression.

Der Vorteil wurde an einem Beispiel verdeutlicht: Ein Weblog-Auszug mit 16 MB wurde mit gzip auf 1,6 MB geschrumpft. Die gleiche Datei wuchs nach einer Konvertierung in XML zunächst auf 24 MB, ließ sich durch Xmill jedoch auf beachtliche 0,8 MB komprimieren.