Universelles Austauschformat für Daten

Universelles Austauschformat für Daten Mehr Struktur im Internet durch Sprachgenie XML

03.04.1998

Für mehr Übersicht im World Wide Web wäre vermutlich jeder User dankbar. Mit der neuen Auszeichnungssprache XML kommt die Internet-Gemeinde diesem Ziel ein großes Stück näher.Diese vom World Wide Web Consortium im Februar 1998 verabschiedete Spezifikation erlaubt, jedes Web-Dokument mit einer Struktur zu versehen, die der eines Katalogs ähnelt.

Zum Beispiel lassen sich so Informationen wie Autor, Stichworte oder das Erscheinungsjahr einer Publikation hinterlegen.Eine Suchmaschine findet dann viel schneller die gewünschten Web-Seiten.Heutige Search Engines durchforsten die Seiten auf Web-Servern Wort für Wort.Oft liefert das Tool dann eine seitenlange Liste von URLs zurück und deutet so lediglich auf den Heuhaufen, in dem der Surfer die Nadel suchen muß.

Anders als die Hypertext Markup Language (HTML) ist XML keine Anwendung der Standard Generalized Markup Language (SGML oder ISO 8879).Vielmehr bildet die Spezifikation eine Untermenge davon.SGML wurde bereits 1986 entwickelt.Wegen seiner Komplexität blieb dessen Verbreitung jedoch auf Nischen begrenzt.Das soll mit XML anders werden, denn die Sprache ist viel leichter zu handhaben und könnte auch als "SGML Lite" bezeichnet werden.Sowohl mit XML als auch mit SGML lassen sich spezielle Auszeichnungssprachen (Markup Languages) definieren.Beispielsweise wurde HTML mit SGML entwickelt.

Die Erfinder von HTML hatten lediglich die Absicht, strukturierten Text, Hyperlinks sowie einige Objekte in Web-Seiten zusammenzufügen.Doch die Unzulänglichkeit dieser Methode zeigte sich rasch: Jede Information, sei es Text, Datenbankdaten oder Bilder, muß in das HTML-Korsett gezwängt werden.

Ein Web-Browser stellt zwar eine Konstruktionszeichnung dar, die in der Zeichnung gespeicherten Daten, beispielsweise die Zusammenhänge zwischen den Bestandteilen eines Motors, gehen jedoch bei der Umwandlung des Dokuments in HTML verloren.Anders bei XML: Hier legt ein Autor eine bestimmte Auszeichnungssprache für bestimmte Daten fest.Dabei entsteht ein Informationsmodell, in dem Beziehungen zwischen Objekten genauestens darstellbar sind.

Jeder auf XML/SGML basierenden Auszeichnungssprache liegt eine Grammatik zugrunde, die Document Type Definition (DTD).In ihr definiert der Autor das Inhaltsmodell.

Um beim Beispiel der Konstruktionszeichnung zu bleiben: Ein Unternehmen könnte seine gesamten Design-Unterlagen in ein Browser-gerechtes Format überführen, ohne daß dadurch die logische Verknüpfung zwischen Bauteilen einer Maschine verlorenginge.In einem Intranet stünden dann diese Informationen auf allen Web-fähigen Plattformen zur Verfügung.Viele Softwarehersteller liebäugeln daher mit der universellen Datenbeschreibungssprache.

Datenbankinformationen besser ins Web stellen

Zu den großen Unterstützern von XML gehört Microsoft.Beispielsweise soll die neunte Version der Office-Suite optional Dokumente in diesem Format speichern. Interesse an XML zeigen auch die Anbieter von Datenbanksystemen.Sie erhoffen sich, auf diese Weise Datenbankinformationen besser ins Web stellen zu können, und zwar ohne die Limitierungen von HTML.Im Gegensatz zum ungleichen Bruder unterstützt XML jedes Datenformat.Einmal konvertiert, lassen sich die DB-Informationen über XML-fähige Clients wie zum Beispiel Web-Browser anzeigen und manipulieren.

Zu den frühen Einsteigern gehört der Datenbankanbieter Poet Software http://www.poet.de .Die Hamburger Softwareschmiede implementierte ein SGML/ XML-Repository für ihr Objektdatenbank-Management-System.So können Anwenderunternehmen XML-Daten auf einem DB-Server ablegen.Außerdem möchten die hanseatischen Softwerker im Mai dieses Jahres eine "Content Management Suite" auf den Markt bringen.

In Verbindung mit besagtem Datenbanksystem und einem Web-Server lassen sich so SGML- oder XML-Seiten im Internet oder im Intranet veröffentlichen."Unsere Kunden wollen Dokumentationen und andere Schriftstücke im XML-Format abspeichern", berichtet Matthias Neugebauer, Senior Director Application Services bei Poet, aus seinen Erfahrungen bei Unternehmen.Den Vorteil sehen die Anwenderfirmen dabei in den Strukturierungsmöglichkeiten von XML.

Anders als Word-Texte sind XML-Dokumente nicht nach Kapiteln oder Überschriften strukturiert, sondern nach der jeweiligen anwendungsspezifischen Semantik.Enthält das Schriftstück beispielsweise die Beschreibung eines Motors, so könnte ein Anwender in der Datenbank nach allen Schrauben für die Zylinderköpfe suchen lassen.Die auf das Triebwerk zugeschnittene Semantik stellt die Bestandteile in Beziehung zueinander.

Regen Gebrauch von diesen Eigenschaften macht die Automobilindustrie.Zwar nutzen die Konzerne noch nicht XML, weil die Informationen derzeit nicht über das Web laufen, dennoch haben sie sich auf Austauschformate geeinigt. Exportiert ein Fahrzeughersteller nämlich ein Automobil, so muß die Wartungsdokumentation im SGML-Format vorliegen und dabei einer bestimmten, standardisierten Document Type Definition (DTD) entsprechen.Eine DTD schreibt bestimmte Konventionen fest.Dokumente, die diesen Vorschriften folgen, können daher weltweit im Fahrzeugbereich verwendet werden.

Der große Vorteil der XML-Technik in Verbindung mit dem Internet liegt im Austausch beliebiger Informationen zwischen Firmen in einem Extranet.Andere Anwendungsgebiete sehen Web-Experten im E-Commerce.Online-Shopper können so viel besser in Produktkatalogen stöbern sowie nach bestimmten Angeboten suchen.Beispielsweise plant mit Open Market ein Anbieter von Software für den elektronischen Handel, XML in seine Produktfamilie "Folio" zu integrieren. Ferner wurde das "Open Trading Protocol" (OTP) so definiert, daß es XML verwenden kann.Mit OTP haben Hersteller einen Industriestandard für den Handel im Internet geschaffen.Der Vorteil: Beliebige E-Commerce-Produkte können über XML unabhängig vom verwendeten Zahlungssystem zusammenarbeiten.

Von der intelligenten Strukturierung von Web-Inhalten sind auch die Hersteller von Push-Techniken angetan.Auf der Spring Internet World 98 in Los Angeles stellte Datachannel die Version 3 seiner "Rio"-Software vor.

Mit diesem XML-basierten Datenverteiler sollen Intranet-Anwender Informationen flexibler auswählen und organisieren können, als dies mit den Verfahren der Konkurrenten Pointcast und Backweb möglich ist.

Ferner basiert das von Microsoft favorisierte "Channel Definition Format" (CDF) auf diesem Standard.CDF bildet die Grundlage für Push-Kanäle des "Internet Explorer", die mit der Active-Channel-Technik arbeiten.

Auch im Verlagswesen haben sich die Vorzüge der Extensible Markup Language herumgesprochen.So nutzt die Online-Ausgabe des "Wall Street Journal" das Programm "WSJ Interactive Edition" bereits intern in ihrer Datenbank SGML.Mit XML kann der Verlag komplette Ausgaben des Magazins zur weiteren externen Verwendung an andere Web-Sites übermitteln, ohne daß irgendwelche Formatierungen oder Konvertierungen vorzunehmen wären.Voraussetzung ist allerdings eine auf allen Homepages einheitliche Dokumentendefinition.

Damit die Vorzüge der XML-Spezifikation Früchte tragen, bedarf es etlicher Übereinkommen zwischen Content-Providern, Herstellern sowie den Anwenderunternehmen.Die Autohersteller sowie die Flugzeugindustrie haben es vorexerziert.Nun sind die Internet-Aktivisten am Zuge, einheitliche Austauschformate ins Leben zu rufen.

XML im Web-Browser

Damit der Brückenschlag zwischen XML und Browser klappt, entwickelten die Firmen Microsoft, Arbortext und Inso die Extensible Stylesheet Language (XSL). Mit dieser Sprache lassen sich XML-Daten in HTML umwandeln.Dabei bleiben die Informationen erhalten.Die Konvertierung kann entweder auf dem Client oder auf dem Web-Server erfolgen.Bei der Umwandlung auf der Client-Seite wird die Rechenlast teilweise vom Server auf den Desktop verlagert.Der Server-seitige Ansatz bietet sich dann an, wenn auch Anwender die Daten lesen sollen, deren Browser XML nicht verarbeiten können.Microsoft entwarf zu diesem Zweck ein Active X Control für seinen Internet Explorer.Auch Konkurrent Netscape will in Kürze einen XML-fähigen Browser auf den Markt bringen.