Datenbanken/Ohne die Extensible Markup Language geht künfig nichts mehr

XML: Dreh- und Angelpunkt im Datenbankgeschäft

29.10.1999
MÜNCHEN - Nach C++, Java, Corba, SGML (Standard Generalized Markup Language) und HTML (Hypertext Markup Language) macht nun die Extensible Markup Language (XML) Furore. Besonders im Datenbank-Business spielt die neue Sprache künftig eine zentrale Rolle. Volker John* wirft einen Blick auf Gegenwart und Zukunft des jungen Standards.

XML liefert eine ideale Grundlage für Datenbanken rund um E-Commerce und E-Business und wird die unterschiedlichen Standards, mit denen Unternehmen heute arbeiten, ablösen oder zumindest ergänzen. Denn XML ermöglicht die nahtlose Verbindung von Systemen über das Internet. Wenn der Standard im Zusammenspiel mit Datenbanken eingesetzt wird, können Geschäftstreibende online problemlos Anfragen und Bestellungen austauschen und die Kosten für solche Transaktionen erheblich reduzieren.

XML im Vergleich mit anderen Techniken

Die wichtigen Eigenschaften von XML lassen sich mit wenigen Worten zusammenfassen: XML ist ein Standard, der im Gegensatz zu SGML konsequent mit Blick auf einen plattformübergreifenden Einsatz im Internet konzipiert wurde. Anders als HTML läßt sich XML auch von Programmen einfach auswerten. Mit Hilfe von Auszeichnungen, den sogenannten Tags, unterscheiden XML-Dokumente zwischen dem eigentlichen Inhalt und dessen semantisch relevanter Markierung. Nur mit diesen zusätzlichen Informationen können Computer Daten mit großer Genauigkeit interpretieren - eine Grundlage für komplexe Datenbanken und Electronic-Commerce-Anwendungen. Sowohl XML als auch SGML definieren abstrakte Semantiken, im Gegensatz zu daraus ableitbaren operationalen Semantiken. Anders als die darstellungsorientierte Hypertext Markup Language (HTML) sind XML-Daten deshalb für die Publikation in unterschiedlichen Medien wie Büchern, CDs und dem Internet besonders geeignet. Dieser Umstand und das gute Zusammenspiel mit Java sichert XML einen hohen Stellenwert, wenn es darum geht, einem Unternehmen den Einstieg in das E-Business-Zeitalter zu ermöglichen.

Gegenwärtig decken E-Commerce-Anbieter wie Amazon oder E-Bay den größten Teil des Internet-Handels ab. Der Fokus liegt hier eindeutig auf dem Geschäft mit Endkunden. Marktforschungsunternehmen wie Forrester Research räumen aber vor allem dem E-Business, also dem Handel von Unternehmen untereinander, hervorragende Entwicklungschancen ein. Bereits in wenigen Jahren wird das Volumen dieser Business-to-Business-Geschäfte das der Business-to-Consumer-Geschäfte übertreffen. Spätestens dann müssen die verschiedensten Systeme unternehmensübergreifend und reibungslos miteinander arbeiten. Denn Business-to-Business-Geschäfte basieren auf dem Austausch von Daten, die in Unternehmensdatenbanken gehalten werden. Die dringendste und zugleich größte Herausforderung ist daher die Integration bestehender Backend-Systeme in die heterogene Welt des Internet. Und dieser Herausforderung stellt sich XML.

Was aber muß ein Unternehmen konkret beachten, wenn es XML vorteilhaft zur Kommunikation mit Geschäftspartnern über das Internet nutzen will? Ist der Rahmen erst einmal abgesteckt, zum Beispiel der Austausch von Produktkatalogen und Aufträgen zwischen einem Lieferanten und seinen Kunden, müssen Vereinbarungen über das verwendete XML-Format getroffen werden. Dies geschieht in Form einer oder mehrerer Document Type Definitions (DTD). Sie beschreiben die Struktur eines XML-Dokuments, also dessen Grammatik. Einige Ansätze, solche Formate unternehmensübergreifend zu beschreiben, sind Aribas "Commerce XML" (cXML), Commerce Ones "Common Business Library" (CBL), Microsofts "Biztalk" sowie das gerade in der Entwicklung befindliche "Bmecat" des Bundesverbands Materialwirtschaft und Logistik.

Mit einer DTD ist sichergestellt, daß die Gültigkeit von XML-Dokumenten mittels eines einfachen Software-Parsers geprüft werden kann. Ein solcher Parser ist nicht nur im Business-to-Business-Bereich, sondern für alle XML-Anwendungen gleichermaßen anwendbar. Über ein einheitliches Application Programming Interface (API) läßt sich jedes XML-Dokument in seine Struktur zerlegen, das heißt, die abstrakte Semantik kann ermittelt werden. Lediglich die operationale Semantik erfordert dann eine spezifische Implementierung für den jeweiligen Anwendungsfall. Dies macht XML dem Ansatz von Electronic Data Interchange (EDI) offensichtlich überlegen, da EDI spezielle, teure Implementierungen erfordert. Ist die Vereinbarung über das zu verwendende Format getroffen, müssen die notwendigen Daten aus den bestehenden Unternehmensdatenbanken des Lieferanten extrahiert und in geeigneter Weise in XML-Daten konvertiert werden.

Wiederverwendung als entscheidender Vorteil

Die Übertragung erfolgt via File Transfer Protocol (FTP), SMTP oder HTTP - also die etablierten Protokolle des Internet. Ist der Katalog übertragen, wird der XML-Strom validiert, "geparst" und in die Datenbank des kundenseitigen Einkaufs-Management-Systems eingebracht. Auf dem umgekehrten Weg wird beim Kunden eine Bestellung ausgelöst, die relevanten Daten in eine XML-Nachricht codiert und an den Zulieferer übermittelt. Wie zuvor die Kataloginformation läßt sich diese validieren und inspizieren, um anschließend in die Systeme des Zulieferers übernommen zu werden.

Neben der Tatsache, daß Daten aus vorhandenen Systemen ohne Anpassung interner Prozesse unternehmensübergreifend verwendbar sind, ergeben sich durch XML noch andere Vorteile. In XML vorliegende Daten können auf einfachste Weise verschiedenen Zielgruppen angepaßt werden. Soll beispielsweise beim Eingang einer Bestellung der zuständige Sachbearbeiter eine Benachrichtigung erhalten, läßt sich mittels einer in der Extensible Stylesheet Language (XSL) vorliegenden Formatierungsanweisung eine passende E-Mail vorbereiten. Dazu ist keine Programmierung erforderlich, es muß lediglich eine Assoziation zwischen der XSL-Formatbeschreibung und dem XML-Dokument hergestellt werden. Diese Wiederverwendung von Daten ist einer der entscheidenden Vorteile von XML. Während Formate und Ablagearten sich im Lauf der Zeit ändern - etwa durch den Austausch des Datenbanksystems, bleiben Daten stabil. Mittels XML wird ihre Langlebigkeit sichergestellt. Dies gilt um so mehr, als XML im Gegensatz zu EDI Möglichkeiten bietet, flexibel auf geänderte Anforderungen zu reagieren. So kann mit neu in die Kommunikationsbeziehungen eintretenden Unternehmen elegant verfahren werden - bringen diese eigene Erfordernisse in die Beziehungen ein, wird einfach die DTD erweitert, ohne daß dadurch die Stabilität vorhandener Prozesse beeinflußt wird.

Anforderungen an Datenbanken

Selbstverständlich werden diese Aufgaben um so einfacher, je besser die Unterstützung durch die zugrundeliegenden Datenbanken ist. XML-Daten sind regelmäßig hochkomplexe Baumstrukturen, die besondere Anforderungen an die sie verarbeitenden Anwendungen stellen. Relationale Datenbanken erfordern grundsätzlich ein Mapping zwischen den XML-Strukturen und den Tabellen der Datenbank. Die Komplexität einer Anwendung wird hierdurch unnötig erhöht. Da sich XML-Bäume mit Objekten sehr gut modellieren lassen, sind hier objektorientierte Datenbanken eindeutig im Vorteil. Das Ablegen von XML-Applikationsobjekten in einer Objektdatenbank erfordert keinen mit dem relationalen Ansatz vergleichbaren Paradigmenwechsel. Darüber hinaus entstehen beim Einsatz einer relationalen Datenbank Geschwindigkeitseinbußen, zum Beispiel durch zusätzliche relationale Join-Operationen und Index-basiertes Suchen beim Traversieren des XML-Baums. Kommende Datenbankgenerationen werden zudem in der Lage sein müssen, XML-konforme Schema-Beschreibungen zu verarbeiten. Auf diese Weise wird sichergestellt, daß die bereits erwähnte Flexibilität im Umgang mit neuen Anforderungen tatsächlich erreicht wird. Für Änderungen in der XML-Struktur müssen bislang bei relationalen Datenbanken ständig die Tabellendefinitionen nachgezogen werden. In Objektdatenbanken läßt sich das mit generischen Objektmodellen vermeiden, für die Änderung einer DTD sind dann keine Anpassungen am Schema der OO-Datenbank notwendig. Es ist allerdings unvermeidlich, daß diese Flexibilität zu einem Trade-off führt - je flexibler das Objektmodell, desto geringer ist in aller Regel die Performance.

Zukunftsmusik

Für die nahe Zukunft ist es daher wünschenswert, die Flexibilität eines generischen Objektmodells mit der Geschwindigkeit eines spezialisierten Ansatzes zu verbinden. Zur einfachen Validierung von XML-Dokumenten sollte eine Datenbank integrierte Unterstützung für XML-Parser bekommen. Eines der wichtigsten Anwendungsgebiete von Datenbanken ist die Informationsrecherche. XML-Dokumente enthalten eine große Menge an Kontextinformationen. Bei der Recherche sollte sich daher der Kontext der gesuchten Information in einer Suchanfrage berücksichtigen lassen, indem die Suchausdrücke zum Beispiel mit Pfadangaben konstruiert werden. Daher ist es erforderlich, Abfragesprachen wie Structured Query Language (SQL) und Object Query Language (OQL) entweder mit Erweiterungen zur Verarbeitung von strukturierten XML-Daten zu ergänzen oder durch neue Sprachen zu ersetzen.

Ein wichtiger Faktor für den Unternehmenserfolg bleibt jedoch auch bei diesen Überlegungen unberücksichtigt. Heutzutage stecken etwa 70 bis 80 Prozent der für Unternehmensentscheidungen relevanten Information in klassischen Dokumenten. Recherchen und Auswertungen in diesem Datenbestand gestalten sich aufwendig, wenn nicht gar unmöglich. Für die Zukunft heißt dies, daß neben dem einfachen Austausch von XML-Nachrichten und deren Verarbeitung auch die Verwaltung vollständiger Dokumente immer mehr den Datenbanken überlassen werden wird.

Für die erfolgreiche Teilnahme am E-Business von morgen wird nicht allein entscheidend sein, wie flexibel klassische Datensätze in XML ausgedrückt werden können. Erst die gelungene Integration vorhandener Systeme und Inhalte sowie deren Synthese wird den Unternehmenserfolg gewährleisten. XML stellt dafür das richtige Medium bereit. Es wird Aufgabe der Datenbankhersteller sein, diese Synthese so einfach und effizient wie möglich sicherzustellen.

Angeklickt

Im Datenbank-Business dreht sich momentan alles um einen Begriff: XML. Die Datenbeschreibungssprache liefert eine ideale Grundlage für Datenbanken rund um den Trend zu E-Commerce und E-Business. Dabei spielt das Internet eine tragende Rolle. Mit XML existiert endlich ein Standard, mit dem eine nahtlose Verbindung zwischen Systemen über das Netz der Netze sinnvoll realisiert werden kann. Ganz gleich, ob es sich bei den zu übermittelnden Daten um strukturierte, unstrukturierte oder multimediale Informationen handelt - XML vereint die bislang getrennten Welten der Datenbank-Technologie.

*Volker John ist Produkt-Manager bei Poet Software in Hamburg.