XML/Überblick über die Fachliteratur

Rasche Veränderung von XML überfordert Buchverlage

21.04.2000
Die schnelle Entwicklung von XML und damit verwandter Standards konfrontiert Autoren und Verlage gleich mit zwei Herausforderungen: Sie stehen unter hohem Aktualitätsdruck und können durch Überblickstitel der erreichten Komplexität kaum noch gerecht werden. Fotis Jannidis* erläutert, welche XML-Fachbücher der Lektüre wert sind und welche nicht.

Eine besondere Stärke von XML liegt darin, dass dieser von mehreren Standards flankiert wird. Diese vereinheitlichen Hypertext-Mechanismen, Programmierschnittstellen, Transformationsroutinen oder Layout-Darstellung. Einige dieser XML-bezogenen Standards liegen schon vor, andere sind erst im Entwurfszustand, und nahezu jeden Monat werden zurzeit neue Entwürfe veröffentlicht - das dafür zuständige W3-Konsortium will offensichtlich möglichst bald eine stabile Gesamtplattform schaffen.

Die Schnelligkeit, mit der sich die XML-Welt entwickelt, macht es den Verlagen und Autoren schwer. Zwischen der Abgabe des Manuskripts und der Publikation liegen zumeist sechs Monate - oft ein zu langer Zeitraum. Noch dramatischer wird dies, wenn ein deutscher Verlag ein englischsprachiges Buch einfach übersetzt und nicht dem aktuellen Entwicklungsstand anpasst: Das so entstandene Buch ist schon am Tag der Auslieferung veraltet.

GesamtdarstellungenEs gibt ein Buch, das mustergültig vormacht, wie man den Wert eines solchen Werks trotz dieser Entwicklungsgeschwindigkeit erhalten kann: Elliotte Rusty Harold: XML Bible, (IDG 1999, 49,99 Dollar). Der Autor, bekannt durch eine Reihe sehr guter Veröffentlichungen zu Java, hat hiermit schon sein zweites Buch zu XML vorgelegt. Auf seiner Website zu XML, die fast täglich aktualisiert wird und Nachrichten rund um den Standard bringt, findet man auch einen Link zur Website des Buchs mit den aktualisierten Kapiteln (http://metalab.unc.edu/xml). Harold hat zweifelsohne das beste Einsteigerbuch zu XML geschrieben und wird dem Anspruch, der mit dem Titel "Bible" verbunden ist, in puncto Ausführlichkeit und Präzision mehr als gerecht. Anders als in den meisten anderen Titeln beschreibt er die Ergänzungsstandards nicht nur ihrem Prinzip nach, sondern sehr detailliert und mit zahlreichen Beispielen. Sein Kapitel über die neue Formatierungsspezifikation XSL:FO ist wohl das ausführlichste, das man derzeit überhaupt gedruckt findet. Diese vertiefte Darstellung hat aber ihren Preis: Trotz seiner mehr als 1000 Seiten enthält das Buch nichts zum Programmieren mit XML. Weniger bedauerlich ist der Umstand, dass es keine Informationen zu XML-Anwendungen gibt oder gar ausführlich die Besonderheiten von nicht standardkonformen Implementierungen gewürdigt werden.

Eine ausführliche Darstellung solch schnell verderblicher Inhalte kennzeichnet zwei weitere umfangreiche Bücher (Michael Morrison u.a.: XML Unleashed, Sams 1999, 49,99 Dollar und Ann Navarro u.a.: Mastering XML, Sybex 1999, 39,99 Dollar). Insbesondere die knapp 1000 Seiten des Wälzers aus der Unleashed-Reihe machen deutlich: Alles ist nicht ein bisschen von jedem. Dabei finden sich in dem Informationswust auch Goldstücke. So gehört die Erläuterung der API SAX 1.0 einschließlich des Ausblicks auf die Version 2.0 zum Besten, was darüber geschrieben wurde. Der kenntnisreiche Überblick über die XML-Parser trägt die Handschrift des Koautors David Brownell, der an der Entwicklung von Suns XML-Parser beteiligt war. Dies sind, wie gesagt, die Höhepunkte in einem sonst unstrukturierten Informationsangebot. Doch was für den durchschnittlichen Anwender das Buch wenig attraktiv macht, kann in Sonderfällen die Entscheidung gerade für diesen Titel begründen. Denn wo sonst findet man eine Einführung in die XML-basierte Skriptsprache XFA oder in die von Motorola erfundene VoxML, mit der man interaktive Sprachapplikationen erzeugen kann?

Die Konkurrenz "Mastering XML" ist sehr viel kohärenter in der Darstellung, auch kann die Präsentation der einzelnen XML-Standards teilweise mehr überzeugen. Andererseits ist dieser Titel besonders schwach, was die Programmiertechniken betrifft. Die XML-API namens Document Object Model (DOM), die in allen möglichen Anwendungen ihren Platz haben kann, erfährt sehr eigenwillig eine Abhandlung im Kapitel "XML-Enabled Browsers". Der Überblick über SAX, die zweite etablierte Programmierschnittstelle für XML-Daten, wurde offensichtlich von einem Nichtprogrammierer geschrieben. Deutlich gelungener und informativer ist die längere Fallstudie über Dells Umstieg auf eine XML-basierte Internet-Lösung.

"Das XML Handbuch" von Charles F. Goldfarb und Paul Prescod (Prentice Hall 1999, 99,95 Mark) verspricht durch Titel und Autor ein wesentliches Nachschlagewerk zu XML zu sein. Immerhin ist Goldfarb der "Vater" von SGML, dem Standard, von dem XML abgeleitet wurde. Um es gleich zu sagen: Es wird diesem Anspruch nicht gerecht. Das Buch besteht größtenteils aus Anwendungsbeispielen, welche die vielfältigen Einsatzmöglichkeiten von XML recht gut dokumentieren. Beschrieben wird allerdings nicht technisch, sondern eher aus der Sicht einer Marketing-Abteilung. Die Praxiskapitel werden nämlich jeweils von einer bestimmten Firma "unterstützt", die ihr Produkt als Exemplar eines Typs von XML-Anwendung darstellen darf. Leider schlägt sich dieses Sponsoring nicht im Preis des Buchs nieder. Übrigens: Das XML Handbuch ist die Übersetzung einer Vorlage aus dem Jahr 1998 und damit hoffnungslos veraltet. Aber bei Prentice Hall ist inzwischen eine stark überarbeitete zweite Auflage in englischer Sprache erschienen. Wer also einen Marketing-orientierten Überblick über die tatsächlichen Anwendungsbereiche von XML gewinnen möchte, ist mit dieser zweiten Auflage gut beraten, wer ein Handbuch zu XML sucht, sollte einen anderen Titel wählen.

Er kann zum Beispiel guten Gewissens auf den "XML Companion" von Neil Bradley (Addison-Wesley 1999, 39,95 Dollar) zurückgreifen, das seit Ende letzten Jahres in der zweiten Auflage vorliegt. Nur halb so umfangreich wie Harolds "XML Bible" gelingt es dem Text dennoch, die wesentlichen Konzepte um XML präzise zu vermitteln - einschließlich DOM und SAX. Knappe und wenige Beispiele sowie eine kompakte Darstellungsweise machen das Buch für technisch versiertere Leser zur idealen Lektüre. Ergänzt wird es durch ein nützliches, 70 Seiten starkes Lexikon aller wichtigen Begriffe aus der XML- und SGML- Welt.

Deutsche XML-BücherSimon Norths und Paul Hermans Buch "XML in 21 days" erscheint auf Deutsch im Markt und Technik Verlag (Markt & Technik 2000. 89,95 Mark). Die amerikanische Version musste sich den Vorwurf gefallen lassen, dass sie etwas wirr aufgebaut ist und zahlreiche inhaltliche Fehler enthält. Die inhaltlichen Mängel sind in der deutschen Ausgabe wohl beseitigt worden - so das Ergebnis eines stichprobenartigen Vergleichs. Aber eine weitergehende Aktualisierung des Textes hat nicht stattgefunden. Das Resultat ist ein Buch, das Anfang des Jahres 2000 erschienen ist, sich aber auf dem Kenntnisstand von Ende 1998 befindet. Die Darstellung konzentriert sich viel weniger als bei Bradley oder Harold auf die Konzepte von XML, sondern enthält vielmehr zahlreiche anwendungsspezifische Ausführungen.

Angesichts solcher Fehlleistungen beim Übersetzen lohnt sich ein genauerer Blick auf die Bücher von deutschen Autoren besonders. Thomas Michel hat eine Einführung vorgelegt, die ihrem Titel sehr gerecht wird: "XML kompakt. Eine praktische Einführung", (Hanser 1999, 59,80 Mark). Der Titel wendet sich an technisch erfahrene Leser, die man nicht schrittweise an die Hand nehmen muss und die sich über die relevanten XML-Standards informieren wollen. Der Autor diskutiert as Design von DTDs und dabei auftretender Probleme, beispielsweise wie man Tabellen in die Baumstruktur von XML überführen kann. Sieht man von dem kurzen Abschnitt über DOM ab, der so lakonisch ist, dass daneben die W3C-Empfehlung fast geschwätzig wirkt, leistet das Buch das, was es sich vorgenommen hat.

Geradezu als Ergänzung dazu kann Henning Lobin: "Informationsmodellierung in XML und SGML", (Springer 1999, 59 Mark) gelesen werden. Lobin konzentriert sich nach einem knappen Abriss der Bausteine einer XML-DTD in einem ausführlichen zweiten Teil auf die Frage, wie Dokumenttyp-Architekturen zu erstellen sind. Damit sind Meta-DTDs gemeint, die Definitionen enthalten, die für alle implementierenden DTDs verbindlich sind. Man kann sich das Verhältnis wohl prinzipiell wie das der Vererbung in der objektorientierten Programmierung vorstellen, nur dass die Freiheiten bei der Namensgebung größer sind. Die Notation solcher Architekturen kann sowohl in SGML als auch in XML vorgenommen werden und folgt den Architectural Form Definition Requirements.

Anfang 2000 erschien von Oliver Pott und Gunter Wielage: "XML. Praxis und Referenz" (Markt & Technik, 79,95 Mark) in zweiter Auflage - um genau zu sein: in aktualisierter Auflage. Worauf sich dieser Anspruch stützt, bleibt unklar. Der Text ist an entscheidenden Punkten gerade nicht aktualisiert worden. Die Autoren sprechen immer noch von einem Document Object Model Version 1, für das nun ein Entwurf vorliege. Tatsächlich wurde diese DOM-Version bereits am 1. 10. 1998 zu einer Empfehlung des W3C. Das umfangreiche Kapitel über XSL hat man offensichtlich nicht überarbeitet, da es schon durch den W3C-Entwurf vom 21.4.1999 überholt ist. Ebenso wenig kann die leicht konfuse Gliederung des Buchs oder die etwas wirre Anhäufung von Beispielen überzeugen.

NachschlagenDie XML-Spezifikation ist nur rund 30 Seiten lang, aber außergewöhnlich dicht und kompakt formuliert. Insbesondere für Anwender, die XML-Applikationen entwickeln, ist daher ein Kommentar dieses Textes notwendig, wenn es um Implementierungsdetails geht. Gleich zwei davon liegen inzwischen vor (Ian S. Graham, Liam Quin: XML Specification Guide, Wiley 1999, 39,99 Dollar. Bob DuCharme: XML. The annotated Specification, Prentice Hall 1999, 44,99 Dollar).

Der Titel von Wiley enthält neben dem Kommentar der Spezifikation eine knappe Einführung in XML sowie eine Reihe von nützlichen Anhängen: beispielsweise eine Erläuterung der Extended Backus-Naur Form, die zur Notation in der XML-Spezifikation verwendet wird. Oder einen Überblick über das Problemfeld der Zeichensätze und -kodierungen. Die Kommentierung des XML-Standards selbst ist wie-derum technisch orientiert, aber sehr präzise bis hin zur Analyse kleinerer Fehler und Ungenauigkeiten. DuCharmes Buch dagegen, das sich ganz auf die Kommentierung konzentriert, richtet sich mit seiner eher unakademischen Sprache und den zahlreichen Beispielen an einen größeren Kreis von Anwendern, welche die XML-Spezifikation auch im Detail verstehen wollen.

Klein und handlich ist der erste Titel von O''Reilly zu XML: Robert Eckstein: "XML. Kurz und gut", (O''Reilly 1999, DM 12,80.). Der erste Abschnitt erläutert knapp die Prinzipien von XML - hier stellt sich die Frage, ob ein Anwender, der diese Zusammenfassung versteht, nicht ohnehin gleich den Ursprungstext des W3C zur Hand nehmen wird. Die übrigen zwei Drittel sind XSL und Xlink/XPointer gewidmet. Da sich diese Entwürfe seit dem Erscheinen des Buchs nicht allzu sehr verändert haben, ist dies wohl der interessantere Teil. Ärgerlicherweise weist die deutsche Übersetzung lediglich mit einer Fußnote darauf hin, dass seit der Abfassung des englischen Texts die Working Drafts modifiziert wurden, ohne diese Änderungen zu dokumentieren.

XML in Internet- AnwendungenXML ist entstanden, um die Internet-Kommunikation nicht allein der Layout-Sprache HTML zu überlassen. Aufwendig geschaffene Informationsstrukturen sollen auch im Internet erhalten bleiben. Eine der ersten einschlägigen Darstellungen stammt von einem Autorenteam, dem auch der Entwickler des ersten XML-Parsers angehört (Hiroshi Maruyama, u. a.: XML and Java: Developing Web Applications. Addison Wesley 1999, 39,95 Dollar). Das Buch kann immer noch mit Gewinn als Einführung in die Konzepte solcher Anwendungen gelesen werden, ist aber inzwischen in zahlreichen Details überholt.

"XML by Example" (Que 1999, 24,99 Dollar) wendet sich, wie alle Titel dieser Reihe, an den Anfänger. Dem Autor Benoît Marchal gelingt das Kunststück, eine überzeugende Auswahl aus dem umfangreichen Wissensstoff zu treffen. Hierbei ist das Weglassen fast ebenso wichtig wie das Wählen: Er behandelt CSS 2, aber nicht das neue, noch unfertige XSL:FO. Ebenso verzichtet er auf eine Darstellung von XML-Schemata. Die letzten zwei Kapitel erläutern auf Einsteigerniveau die Prinzipien einer n-Tier-Anwendung und den möglichen Einsatz von XML in solch einem System. Die Beispielanwendung, ein E-Commerce-System in Java, lässt den Leser aber dann mit dem Programmcode alleine. Das wird all jene, die auf den Java-Schnellkurs im Anhang angewiesen sind, mit Sicherheit überfordern.

Alexander Nakhimovsky und Tom Myers behandeln ebenfalls die Verwendung von XML auf der Serverseite: "Professional Java XML Programming with Servlets and JSP", (Wrox 1999, 49,99 Dollar). Das Buch richtet sich an erfahrene Java-Programmierer, die noch über keine XML-Kenntnisse verfügen. Aus der Vielfalt von XML-Standards behandeln die Autoren neben dem Kernwissen vor allem DOM und SAX, setzen diese aber in Beziehung zum Architektur-Design und einer ganzen Reihe von Java-APIs von JDBC über Java Server Pages bis zu Servlets. Einzig bedauerlich, dass das abschließende Kapitel über XSLT/XPath etwas angehängt wirkt und nicht in die umfangreichere Designdiskussion integriert ist.

DiversesXSLT wurde eigentlich erfunden, um die Zuordnung von Layout-Information zu Textelementen flexibler gestalten zu können, als es Cascading Stylesheets erlauben. Herausgekommen ist eine inzwischen eigenständige Transformationssprache für XML-Dokumente, deren gewaltige Leistungsfähigkeit und vielfältigen Einsatzmöglichkeiten erst langsam sichtbar werden. Die ausführlichste Darstellung von XSLT liegt als elektronisches Buch vor: "Practical Transformation Using XSLT and Xpath", Seventh Edition, 25.2.2000. ISBN 1-894049-03-9. 40,00 Dollar. (siehe: http://www. CraneSoftwrights.com/links/trn-cwde.htm). Die über 300 Seiten lange PDF-Datei enthält zahlreiche Beispiele und Grafiken, die fast alle Aspekte von XPath und XSLT beleuchten. Der erläuternde Text ist offensichtlich nicht von einem versierten technischen Autor geschrieben und erschöpft sich in zahlreichen Listen und Tabellen. Anhand einer kostenlosen Probedatei kann sich jeder davon überzeugen, ob ihm dieser Darstellungsstil gefällt.

Zuletzt sei noch ein Buch erwähnt, das noch nicht erschienen ist: Henning Behme, Stefan Mintert: XML in der Praxis. (Addison-Wesley 2000). Es handelt sich dabei um die zweite Auflage dieses Titels. Die erste Auflage war - bei einem übertrieben saloppen Stil - kenntnisreich, gut gemacht und enthielt auch die erste deutsche Übersetzung der XML-Spezifikation.

Eines zeigt die besprochene Fachliteratur deutlich: Die XML-Welt ist heute schon zu komplex, als dass sie sich in einem Buch umfassend abgehandeln ließe. Überzeugen können daher vor allem die Titel, die sich von vornherein auf bestimmte Aspekte beschränken, sei es auf die Erläuterung der Standards, sei es auf spezielle Architekturprobleme oder auf die Erstellung von Internet-Anwendungen auf XML-Basis. Verlage, deren Produkte mit der Geschwindigkeit und Komplexität der Entwicklungen im Internet-Zeitalter nicht Schritt halten können, machen sich selbst überflüssig. Ihre enttäuschten Kunden werden sich immer öfter den elektronischen Texten zuwenden, die schneller verbreitet und auch aktualisiert sind. Solche Publikationen entstehen übrigens nicht immer, aber immer öfter auf der Grundlage von XML.

*Fotis Jannidis arbeitet als freier Autor in München.