XML-Telegramme

11.01.2002

Von MS Word zu XML

Mit Hilfe von "Word HTML 2 Formatting Objects" (WH2FO) lassen sich Dokumente, die mit Word 2000 oder XP im Format "Webseite" gespeichert wurden, nach XML konvertieren. Die Office-Anwendung vermengt HTML mit XML-Inseln zu einem proprietären Format. Das Tool trennt Inhalt und Layout, indem es den eigentlichen Text als XML-Dokument und die Formatierung in einem XSL-FO-konformen Stylesheet hinterlegt. Daher können die Daten mit einem Renderer wie Apaches "FOP" zu PDF oder über XSLT zu standardkonformem HTML umgewandelt werden. WH2FO wurde in Java geschrieben und unterliegt der Mozilla Public Licence. Es kann von http://wh2fo.sourceforge.net heruntergeladen werden.

Xpath-Ausdrücke testen

Bei Xpath handelt es sich um einen W3C-Standard, der den Zugriff auf Abschnitte eines XML-Dokuments erlaubt. Dabei lassen sich Bedingungen formulieren, beispielsweise den Inhalt bestimmter Knoten betreffend. Um die teilweise komplexen Ausdrücke testen zu können, bietet Fivesight Technologies ein grafisches Werkzeug an. Das in Java geschriebene Tool hebt nach Eingabe eines Xpath-Ausdrucks die zutreffenden Abschnitte des XML-Dokuments hervor. Der "Xpath Tester" kann von http://www.fivesight.com/downloads/xpathtester.asp heruntergeladen werden.

Xerces unterstützt Schema

Die Apache Group unterstützt mit der Version 1.60 ihres C++-Parsers "Xerces" nun die W3C-Empfehlung "XML Schema" vollständig. Das Tool ist somit in der Lage, XML-Dokumente anhand eines Schemas zu validieren. Zu den Standards, mit denen Xerces außerdem übereinstimmt, gehören DOM und SAX in der Version 2. Binäre Distributionen des Open-Source-Parsers können für Windows, Linux, AIX, HP-UX und Solaris von http://xml.apache.org heruntergeladen werden.

Cocoon 2 fertig gestellt

Das XML-Publishing-Framework "Cocoon", das unter dem Dach der Apache Software Foundation entwickelt wird, ist nun in der Version 2 verfügbar. Cocoon realisiert einen Pipelining-Mechanismus, der XML-Dokumente durch mehrere Bearbeitungsschritte schleusen kann. Diese umfassen typischerweise Transformationen mit XSLT, Zielformate für die Darstellung sind meist HTML oder PDF. Zur Erzeugung des Adobe-Formats beinhaltet Cocoon das Apache-Tool "FOP". Cocoon findet sich ebenfalls auf http://xml.apache.org.