Web

W3C: Unicode 4 löst Probleme mit XML nicht

17.06.2003

MÜNCHEN (COMPUTERWOCHE) - Das Web-Konsortium W3C und das Unicode Consortium weisen in einem Technical Report auf Fallstricke bei der Verwendung von Unicode mit XML (Extensible Markup Language) und anderen Beschreibungssprachen wie zum Beispiel HTML (Hypertext Markup Language) hin. Unicode ist ein Standardzeichensatz, der jeden Buchstaben jeder Schriftsprache als Zahl kodiert. Der Report ist bereits für die Unicode-Version 4.0 überarbeitet, die im Lauf des Jahres erscheinen soll.

Laut Bericht resultieren die Probleme aus den völlig unterschiedlichen Ansätzen der Sprachen. Während Unicode jeden Buchstaben einer Web-Seite eins zu eins beschreibe, seien die Markup-Sprachen wesentlich flexibler. So werde in HTML oder XML zum Beispiel die Anzeige hoch- oder tiefgestellter Buchstaben über Styles gesteuert. Unicode dagegen bilde die Zeichen eins zu eins ab. (lex)