Online-Publikationen sind in ihrer Aktualitaet kaum zu schlagen Das Internet als weltweites Aktionsterrain fuer Verleger

29.07.1994

Von Rainer Klute

Mit weltweiten Netzen wie dem Internet tun sich fuer Informationsanbieter voellig neue Geschaeftsfelder auf: Buecher, Kataloge, Bestell- und Buchungsservices etc. Realisiert werden die elektronischen Publikationen auf Basis des multimedialen Hypertextkonzepts World Wide Web.

Der Begriff "elektronisches

Publizieren" wird meist in Zusammenhang mit dem Medium CD-ROM und den Moeglichkeiten, die dieses elektronische Buch im Vergleich zur traditionellen Pa-pierfassung bietet, gebraucht: Suchen im gesamten Text und Hypertextfunktionalitaet in Form von Querverweisen, Inhaltsverzeichnissen und Fussnoten. Weniger bekannt ist Online Publishing, also das Verfuegbarmachen von Buechern, Katalogen, Nachschlagewerken, Prospekten und sonstigen Informationen in Computernetzen. Die Vorteile: Die Online- Informationen besitzen eine mit der CD-ROM niemals realisierbare Aktualitaet, und sie erreichen im Internet, dem weltweit groessten Computernetz, ein Potential von mehreren Millionen Interessenten.

"Lebende Buecher" ueber

das World Wide Web

Einige Beispiele fuer Publishing-Aktivitaeten: Der Verlag O'Reilly & Associates gibt mit dem "GNN Magazine" eine elektronische Zeitschrift heraus. Neben dem redaktionellen Angebot enthaelt es kommerzielle Anzeigen, durch die sich "GNN" finanziert. Der Zugriff auf das Magazin ist fuer den Leser kostenlos.

Der "Online Book Store" in Rockport, Massachusetts, macht ebenfalls herkoemmliche Verlagsarbeit, elektronisch umgesetzt im World Wide Web (WWW), einem Konzept des weltweiten Netzes Internet, verfuegbar. Interessenten koennen sich im Buecherangebot umsehen und einzelne Probekapitel kostenlos abrufen. Einige Werke sind auch komplett online vorhanden. Sagt dem Kunden das Angebot zu, bestellt er das gedruckte Buch auf elektronischem Weg. Die Abrechnung erfolgt jeweils per Kreditkarte.

Voraussichtlich ab September dieses Jahres wird registrierten Benutzern mit "Britannica Online" eine elektronische Version der Encyclopaedia Britannica im Netz zur Verfuegung stehen. Gegen Zahlung eines jaehrlichen Obolus ermoeglicht der von Encyclopaedia Britannica Inc. betriebene WWW-Server die Volltextsuche auf saemtlichen Artikeln im Lexikon.

In Dortmund befindet sich eine Gesellschaft in Gruendung, die neben allgemeinen Dienstleistungen im Bereich WWW und Online Publishing die Integration der glitzernden Scheibe mit dem netzgestuetzten World Wide Web in Form eines "lebenden Buches" plant. Benutzer erhalten mit der CD-ROM kostenguenstig einen Grundbestand an Informationen, etwa einen Stadtfuehrer, einen Warenkatalog oder aehnliches. Die gespeicherten Daten sind ueber das WWW selektiv und fuer Anwender voellig transparent aktualisierbar. In den Stadtfuehrer lassen sich so der woechentlich wechselnde Veranstaltungskalender, der aktuelle Verkehrshinweis oder die Belegung der Parkhaeuser einfuegen. Preislisten im Warenkatalog sind stets auf dem neusten Stand, und neue oder geaenderte Produkte kann der Hersteller bei Bedarf nachtragen.

Die Realisierung dieses Szenarios erfolgt ueber das am europaeischen Forschungszentrum fuer Hochenergiephysik, CERN, unter der Leitung des britischen Informatikers Dr. Tim Berners-Lee entwickelte World Wide Web. Dieses multimediale Hypertextsystem vernetzt weltweit erhaeltliche Informationsangebote miteinander und integriert traditionelle Internet-Dienste wie FTP (File Transfer Protocol), News, Gopher

oder WAIS (Wide Area Information Server) unter dem gemeinsamen Dach einer einheitlichen Benutzeroberflaeche. Das WWW-eigene Dokumentenformat HTML (Hyptertext Markup Language) bietet strukturierten Text, Grafik, Sound, Video und was das multimediale Herz sonst noch begehrt. Hypertextverweise verknuepfen HTML- Dokumente untereinander und referieren FTP-Dateien, News-Artikel, Anfragen an WAIS-Datenbanken und sogar Telnet-Sitzungen.

WWW ist kein Programm, sondern ein Konzept. Es beruht wesentlich auf dem erwaehnten HTML. Die Sprache ist SGML-konform, entspricht also der Standard Generalized Markup Language nach ISO-Norm 8879. SGML erlaubt die Spezifikation von Dokumenten- Auszeichnungssprachen in Form sogenannter DTDs (Document Type Definition); HTML ist eine solche Auszeichnungssprache. Als solche stellt sie in der DTD definierte Konstrukte bereit, mit deren Hilfe der Autor die Struktur seines Dokuments festlegt und einzelne Elemente wie Ueberschriften, Absaetze, Aufzaehlungslisten, Zitate und so weiter definiert. Besonders erwaehnenswert ist die Moeglichkeit, Grafiken im laufenden Text unterzubringen und in

Hypertextmanier Verweise auf weitere Dokumente vorzusehen.

Wohlgemerkt: Der Autor spezifiziert in HTML ausschliesslich die logische Struktur seines Texts

(Mark up), nicht aber das Layout, die visuelle Darstellung auf dem Bildschirm (oder Drukker) des Betrachters (Make up). Darum kuemmert sich das jeweilige Anzeigeprogramm (WWW-Client) des Anwenders.

Leider ist HTML noch immer nicht standardisiert, doch laufen inzwischen entsprechende Bestrebungen. Der gegenwaertige De-facto- Standard soll als HTML 2.0 normiert werden. Anschliessend wird HTML 3.0 folgen, das dann als wesentliche Neuerung Tabellen unterstuetzt. Mathematische Formeln sind fuer HTML 3.1 vorgesehen.

Das World Wide Web legt den Benutzer nicht auf eine bestimmte Hard- oder Software fest. Die Anzeige, das konkrete Layout, kann auf einer Vielzahl verschiedener Ausgabegeraete erfolgen. Grafikfaehige Bildschirme erlauben die Textdarstellung in unterschiedlichen Schriftgroessen und

-auszeichnungen, waehrend sich alphanumerische Geraete immerhin noch zur reinen Textausgabe nutzen lassen. Inline-Grafiken erscheinen in diesem Fall nicht. Der Betrachter verfuegt auf seinem System also nicht unbedingt ueber die gleichen Features wie der HTML-Autor auf dem seinen - ein Faktum, das der Online Publisher bei der Informationserstellung zu bedenken hat.

Zur Kontrolle sollte er seine Dokumente mit verschiedenen WWW- Browsern testen. Bei der Dokumentenerstellung ist der Einsatz eines SGML-Editors sinnvoll, der eine Syntaxpruefung vornimmt beziehungsweise ein syntaxgesteuertes Editieren ermoeglicht und an jeder Textstelle nur die Verwendung der dort zulaessigen Auszeichnungen erlaubt. Leider sind solche Werkzeuge mit mindestens 4000 Mark recht teuer.

Wer auf die allgemeine SGML-Faehigkeit verzichtet und unter MS- Windows oder auf einer Sparcstation arbeitet, kann die von der kanadischen Softquad Inc. auf HTML abgespeckte und "Hotmetal" genannte Variante ihres SGML-Editors "Author/ Editor" kostenlos einsetzen. Die professionelle Version mit Formular- und Tabellenunterstuetzung ist mit knapp 200 Dollar recht preiswert zu haben. Schliesslich bleibt noch die Moeglichkeit, HTML-Dokumente mit einem normalen Texteditor zu bearbeiten, wobei eine Syntaxsteuerung allerdings nicht moeglich ist. Ein anderer Weg, HTML-Dokumente zu erlangen, ist die automatische Generierung aus einem anderen Dokumentenformat heraus mit Hilfe eines HTML- Konverters. Frei verfuegbare Tools setzen zum Beispiel Latex-, RTF- , Framemaker- oder Texinfo-Dokumente nach HTML um.

Was die CD-ROM fuer das Stand-alone-Informationssystem darstellt, ist der WWW-Server im World Wide Web. Dieses Programm haelt das Informationsangebot vor, nimmt Dokumentenanfragen von WWW-Clients wie dem bekannten "Mosaic" entgegen, schickt dem Interessenten das Dokument ueber das Internet zu und baut anschliessend die IP- Verbindung wieder ab. WWW-Server und -Clients verstaendigen sich ueber HTTP, das Hypertext Transfer Protocol.

Fremde WWW-Server

fuer das Angebot nutzen

Die Definition dieses Protokolls liegt offen; jeder Anbieter hat also prinzipiell die Gelegenheit, seinen eigenen WWW-Server zu schreiben. Oder er greift auf einen existierenden Server zurueck, zum Beispiel auf den am CERN entwickelten. Dieses Tool laeuft unter Unix sowie VMS und bietet derzeit die vielfaeltigsten Einsatzmoeglichkeiten. Der Quelltext ist vom FTP-Server der Eunet Deutschland GmbH aus dem Verzeichnis /pub/infosystems/www/cern/src abrufbar. Fuer weitere Rechnerarchitekturen und Betriebssysteme wie Macintosh, Windows 3.1 oder Windows NT sind ebenfalls Server- Implementierungen verfuegbar.

Ein fuer Informationsanbieter wesentliches Feature ist die Zugangskontrolle: Mit Hilfe des CERN-Servers laesst sich der Zugriff auf bestimmte Dokumente auf einen ausgewaehlten Benut

zerkreis beschraenken. Das ermoeglicht zum einen For-pay-Services und macht zum anderen interne Dokumente nur berechtigten Mitgliedern einer Arbeitsgruppe zugaenglich. An welcher Stelle der Erde sich diese Personen befinden, ist dabei unerheblich. Nebenbei: Das Einrichten eines reinen Inhouse-Informationssystems ist auch ohne Anbindung an das weltweite Internet realisierbar. Wird eine Volltext- oder sonstige Suche gewuenscht, ist der WWW- Server fuer die Durchfuehrung des Verfahrens verantwortlich.

Er ruft dazu ein vom Anbieter zu erstellendes Programmodul, ein sogenanntes CGI-Skript (Common Gateway Interface), auf, das auf Grund der Anfrage ein HTML-Dokument mit den Ergebnissen der Suche dynamisch generiert und an den Client ausliefert. CGI-Skripten bedienen sich zur Volltextsuche gerne eines Wide Area Information Servers. Die vom WWW-Server ausgelieferten Dokumente sind nicht auf das HTML-Format festgelegt.

Das WWW-Konzept gestattet die Einbindung beliebiger Datentypen und legt dem Online Publisher keine Beschraenkung hinsichtlich der unterstuetzten Datentypen auf. Damit muss ein Informationsanbieter nicht seinen kompletten Dokumentenbestand nach HTML konvertieren - was bei Ton, Bild und Video auch gar nicht moeglich ist -, sondern kann die Unterlagen im aktuell vorliegenden Format sofort verfuegbar machen. Gefordert ist lediglich ein Programm auf seiten des Kunden, das das jeweilige Dokumentenformat zur Anzeige bringen kann. Dies ist entweder das WWW-Client-Programm selbst oder - falls es das gewuenschte Format nicht unterstuetzt - ein externes Programm, das der Client aufruft.

Unzaehlige Dokumente in Postscript oder Microsofts Austauschformat RTF sind dabei unmittelbar potentielle Kandidaten fuer das Online Publishing. Neue Dimensionen eroeffnen die im WWW unterstuetzten Online-Formulare, die der Benutzer am Bildschirm ausfuellt. Damit kann er - ein entsprechendes Angebot vorausgesetzt - komplexe Anfragen an Datenbanken und Retrieval-Systeme starten, sich zu Veranstaltungen anmelden, Hotelzimmer reservieren, Frageboegen ausfuellen, Waren im Electronic Shop bestellen, Electronic Banking durchfuehren, in virtuellen Welten navigieren und vieles andere mehr.

Fuer - fast - beliebige, bereits bestehende Informationsdienste lassen sich geeignete Gateways realisieren, die die angebotenen Services auch im WWW verfuegbar machen. Neue Dienste werden hinzukommen. Dank der Multimedia-Faehigkeit des WWW lassen sich saemtliche Ausgaben nicht nur als Text, sondern bei Bedarf auch als Bild oder Videosequenz darstellen. Der Phantasie sind hier kaum Grenzen gesetzt.

In Zukunft werden nicht nur in den USA, sondern auch in Europa immer mehr Unternehmen die Chancen erkennen, die ihnen eine Praesenz im Internet bietet, und zur Kommerzialisierung des Netzes beitragen. Die im Vergleich zu frueheren Jahren drastisch gefallenen Tarife der Internet-Provider machen den Zugang inzwischen auch fuer kleinere Firmen und sogar fuer Privatkunden erschwinglich. Die Teilnehmerzahlen steigen entsprechend rasant. Werbung im Internet ueber WWW erreicht nicht mehr ausschliesslich ein IT-interessiertes Fachpublikum, sondern durch benutzerfreundliche Applikationen wie Mosaic mittlerweile weitaus breitere Anwenderschichten.

Kommerzielle Datenbanken, die beispielsweise Wirtschaftsinformationen enthalten, und mit denen der Benutzer heute noch muehsam ueber kommandozeilen-orientierte Schnittstellen umgehen muss, werden sich kuenftig im WWW ueber komfortable Masken abfragen lassen, was sie auch fuer gelegentliche Anwender attraktiv macht.

Glossar

WWW - World Wide Web

Konzept im Internet, das die Moeglichkeit bietet, multimediale Informationen abzurufen und anzubieten.

WWW-Browser

Client-Programm fuer die Kommunikation mit den WWW-Servern. Dazu gehoeren "Mosaic", "Cello", "ViolaWWW", "www" und "tkWWW".

HTML - Hypertext Markup Language

Textbeschreibungssprache, die den Spezifikationen des ISO- Standards SGML (Standard Generalized Markup Language) entspricht.

HTTP - Hypertext Transfer Protocol

Transportprotokoll fuer hypertextbasierte Informationen, das im WWW verwendet wird und speziell fuer kurze Antwortzeiten entworfen wurde.

FTP - File Transfer Protocol

Transportprotokoll fuer die Dateiuebertragung im Internet.

*Diplominformatiker Rainer Klute ist im Fachbereich Informatik an der Universitaet Dortmund taetig.