Mit PHP, Apache und My SQL

Kostenlos und frei verfügbar: die Süddeutsche im Web

06.08.1999
MÜNCHEN (uo) - "Was nichts kostet, taugt auch nichts", sagt der Volksmund. Die Layout-Engine für den Online-Auftritt der "Süddeutschen Zeitung" (SZ), München, beweist das Gegenteil. Sie ist mit Hilfe der frei verfügbaren Programmiersprache "Hypertext Pre Processor" (PHP) gestrickt und basiert auf der Freeware-Datenbank "My SQL".

"Wir haben für die Software keine müde Mark gezahlt", sagt Thomas Nitsche, Internet-Consultant und Halbtagskraft bei der SZ. Im April 1998 habe er mit der Entwicklung der Layout-Maschine begonnen, und zur Tour de France im Juli 1998 sei sie in den Echtbetrieb gegangen. Das Konfigurieren der Datenbank habe einen Tag in Anspruch genommen.

Die Applikation bereitet die Artikel der Nachrichtendienste wie Deutsche Presseagentur (dpa), Associated Press (AP) und Telex Dienst Tourismus (TDT) für die Website "SZ on Net" auf, die es seit dem 6. Oktober 1995, dem 50jährigen Jubiläum der Tageszeitung, gibt. Der Inhalt der Seite setzt sich aus Artikeln der SZ-Print-Ausgaben, Beiträgen der fünf Online-Redakteure sowie Nachrichten der Pressedienste zusammen.

Die Print-Texte wie das "Streiflicht", die Glosse auf der ersten SZ-Seite, werden um 14 Uhr des Vortags ins Web überspielt. Das geschieht noch weitgehend händisch. Die Online-Redakteure arbeiten künftig mit dem System "Dynabase" der Inso Providence Inc., Boston, das derzeit eingeführt wird. Ihre Artikel zu Themen aus Wissenschaft, Politik und Reise sind nicht zwangsläufig tagesaktuell. Dagegen werden die Agenturberichte ständig auf den neusten Stand gebracht. Etwa alle fünf Minuten treffen die Nachrichten bei der SZ ein. Allein dpa schickt pro Tag rund 500 Einzelinformationen inklusive Fotos.

Die Agenturtexte erreichen den SZ-Verlag über das File Transfer Protocol (FTP) im Format Standard Generalized Markup Language (SGML). Diese Auszeichnungssprache, aus der die Extended Markup Language abgeleitet wurde, erlaubt das Trennen von Inhalt und Layout. Die Texte sind zudem mit Metainformationen versehen, die sich nach dem New Interchange Text Format (Nitf) richten. Hinter diesem Standard steht der International Press Telecommunications Council (IPTC), eine Organisation, die 1965 ins Leben gerufen wurde, um Telekommunikationsinteressen der Presse wahrzunehmen.

Die Metainformationen weisen Schlüsselwörter, Ressortzugehörigkeit, Prioritäten und einige andere Kategorien aus, wie das Land, aus dem die Nachricht stammt. Diese Kategorien nutzt das DV-Team der SZ-Internet-Abteilung für das Speichern und Suchen in den Tabellen der relationalen Datenbank My SQL. Zuvor muß die FTP-Datei entkomprimiert werden. Mit dem Freeware-Parser "SP" von James Clark wird die Document Type Definition (DTD) auf Syntaxfehler überprüft. Ist alles richtig, landet die Nachricht in der Datenbank. Eine von den Agenturen mitgelieferte Protokolldatei bestimmt, welche Informationen mit aktuelleren Versionen überschrieben werden.

Welche Nachrichten alt sind und gelöscht werden müssen und welche neu in die Datenhaltung aufgenommen werden sollen legen die Agenturen hier fest. Deshalb schwankt der Datenbankumfang kaum; er liegt derzeit bei rund 20 MB.

My SQL läuft bei der SZ unter dem Unix-Betriebssystem Solaris auf dem Server "Sun Enterprise 450", der mit zwei Prozessoren und 1 GB Arbeitsspeicher ausgestattet ist. Internet-Consultant Nitsche zeigt sich zufrieden mit der Leistungsfähigkeit und Zuverlässigkeit der Multithreading-fähigen Datenbank. Bisher sei sie nicht an ihre Leistungsgrenze gestoßen. Grundsätzlich müsse jedoch mit mangelnder Skalierbarkeit gerechnet werden, da das Datenbanksystem "recht monolithisch" und damit beispielsweise nicht Cluster-fähig sei.

Ruft ein Web-Surfer eine Seite, zum Beispiel "www.sueddeutsche.de/aktuell", auf, setzt sie sich in diesem Moment aus den Datenbankinhalten und den Layout-Informationen zusammen. Letztere stammen aus der Layout-Engine, die in der Programmiersprache PHP erstellt wurde. Sie durchsucht die Datenbank, beispielsweise zum Stichwort "aktuell". Die gefundenen Einträge verwandelt die Anwendung in das richtige Schriftbild auf den Seiten. Sie sorgt zudem für das korrekte Einbinden von Tabellen und Bildern sowie für die Aufteilung des Bildschirms. Dabei greift sie auf die bereits durch die Metainformationen der Agenturen vorhandene Struktur der Datenbankeinträge zurück.

PHP-Code, etwa Funktionsaufrufe, lassen sich direkt in eine HTML-Seite (HTML = Hypertext Markup Language) einbetten. "Das Opensource-Produkt arbeitet wie die Active Server Pages von Microsoft", erläutert Nitsche. Eine Überschrift erscheint als solche, weil die Engine eine Variable in einem HTML-Template vorsieht. Greifen die Online-Redakteure auf die Datenbank zu, nutzen sie ebenfalls ein PHP-Modul.

Zu den Vorteilen der Sprache zählt für den Consultant, daß es von der PHP-Gemeinde frei verfügbare Module gibt, die sich in den Interpreter einbauen lassen (siehe: www.php.net). Solche Module ermöglichen etwa Datenbankzugriffe oder das Bearbeiten von PDF-Dateien. Bei der SZ ist der Interpreter mit dem Freeware-Server "Apache" verbunden.

Die Funktionalität der Programmiersprache reicht laut Nitsche über die Client-seitiger Beschreibungssprachen hinaus. Zugleich sei sie jedoch nicht übermächtig wie traditionelle Universalsprachen, da PHP allein für Internet-Anwendungen entwickelt worden sei. Somit ließe sich mit PHP etwa im Vergleich zu Perl, Java oder C++ schneller entwickeln und testen.

Die Entscheidung für Opensource-Produkte, die zudem nichts kosten, befürwortet Nitsche auch noch im nachhinein. Er weist weit von sich, daß die Entwicklung auf einer solchen Grundlage nur etwas für Bastler sei. Der Internet-Spezialist betont vielmehr, daß die Anwendung nun seit mehr als einem Jahr stabil laufe und der Aufwand für die Erstellung und das Testen sehr gering gewesen sei.

Nicht gelten lassen will Nitsche das Argument, daß es sich beim Internet-Auftritt der SZ nur um ein Randprodukt des Süddeutschen Verlags handeln könnte, in den zwangsläufig investiert werden muß, aber bitte möglichst wenig.

Die Reichweite der redaktionellen Seite beziffert er mit drei Millionen Page-Impressions pro Monat. Damit sei SZ on Net durchaus ein strategisches Produkt.

Die "Süddeutsche"

Am 6. Oktober 1945 vergab die US-Militärregierung die Lizenz für die erste Zeitung in Bayern nach Ende des Krieges. Am selben Abend wurde im Färbergraben in Münchens Innenstadt die erste Ausgabe der "Süddeutschen Zeitung" hergestellt - mit Druckplatten aus dem eingeschmolzenen Originalsatz von Adolf Hitlers "Mein Kampf". So wurde das Fundament des Süddeutschen Verlages gelegt.

Heute gliedert sich das Unternehmen in fünf Geschäftsfelder: Zeitungen und Zeitungsdruck, Anzeigenblätter und Supplements, Dienstleistungen, Fachverlage/Bücher sowie Neue Medien. Doch die SZ ist weiterhin das Flaggschiff des Verlags. Im Schnitt verkaufte sich die Zeitung von Montag bis Freitag täglich knapp 400000mal. Das Blatt gehört zu den wenigen deutschen Tageszeitungen, die sich weltweit eigene Korrespondenten leistet. Derzeit gibt es etwa 40 solcher Berichterstatter.