Massenspeichersysteme/Caching ermoeglicht schnelle CD-Jukebox Optische und Magnetspeicher: Vorzuege sollen sich ergaenzen

21.04.1995

Von Winfried Schmitz-Esser*

Digitale optische Speicher sind enorm geraeumig, ueberraschend haltbar (30 Jahre und mehr), unfaelschbar und unschlagbar im Preis. Magnetspeicher an der Spitze der Speicherhierarchie dagegen glaenzen als hochreagibel und schnell. Am Bau von Systemen, die das jeweils Beste beider Welten in einer Jukebox vereinen, arbeiten zur Zeit die Produktentwickler.

Lassen sich die Vorzuege von optischen und Magnetspeichern wunschgemaess in einer Jukebox verknuepfen, so bedeutet das eine selbstaendige, modular verwendbare, programmierbare und in Netzwerke integrierbare Einheit. Insider wollen wissen, dass ein solcher Plattenwechsler fuer das Medium CD noch in diesem Fruehjahr auf dem IMC-Kongress in Amsterdam vorgestellt wird.

Die Entwicklung wuerde bedeuten, dass ein Anwender, der auf optische Speicher umsteigen will, seine Search-Software nicht wegen des unumgaenglichen Cachings um- oder neuschreiben muesste; er bekaeme cleveres Caching gleich in der CD-Jukebox mitgeliefert. Das kehrt die bisherige Praxis um.

Zwischen 100 und 150 Millisekunden dauert es, bis der Laserstrahl auf die Spur der optischen Platte gelenkt und an der Stelle angelangt ist, wo die Daten als "Pits" und "Lands" gelesen oder eingebrannt werden.

Sind Tracks mehrerer Platten im Spiel und die Medien zu wechseln, beansprucht das schon mehrere Sekunden. Die mit Abstand schnellste Jukebox - eine von NSM Mercury fuer 150 CDs und mit zwei bis vier Quad-speed-Laufwerken - schafft den Media-Swap in knapp zwei Sekunden (vgl. Grafik).

Dieser Weltrekord deutet allerdings auch physisch die Grenze an, jenseits derer mehr Leistung nur durch "Caching" moeglich ist. Dabei werden zeitweilig Datenbestaende von der optischen Platte auf magnetische Speichermedien verlegt, um die Schnelligkeit und Flexibilitaet zu erreichen, die nur das loeschbare magnetische Medium bietet.

Ueber cleveres Caching nachzudenken lohnt sich. Caching ist da sinnvoll, wo die von Haus aus langsameren und weniger flexiblen optischen Medien zum Einsatz kommen, also immer dann, wenn eine Vielzahl optischer Medien in Jukeboxen organisiert wird.

Caching macht Jukeboxen erst hinreichend schnell. Dabei wird das Programm, welches die Verlagerung der Daten in den schnelleren und flexibleren Cache vornimmt, in der Regel anwendungsbezogen programmiert, in den meisten Faellen auch in Vermischung mit den zentralen Anwendungsfunktionen wie der Retrieval-Software.

Organisation der Daten bleibt ein Streitpunkt

Das erscheint nicht ganz logisch und ist eigentlich nur historisch erklaerbar: Bei den ersten Anwendungen optischer Platten waren die abzuspeichernden Daten so zu organisieren, dass die haeufig miteinander angeforderten Fundstellen auch gemeinsam auf ein und derselben Plattenoberflaeche abgespeichert wurden.

Nicht jede Archivierungsaufgabe aber stellt gleiche Anforderungen. In vielen Anwendungen lassen sich Schwerpunkte kuenftiger Nutzung auch nicht im entferntesten erkennen, so dass man also gar nicht wuesste, welche Daten auch physisch auf gemeinsamer Plattenoberflaeche gespeichert werden sollten. In anderen Faellen ist die Plazierung von Daten auf dem Medium im wesentlichen eine Funktion der Aufschreibungsfolge, wie im Falle jener CDs, die in mehreren Sitzungen allmaehlich gefuellt werden (Multisession-CD). Und auch die Spekulation darauf, dass die juengsten Zugaenge am haeufigsten abgefragt wuerden, geht nicht immer auf.

Auch hinsichtlich der File-Groessen gibt es nichts, woran man sich halten koennte; schon bei ganz normalen Archivierungsaufgaben im Buero begegnen uns Dateien mit 50 MB und mehr, zum Beispiel in Gestalt von Faksimilegrafik oder farbigem Praesentationsmaterial. Das naechste aufgerufene Dokument, das auf der Platte zu liegen kommt, mag ein zeichencodierter Text von nicht einmal 1000 Zeichen sein. Voice-Aufzeichnungen gar und erst recht Videodokumente erstrecken sich haeufig ueber mehr als nur ein Medium.

Schon gar nicht lassen sich bei Netzbetrieb allgemeingueltige Multiuser-Patterns finden. Nicht nur bei oeffentlicher Nutzung der Massenspeichersysteme ist mit Stosszeiten zu rechnen, denn auch bei reinem Inhouse-Betrieb sind Situationen nicht selten, wo viele Mitarbeiter zur gleichen Zeit an ein bestimmtes Dokument heranwollen.

Nichts Generelles laesst sich auch fuer die Dauer der Nutzung aussagen. Wohl nur eine Ausnahme waere der Fall des Benutzers eines Staatsarchivs, der sich vorher schriftlich anmelden und angeben muss, welche Akten er am Tage seiner Ankunft einzusehen gedenkt. Fuer ihn koennte ein Disk-Jockey die CDs mit den gewuenschten Daten sogar einzeln aus dem Schubfach nehmen und zum Auslesen in den Cache aufs Laufwerk legen. Hat der Besucher die Nutzung beendet, werden die Daten im Cache geloescht.

Dem Redakteur der Tagesschau hingegen, der zwei Minuten vor Beginn der Sendung noch unbedingt etwas pruefen muss, reicht man das erste Dokument, das er aus dem CD-Archiv holt, besser schon mal direkt auf den Bildschirm seines Rechners durch, waehrend es zusammen mit allen weiteren Fundstellen in den Cache gerueckt wird.

Analysiert man nun alle diese extrem unterschiedlichen Anforderungen im Hinblick auf das, was sie fuer eine fortgeschrittene Jukebox-Technik bedeuten, so wird man folgendes feststellen koennen:

1. Ein erstes Buendel von Problemen laesst sich durch die richtige Wahl des Mediums loesen. Wer Zwoelf- oder 14-Zoll-Platten einsetzt, die dazu vielleicht noch beidseitig beschrieben sind, braucht sich ueber lange Wechselzeiten und massive Mechanik nicht zu wundern, denn die Wege sind lang und die zu bewegenden Massen gross. Die 3,5-Zoll-Disk wiederum bietet fuer die meisten Anwendungen zuwenig Platz, ausserdem ist sie nicht genormt und hat noch andere Nachteile.

Die CD: speicherstark, ohne sich breitzumachen

Die CD in allen ihren Formen stellt in dieser Hinsicht einen guten Kompromiss dar, der auch den Schutz von ISO 9660 und einer Reihe anderer anerkannter Industriestandards (Yellow Book, Orange Book, CD-ROM XA, CD,DA, CD-I und Photo-CD) geniesst. Mit ihren 640 MB an Nutzdatenvolumen bietet dieses Leichtgewicht fuer die meisten heute gelaeufigen Anwendungen hinreichend Platz.

Da es nicht kassettiert ist, laesst es sich auch physisch denkbar dicht in tragbaren Magazinen stapeln, sicher bewegen und in der Jukebox beim Wechsel beruehrungsfrei fuehren. Eine an Millionen CDs erprobte Wechselrobotik ist vorhanden.

2. Dass nicht jede Disk ein eigenes Laufwerk haben kann, ist klar, denn allein wegen der 100 oder 150 Millisekunden Zugriffszeit waere es nicht noetig, Cache-Technik zu bemuehen, wo doch die magnetische Hard-Disk auch nur etwa zehnmal so schnell ist, was in diesem Bereich keinen spuerbaren Unterschied bewirkt. Ein Laufwerk fuer hundert Platten mag fuer manche Anwender zuwenig, fuer andere schon unwirtschaftlich sein. Nur der Benutzer kann das fuer ihn optimale Verhaeltnis - etwa ein Laufwerk fuer jeweils 35, 70 oder 100 Disks - bestimmen. Bei noch extensiverer Nutzung sollte er die Moeglichkeit haben, die Disks in Plattentuermen in das Regal zu stellen, so dass er sie nur dann in die Jukebox nimmt, wenn die Daten benoetigt werden.

Wichtig fuer die Multimedia-Nutzung: Ein Folgelaufwerk in der Jukebox kann die Fortsetzung unterbrechungsfrei uebernehmen, wenn die erste Disk ausgelesen ist und der Film auf der naechsten Platte weitergeht.

3. Die Laufwerksgeschwindigkeit ist in den letzten Jahren, ausgehend von "Single speed" (150 KB/s), bestaendig gesteigert worden. Quadruple-Speed, also Vierfachgeschwindigkeit, gehoert heute schon fast zum Standard und genuegt auch den Anspruechen, die sich aus Videodokumenten ergeben.

4. Die CD-Jukebox sollte flexibel mit genuegend hochrangigem Magnetspeicher ausgestattet werden koennen, der als Cache eingerichtet wird.

5. Bei den Daten, die in den Cache gehen, sollte individuell und je nach Anforderung nach verschiedenen Prioritaeten unterschieden werden koennen.

Das Segment Level 1 enthaelt Daten, die absehbar immer wieder gebraucht werden und deshalb laenger als ueblich im Cache verweilen. Das wird dadurch erreicht, dass an diese Datensaetze automatisch oder von Fall zu Fall eine entsprechende Prioritaetsmarke gesetzt wird. Der Level 2 ist ein anderes Cache-Segment mit normaler Verweildauer der Daten. Die Inhalte dieses Segments koennte man "altern" lassen, etwa indem ihre Prioritaet automatisch reduziert wird, wenn die Daten nicht gebraucht werden, waehrend man Neuzugaenge obenan setzt. Das Prioritaetssegment Level 1 koennte als Dynamic Random Access Memory (DRAM) mit Kapazitaeten von 2 bis 128 MB, der Level 2 als Festplatte mit ein bis vier Festplatten e 1,1 GB flexibel eingerichtet werden.

6. Eine Grundvoraussetzung dafuer, dass die Jukebox beliebig konfigurierbar ist und sich als selbstaendige Einheit eines digitalen Massenspeichersystems in die offene Systemwelt integrieren laesst, ist ein DOS-kompatibles Betriebssystem bei Transferraten um 20 MB/s. Zumindest optional sollte ueber entsprechende Netzwerk-Controller die Einbindung in eine Ethernet- oder Token-Ring-Umgebung vorgesehen sein.

Die mit einem solchen Systemdesign gewonnene Autonomie wuerde es dem Anwender endlich ermoeglichen, in seinen Archiven die Applikationssoftware (zumeist Retrieval-Systeme) von der Archivierungs- und Praesentationssoftware zu trennen und diese modular zu fuehren, zu pflegen und vor allem auch nachzubessern.

Gerade in die Entwicklung sehr spezieller, aufgabenbezogener Retrieval-Software haben die Anwender in der Vergangenheit viel Geist und Geld gesteckt. Sie werden sich hueten, beim Uebergang von den analogen zu den digitalen Archivsystemen dieses wertvolle Gut aufzugeben. Wenn beim Uebergang auf die digitale optische Speichertechnik haeufig laenger gezoegert wird, so ist zumeist hierin der Grund dafuer zu suchen.

Mit einer modularen, individuell programmierbaren, als selbstaendige Einheit ausgefuehrten und mit intelligentem Cache versehenen Jukebox, die in die Welt der offenen Systeme passt, wuerde ein digitales Massenspeichersystem zur Verfuegung stehen, das auf alle absehbaren Neuerungen in idealer Weise zugeschnitten ist.

* Dr. Winfried Schmitz-Esser ist Professor fuer Mediendokumentation an der Fachhochschule Hamburg und unter anderem der Autor des Handbuches: "Der Computer in den Archiven der Massenmedien".