Digitales Video ist das Sesam-öffne-dich

27.11.1992

Seit etwa drei Jahren ist Multimedia Computing in aller Munde. Einen entsprechenden Durchbruch im Massenmarkt konnte dieses Konzept bislang aber noch nicht erreichen. Denn während die Preise für PC-Hardware immer weiter fallen, kosten Multimedia- Erweiterungen immer noch relativ viel Geld. Des weiteren fehlt es an Standards, die sowohl Anbietern als auch Anwendern eine gewisse Sicherheit geben würden. Und während die Integration von Grafik, Standbildern, Text und Ton, mittlerweile ganz gut funktioniert, ist in Sachen Videointegration noch einiges an Aufbauarbeit zu leisten. Gefragt sind preisgünstige und qualitative Möglichkeiten, Bewegt-Videos in Anwendungen einzubinden. Digitales Video soll hier Multimedia-Systemen Vorschub leisten.

*Mathias Ebert ist bei der Intel GmbH in Feldkirchen bei München zuständiger Produkt Manager für die DVI-Technologie und Multimedia.

Alles im Wunderland

Multimedia hat Pech: Professionelle Computeranwender können mit den Techniken - soweit verfügbar - noch nicht viel anfangen, und der unbedarfte Home-Anwender findet das Ganze zwar beeindruckend, aber ebensowenig nützlich. Essig ist es mit einer neuen Informatik-"Revolution", wie sie in Werbetexten versprochen wird.

Überdrehte Multimedia-Visionäre verbreiten euphorische Phantasien von individuellem Zugriff auf unbegrenzte Informationsmengen in jeder Form. Das Traumbild vom umfassend und in hoher Qualität informierten Menschen schafft einen Erwartungsdruck, dem einzelne Produkte nicht standhalten.

Natürlich, es gibt Anwendungen: Computer Based Training (CBT) etwa, oder Verkaufsunterstützungs- und Auskunftssysteme. Dazu kommen computerbasierte Pakete aus Heim- und Unterhaltungselektronik (Fax, Telefon, Anrufbeantworter, Radio, CD-Player, Mischpult, Video etc.). Wie groß der Markt ist, muß sich indes noch erweisen.

Professionell eingesetzte Multimedia-Realisierungen haben von vornherein einen stark eingeschränkten Benutzerkreis: Lernende, Verkaufskräfte und jene, die sich per Auskunftssystem über Hotels oder Freizeitangebote informieren lassen. Die Heimpakete dagegen werden Probleme haben, über den Spielzeugstatus hinwegzukommen: Niemand schleppt kopfhörerbewehrt einen PC zum Telefonieren durch die Wohnung. Privat gefaxt wird noch kaum. Und PCs mit CD-(ROM-)Laufwerk, UKW-Tuner und Aktivboxen-Anschluß werden die Stereoanlage nicht so bald aus der Schrankwand schubsen.

Dennoch könnte die Multimedia-Idee insgesamt kommerziell langfristig größere Bedeutung gewinnen, als es die einzelnen unter diesem Schlagwort rubrizierten Produkte bislang geschafft haben. Die Vision dagegen, alles werde anders, eine Ara mit neuer, besserer Informationsqualität ziehe herauf, wird sich als Halluzination entlarven. Es gibt gute Ideen in dem Feld, solche aber hatten die Erfinder von Legostein und Radiowecker auch. Eine Alltagsrevolution erfordert indes erschwingliche Produkte, die echte Grundbedürfnisse befriedigen.

Kreativ statt kommunikativ

Mit zunehmenden Einsatz von Multimedia-Technologien können Menschen sich auf kreative und produktive Tätigkeiten konzentrieren. Das vermuten jedenfalls die Marktforscher der Gartner Group.

Hinter dem Begriff Multimedia versteckt sich letztlich die alte Idee vom Computer als Universalmaschine. Der Multimedia-Rechner soll für die Integration aller technischen Geräte im Haushalt oder am Arbeitsplatz sorgen. Dies alles soll auch noch interaktiv funktionieren, das heißt, über ein ausgeklügeltes Interface hat der Anwender die Möglichkeit, wann immer er will, die totale Kontrolle über seine Systemumgebung auszuüben.

So weit, so gut. Was aber seit einigen Jahren Unternehmen und Medien als schöne neue Computerzukunft propagieren und auch die Anwender herbeisehnen, hat sich bislang noch nicht in echte Massenmärkte ausgebreitet.

Der Grund dafür liegt darin, daß beide Seiten - Anbieter und Anwender - sich in einer Art Teufelskreis befinden. Zunächst einmal fällt es an der installierten Hardwarebasis. Für Software-Entwickler ist das Risiko einfach viel zu groß, für einen eng umrissenen Anwenderkreis zu schreiben, der etwa mit einer ganz bestimmten Videokarte oder Soundkarte arbeitet. Dies lohnt sich zunächst nur für hochspezialisierte Einzelaufträge, wie etwa Aus- und Weiterbildungssysteme oder Informationssysteme.

Die Anwender wiederum kaufen kaum Hardware, weil es zu wenige Programme dafür gibt. Wenn also in einem Bereich einheitliche Standards vonnöten wären, dann beim Multimedia. Denn gerade hier müssen sämtliche an den Computer angeschlossenen beziehungsweise integrierten Medien vollständig vom Rechner gesteuert werden können.

Und schließlich müssen die Signale dieser Medien in digitalisierter Form vorliegen. Gerade bei Ton oder Videobild bedeutet diese Digitalisierung ein enormes Datenaufkommen: 18 bis 22 MB müssen pro Sekunde bewegt werden, das sind Raten die die Leistungsfähigkeit der meisten heutigen PCs und Grafikkarten überfordern.

Für die Wiedergabe von Videos wurden daher Video-Digitizer - etwa die "Screen Machine" des Münchener Unternehmes Fast Electronic - entwickelt, die im sogenannten Overlay-Verfahren das Videosignal am Bildschirm darstellen. Dabei wird das Videosignal auf der Karte in Echtzeit digitalisiert, der PC wird von diesem Rechenprozeß nicht belastet.

Das VGA-Signal der Grafikkarte wird ebenfalls in die Digitizer-Karte eingespeist. Für das Mischen der Signale wird ein Bereich des VGA-Signals ausgestanzt und vom Videosignal überlappt.

Anschließend wird das gemischte Signal an den Monitor übergeben, der das Videobild in einem frei skalierbaren und beliebig positionierbaren Fenster darstellt. Overlay-Karten machen es möglich, Videobilder aus beliebigen analogen Quellen (Videoband, TV, Camcorder) in Echtzeit am PC-Monitor darzustellen. Dabei bewältigt ein VGA-Monitor Videobilder in Echtfarbe (16,7 Millionen Farben).

Damit war zwar ein erster Schritt zur Videointegration getan. Ein Problem blieb jedoch ungelöst: das Speichern der digitalisierten Videos auf Festplatte und deren anschließender Wiedergabe. Zwar war es möglich, einzelne Bilder aus dem laufenden Video abzuspeichern, zusammenhängende Sequenzen ließen sich jedoch nicht in den Computer übernehmen.

Das Problem sind die anfallenden Datenmengen: Für eine Sekunde werden zwischen 18 und 22 MB, für eine Minute bereits über 1 GB und für 1 Stunde gar rund 65 GB auf der Festplatte belegt. PC-Festplatten sind dafür weder groß noch schnell genug. Multimedia-Systeme nutzten daher bisher analoge Videoquellen, etwa konventionelle Videorekorder oder Laserdisc-Player.

Kompression von Videodaten

Die Lösung für die Speicherproblematik ist die Kompression von Videodaten. Bei der Standardisierung solcher Kompressionsverfahren gelangen gerade in der letzter Zeit große Fortschritte. Grundsätzlich muß zwischen der Kompression von Stand- oder Einzelbildern und der von bewegten Bildern unterschieden werden. Bei Standbildern wird allgemein nach einem von der Joint Photographic Experts Group (JPEG) entwickelten Verfahren komprimiert. Im Prinzip werden dabei die vorhandenen Bildinformationen analysiert und Redundanzen ausgesondert.

Dies betrifft insbesondere die Informationen von gleichfarbigen Flächen im Bild, das heißt die Information Rot-Rot-Rot wird als 3xRot abgespeichert. So läßt sich die Datenmenge je nach Bildvorlage bis auf die Hälfte des Originalbildes reduzieren, ohne daß Bildinformationen verlorengehen ("Lossless Comprehension").

Größere Kompressionen sind mit einem realen Verlust von Bildinformationen verbunden ("Lossy Compression"). In welchem Maße dies geschieht, hängt vom Originalbild und von gewählten Kompressionsrate ab. Aufgrund des beschränkten Aufnahmefähigkeit des menschlichen Auges sind diese Verluste jedoch oftmals für den Betrachter nicht sichtbar. Für ihn sind Original und komprimiertes Bild identisch. Mit dem JPEG-Verfahren können je nach Vorlage Kompressionsraten von 10:1 bis 20:1 erreicht werden, ohne das der Eindruck des Bildes auf den Betrachter leidet.

Um höhere Kompressionsraten bei ausreichender Bildqualität zu erreichen, wurden auch für Bewegbilder Verfahren entwickelt. Die beiden wichtigsten sind DVI und MPEG (Motion Picture Expert Group). DVI (Digital Video Interactive) wurde ursprünglich von der RCA entwickelt. Die Patente wurden 1988 von Intel erworben. Dabei handelt es sich um ein sehr komplexes Verfahren, das aus einer Frame-differenzierten Algorithmus und einem Chipset besteht. Das MPEG Verfahren ist genaugenommen nur eine Untermenge von DVI. So stellt DVI eine programmierbare Prozessorbasis dar, auf der auch MPEG-Bilder laufen. Mit DVI- Technologie können Kompressionsraten von 160:1 erreicht werden.

Die Bildqualität erscheint trotz der hohen Kompressionsrate nur wesentlich schlechter, da das Verfahren auf die physiologischen Wahrnehmungsfähigkeiten des Menschen optimiert wurde. So kann etwa die Menge der speicherintensiven Farbinformationen drastisch reduziert werden, weil das menschliche Auge sehr viel sensibler auf Helligkeitsunterschiede als auf Farbdifferenzen reagiert .

DVI ist im Prinzip eine dreistufige Kompression, bei der verschiedene Kompressionsverfahren zum Einsatz kommen. Im ersten Schritt wird durch das schlichte Überspringen jeder zweiten Informationseinheit (Spalten und Reihen) das Originalbild auf ein Viertel seiner lnformation gebracht (Subsamp ling). Im zweiten Schritt erfolgt eine Intra-Frame-Kompression die dem JPEG Verfahren ähnelt. Der dritte und entscheidende Schritt ist eine Inter-Frame-Kompression, bei der Ähnlichkeiten zwischen aufeinanderfolgenden Bildern ausgenutzt werden. Bleibt etwa der Hintergrund in einer Sequenz gleich, wird er nur einmal gespeichert.

Da also nur jeweils die Veränderungen im Bild erfaßt werden müssen, steigt die Kompressionsrate erheblich.

Mit der jetzigen Generation von DVI-Multimedia stehen zwei Level von Videoqualität zur Verfügung. Das erste ist das Production Level Video (PLV) bei CD-ROM Datenrate (150 KB/s) mit etwa Heim-VHS-Videoqualität bei Vollbildabspielung. Einige Anwendungsentwickler skalieren die Abspielgröße etwas herab und erreichen damit eine gesteigerte Bildqualität, und das bei einer Informationsauflösung von 256x240 Bildpunkten, die sich in zukünftigen, rechenstärkeren Lösungen mit Sicherheit erhöhen wird. Aber Kompatibilität zum jetztigen PLV wird bewahrt bleiben.

Delivery- und Capture-Daughter-Board

Der zweite Level, Realtime Video (RTV), erlaubt die Aufnahme auf der Festplatte des PCs. RTV hat bei einer CD-ROM-Datenrate von 150 KB/s und bei Anzeige auf einem Viertel des Bildschirms etwa VHS Videoqualität. Bei Vollbild-Darstellung verringert sich die Bildqualität entsprechend. Allerdings ist RTV mit einer Erhöhung der Datenrate (Faktor 2-3) durchführbar. Dadurch gelingt es, die Qualität von PLV in etwa zu erreichen. Die Bildinformation hat eine Auflösung von 128x240 Punkten. Die Beschreibung des Bitstreams, also wie die Bildinformation in RTV abgelegt ist, wurde über die IMA (Interactive Multimedia Association) veröffentlicht. Für Programmierer ist es dadurch möglich, beliebiges digitales Bildmaterial in RTV und umgekehrt umzuwandeln.

DVI hat jedoch auch seine Einschränkungen. So sind für das Abspielen ein Delivery-Board und für die Aufnahme ein weiteres Capture-Daughter-Board notwendig. Nur so läßt sich die Datenflut beim Aufnehmen und Abspielen bewältigen. Weil aber dem 750B Chip bei der Aufnahme von Live-Video in Echtzeit nur begrenzte Rechenzeit zur Verfügung steht, kann auch das Capture-Board nicht die optimale Kompression erreichen.

Kompressionsraten zwischen 40:1 und 80:1

Intel unterscheidet daher zwei Kompressions-Modi. Mit dem Capture-Board kann jeder Anwender Livevideo aus Analogquellen im RTV-Modus digitalisieren, komprimieren und auf Festplatte abspeichern. Dabei werden Kompressionsraten zwischen 40:1 und 80:1 erreicht, zudem müssen gewisse Qualitätseinbußen in Kauf genommen werden.

Die im RTV-Modus erreichbaren Kompressionsraten reichen nicht aus, um CD-ROMs als Datenträger für digitales Videonutzen zu können. Dies ist erst mit der PLV-Kompression möglich.

Hier werden zwar Kompressionsraten von bis 160:1 erzielt, jedoch müssen die analogen Videos zur Digitalisierung an die Compression Center entweder in Princeton/USA oder beim TV-Produktionsunternehmen Teletota in Paris eingesandt werden. Hier geschieht die Kompression auf spezialisierten Parallelrechnern.

Der Zeitaufwand beträgt dabei wegen der aufwendigen Berechnungen ein Vielfaches der Spieldauer, das heißt, die Kompression erfolgt nicht in Echtzeit. Bei Videos, die später als Quelle für interaktive Applikationen dienen sollen, müssen vom Absender auch bereits jene Frames genannt werden, die die Applikation ansteuert, die sogenannten Hooks. Der Grund: Bei DVI liegen keine Einzel-Frames mehr vor, da bei der Inter-Frame-Kompression gleichbleibende Bildbestandteile nur einmal abgespeichert werden.

Trotz dieser Einschränkungen gilt: Mit der bei DVI möglichen Kompressionsrate wurde die wesentliche Schwelle für die Integration von Video auf dem PC überschritten: Es ist möglich, bis zu 70 Minuten Video auf CD-ROM zu speichern. Bei Standbildern bringt DVI sehr viel höhere Kompressionsraten als bisher, zudem kann auch Audio komprimiert und mit den Videodaten verschachtelt auf einer CD gespeichert werden. Diese CDs kann jeder DVI-fähige Computer abspielen. Nach Text, Grafik und Sound ist auch Video als letztes Medium auf digitalen Träger speicherbar und somit in den Computer integriert.

Standards werden nun aber einmal durch den Markt definiert, egal, wie gut oder schlecht die Technologie sein mag. Vielen De-facto-Standards - wie beim PC selbst - wurde der Weg durch einzelne Pionierfirmen gebahnt. Auf der Basis einer programmierbaren Hardware bietet die DVI-Technologie die Voraussetzung für die flexible Implementierung verschiedenster Standards. Mit jedem Aufkommen eines weiteren Kompressions-Algorithmus bestätigt sich dieses Konzept. So sind bereits jetzt neue Standards wie MPEG II, MPEG III und andere neue Ansätze im Gespräch.

Intel hat sich mit der DVI-Technologie zum Ziel gesetzt, die am meisten anpaßbare, die leistungsfähigste und die in Relation dazu preiswerte Basis für Multimedia zu entwickeln. Der Anwender von digitalen Daten, in welcher Form auch immer, darf in deren Nutzung nicht auf eine Auswahl von ihnen beschränkt sein.

Wenn die Ergebnisse dieses Konzeptes breite Anwendung finden, beabsichtigt das Unternehmen, die DVI-Technologie in die Entwicklung zukünftiger Standard-Mikroprozessoren einfließen zu lassen. Und schließlich war DVI bislang die einzige Technologie digitalen Videos, die auf beiden Standard-PC-Betriebsumgebungen lief: DVI-Zusatzboards werden sowohl für PCs mit Intel-Prozessoren als auch für den Apple-MacIntosh angeboten.

Während Hardware-basierte Videointegration zwangsläufig kostenintensiv ist, entstand in letzter Zeit mit "Software Only Video" eine alternative Lösung für den Multimedia-Einsatz, die geradezu optimal für den Massenmarkt geeignet zu sein scheint.

Einen ersten Schritt in diese Richtung machte Apple im vergangenen Jahr mit der Betriebssystemerweiterung "Quicktime". Damit stand Macintosh-Anwendern erstmals eine Softwarelösung zur Verfügung, die zwar keine Studioqualität liefert, aber dafür eine problemlose Videointegration erlaubte.

Eine ähnliche Lösung entwickelte Microsoft zunächst unter dem Konzept "Audio Video Interlaced" (AVI) für Windows-PCs, das vor kurzem unter dem Namen "Video für Windows" (VFW) als Erweiterung zu Windows offiziell angekündigt wurde (siehe CW Nr. 46 vom 13. November 1992, Seite 25: "Intel und Microsoft arbeiten im Bereich digitales Video zusammen"). Einen ähnlichen Schritt will Apple in nächster Zeit gehen und Quicktime ebenfalls für Intel-PCs anbieten.

Microsoft wiederum wird eine spezielle Konversationssoftware anbieten, mit deren Hilfe sich Quicktime Videos in das VFW-Format überspielen lassen. Damit werden einmal mehr die Grenzen zwischen beiden Hardware-Welten fallen, Applikationen lassen sich systemübergreifend erstellen beziehungsweise vorhandene Software kann problemlos zwischen Mac und Intel-PC übertragen werden.

Für die Verbreitung von Multimedia sind diese Software-Only-Lösungen möglicherweise der entscheidende Schritt. Diese Produkte gestatten es, Computeranwendern, die Vorteile von Multimedia auf einem relativ niedrigen Preispunkt zu genießen. Damit entsteht die Grundlage für den Multimedia-Markt, und Anwender werden sensibilisiert für die Integration von Ton, Bild und Film. Zusatz-boards können dann die Software-Algorithmen beschleunigen und deren Qualität durch Hardware-Unterstützung verbessern.

Wesentliche Elemente der DVI-Technologie wurden von Intel von der Hardwareseite zur Software portiert und stehen ab sofort als "Indeo-Video" Anwendern und Entwicklern zur Verfügung. Indeo stellt auch einen wichtigen Beitrag zu Microsofts Video für Windows dar. Mit diesem Angebot liegt ähnlich wie bei Apples Quicktime jetzt auch für PCs eine einfache, kostengünstige Lösung zum einbinden digitaler Videos in Standard-Benutzeroberfläche vor.

Indeo besteht in erster Linie aus Algorithmen, die eine Kompressions- und Dekompressions-Technologie bereitstellen. Die Größe der Dateien wird etwa um den Faktor 150 reduziert.

Auf einem PC mit einer CPU vom Typ 386DX-33 können bereits 15 Bilder pro Sekunde in einem 160x120 Pixel-Fenster abgespielt werden. Auf einem 486DX-33 lassen sich dann bereits 24 Bilder pro Sekunde abspielen.

Das wesentliche Element dieses Multimedia-Konzeptes liegt aber im universellen Einsatz der Videodaten: Ein und derselbe skalierbare Datenstrom kann sowohl wie oben beschrieben software-only aufgenommen und abgespielt werden als auch mit zusätzlicher Hardware, etwa den DVI-Boards.

Damit steht ein identischer, skalierbarer Datenstrom nicht nur Low-End-Anwendern und Multimedia-Eisteigern, sondern auch Usern mit größeren Ambitionen in besserer Bildqualität zur Verfügung. Beim Einsatz eines 750-Boards lassen sich die Videos auf 386-PCs und 486-PCs in Auflösungen bis zum 320x240-Pixel-Vollbild mit 30 (NTSC) oder 25 (PAL) Bildern pro Sekunde abspielen. Ein weiterer Vorteil der Hardware-Zusatzboards liegt darin daß die enthaltenen programmierbaren Algorithmen auch eine Anpassung an andere Video- und Grafikstandards ermöglichen. So unterstützen die DVI-Boards bereits jetzt die neue Photo-CD Format von Kodak.

Ein weiterer digitaler Video Standard der diese Photo-CD unterstützt ist CD-l von Philips ein Stand-alone-System, das auf dem Konsumwarenmarkt zielt. Es wird bis jetzt in einem geschlossenen System und ohne Bewegtbild-Video verkauft.

Eine andere Frage, die im Zusammenhang mit Multimedia- und digitalem Video für den Massenmarkt oft gestellt wirt ist die nach der Qualität. Es dürfte klar sein, daß VFW, DVI oder Quicktime keine Standards für die Gestaltung professioneller Videofilme sind. Hierfür gibt es in der Tat auch computergestützte Editiersysteme die aber wesentlich teuerer sind und auf ganz andere Marktsegmente zielen. Mit Video für Windows und Indeo steht dem gegenüber eine skalierbare Version von RTV zur Verfügung. Dadurch ist der gleiche Datenstrom als Software-Only- oder als Hardware-gestütztes Video abspielbar.

Multimedia-Stationen in ISDN- und Breitband-Netzen

KÖLN (pi) - Das Betriebswirtschaftliche Institut für Organisation und Automation an der Universität zu Köln (Bifoa) veranstaltet am 10. und 11. Dezember in Köln einfach Seminar "Betrieblicher Einsatz von Multimedia-Stationen in ISDN- und Breitband-Netzen". Leiter von Entwicklungsprojekten - auch aus dem europäischen Ausland - werden über ihre Entwicklung, Anbieter von derzeit marktgängigen ISDN- Konferenzsystemen und Anwender international tätigen Unternehmen über erste Anwendungserfahrungen berichten. Weitere Auskünfte erteilt das Bifoa-Veranstaltungssekretariat, Telefon 0221/47 603-33.