Avatare für Videokonferenzen

Nvidia baut KI für bessere Videokompression

15.10.2020
Von 
Heinrich Vaske ist Editorial Director von COMPUTERWOCHE und CIO. Seine wichtigste Aufgabe ist die inhaltliche Ausrichtung beider Medienmarken - im Web und in den Print-Titeln. Vaske verantwortet außerdem inhaltlich die Sonderpublikationen, Social-Web-Engagements und Mobile-Produkte und moderiert Veranstaltungen.
Nvidia hat eine KI entwickelt, die Videodaten deutlich besser komprimieren kann als bisherige Techniken. Das könnte vor allem Videokonferenzen zugute kommen.
Bessere Bildqualität auch bei schlechter Verbindung? Nvidia will das mit "AI Video Compression" möglich machen.
Bessere Bildqualität auch bei schlechter Verbindung? Nvidia will das mit "AI Video Compression" möglich machen.
Foto: Nvidia

Nvidia will mit Hilfe von "AI Video Compression" die Datenrate beim Videostreaming deutlich reduzieren und für eine bessere Bildqualität auch bei schlechter Netzverbindung sorgen. Der Trick besteht darin, die Übertragung von Videodaten auf bestimmte Punkte im Gesicht, zum Beispiel Mund, Nase oder Augenbrauen, zu begrenzen. Ein sogenanntes Generative Adver­sarial Network (GAN) errechnet dann aus diesen Punkten und einem zuvor übertragenen Referenzbild das Gesicht des Teilnehmers.

Gegenüber dem Datenstrom, den der H.264-Standard zur Videokompression erzeugt, ist die Datenrate viel geringer, sodass bei schlechten Verbindungen eine deutlich bessere Darstellung möglich ist. Allerdings hat man es dann auch mit einem "errechneten" Gesicht zu tun, die Proportionen können ein wenig verschoben und die natürliche Anmutung verzerrt sein.

Avatare in Videokonferenzen?

Das Verfahren, das die Übermittlung eines komprimierten Videostreams gegen ein Rechenverfahren, das auf einem neuronalen Netzwerk basiert, eintauscht, könnte dazu führen, dass künftig Avatare die Konferenzteilnehmer repräsentieren. So hat Nvidia eine animierte Figur gezeigt, die den menschlichen Gesprächspartner durch eine Comicfigur ersetzt und dabei seine Bewegungen übernimmt. Da die Schlüsselstellen des Gesichts für jegliche Berechnungen vorliegen, können damit auch andere Bilder und Animationen in Bewegung versetzt werden – was für Fälscher ein ganz neues Betätigungsfeld werden dürfte.

Neu ist die Erfindung nicht: Apple bietet mit seinen KI-basierten Animojis eine ähnliche Nutzererfahrung. Mit einer Rotationsfunktion lassen sich die Gesichter auch räumlich so ausrichten, dass sie in die Kamera blicken, während der Nutzer knapp daneben auf seinen Bildschirm starrt. Das kann nützlich werden, wenn Monitor und Kamera nicht perfekt aufeinander abgestimmt sind.