Max-Planck-Forschung

Computeranimierte Wesen werden realistischer

22.12.2009
Von pte pte
Forscher des Max-Planck-Instituts für biologische Kybernetik haben gezeigt, dass man einen Gesichtsausdruck live oder in einem Film viel besser erkennen kann als auf einem Foto.

Um die Stimmung der dargestellten Personen zuverlässig deuten zu können, muss ein Film mindestens eine Zehntel-Sekunde lang sein, berichten die MPG-Forscher im "Journal of Vision". Die aktuellen Forschungsergebnisse könnten dazu beitragen, dass computeranimierte Wesen in Zukunft realistischer und glaubwürdiger aussehen. Auch in der digitalisierten Welt findet ein Großteil der Kommunikation im direkten Austausch mit dem Gegenüber statt. Damit man vom anderen verstanden wird, setzt man nicht nur die Stimme, sondern zusätzlich ein vielfältiges Repertoire an Gestik und Mimik ein. Auch wenn letzteres meist mehr oder weniger unbewusst geschieht, ist es essenziell, damit sich unser Gesprächspartner in uns hinein versetzen kann.

Um zu untersuchen, in wie weit die Stimmungen eines Gesprächspartners anhand der Mimik erkennbar sind, haben die Forscher Probanden Bilder von Menschen mit unterschiedlichen Gesichtsausdrücken vorgespielt. Darunter befanden sich einfache emotionale Ausdrücke wie glücklich und traurig, aber auch komplexere wie Zustimmung, Verwirrung oder Überraschung.

Um zu vergleichen, ob bewegte oder statische Bilder besser erkannt werden, wurde den Testpersonen sowohl eine kurze Videosequenz der Mimik vorgespielt als auch ein Bild derselben gezeigt. Die Probanden mussten anschließend jeweils eine Emotion dem Bild oder der Videosequenz zuordnen. Außerdem wurde ihnen eine Bilderreihe einer Mimik gezeigt. Trotz der Bilderfolge erkannten die Probanden die Gestik auf der Filmsequenz besser.

Um heraus zu finden, inwiefern das Erkennen der Mimik von der Bewegung abhängig ist, hat das Forscherteam den Probanden eine Videosequenz mit 25 Bildern pro Sekunde vorgespielt. In einer weiteren Versuchsreihe wurden jedoch die einzelnen Bilder durcheinander gewürfelt und erneut abgespielt. Auch diesmal haben die Testpersonen die Mimik in den Originalvideosequenzen besser erkannt.

Das macht deutlich, dass weder mehrere Bilder noch die Bewegung allein von Bedeutung sind, sondern die Kombination der richtigen Reihenfolge und der dynamische Ablauf der Gesichtsbewegungen. Wichtig ist zudem auch die zeitliche Richtung. Wurden die Filmsequenzen rückwärts abgespielt, konnten die Testpersonen die Stimmung deutlich schlechter erkennen.

"Gesichtsausdrücke sind ein dynamisches Phänomen und müssen, genauso wie Körperbewegungen oder Gesten, mit Hilfe von Videos untersucht werden, um ein genaues Bild von der Verarbeitung dieser wichtigen kommunikativen Signale erstellen zu können", so Studienleiter Christian Wallraven. "Unsere Ergebnisse haben auch für die Computeranimation eine große Bedeutung, da es deren Ziel ist, künstliche Avatare und Gesichtsanimationen zu schaffen, die vollkommen realistisch und glaubwürdig kommunizieren können", erklärt der Physiker und Wahrnehmungswissenschaftler. (pte)