Stimmbiometrie im intelligenten Zuhause

Die Stimme ist der Schlüssel

Nils Lenke koordiniert bei Nuance verschiedene Forschungsinitiativen zur Entwicklung eines breiten Spektrums an Technologien und deren Verwendung in den Märkten Mobile, Automotive, Healthcare sowie Enterprise. Seine Hauptaufgaben umfassen die Forschung und Entwicklung von Software für Künstliche Intelligenz (KI), Maschinelles Lernen, Wissensrepräsentation, Spracherkennung, und natürlich-sprachliche Systeme. Er hält acht Patente für Erfindungen von Spracherkennungssystemen und spricht sechs Sprachen.
Sprache ist ein mächtiges Werkzeug – nicht nur für Dichter und CEOs, die Reden schwingen. Dank Stimmbiometrie kann heute jeder mit seiner Stimme Türen öffnen und Passwörter überflüssig machen.

Künstliche Intelligenz (KI) ist eines der Trend-Themen unserer Branche. Dabei gibt es die KI schon lange. Der Grund des Medienechos ist dennoch gerechtfertigt: Heute hat die Evolution „intelligenter“ Systeme einen neuen Höhepunkt erreicht und sich einen Platz in unserem innersten Heiligtum verdient – unserem Zuhause. Digitale Assistenten sind nicht mehr nur Teil des Smartphones. Sie stecken auch im Auto, im Smart TV oder in der Armbanduhr.

Mit Spracherkennung und Stimmbiometrie wird die Interaktion mit Maschinen menschlicher und noch effektiver.
Mit Spracherkennung und Stimmbiometrie wird die Interaktion mit Maschinen menschlicher und noch effektiver.
Foto: Shutterstock.com - a-image

Eine KI, die mit mir spricht

Doch nicht nur der Ort hat sich geändert. Auch die Art des Umgangs ist eine neue Erfahrung: KI interagiert mit uns. Die Systeme hinter der sympathischen Computerstimme einer Alexa, Siri oder Nina erkennen die Bedürfnisse ihrer Benutzer, erlernen ihre Präferenzen, gehorchen aufs Wort und schaffen auf diese Weise eine personalisierte Nutzererfahrung. So schafft es ein digitaler Assistent, unser Smart Home für uns von unterwegs zu steuern. Wenn wir dann zur Tür hineinkommen, ist das Licht schon an und die Feierabend-Playlist läuft.

Wir Deutschen haben es in unserer Freizeit am liebsten bequem. Laut der Stiftung für Zukunftsfragen schauen wir dann gerne fern, hören Radio, telefonieren oder surfen im Netz. Natürlich am besten von der Couch zuhause. Für alle Anbieter von Dienstleistungen und Technik bedeutet das: Von der Schaltzentrale Sofa aus sollte der Nutzer in der Lage sein, Smart-Home-Lösungen zu bedienen. Das gelingt unter anderem durch Sprachsteuerung, einer der natürlichsten und einfachsten Steuerungsformen für Technik. Die einfache Adaption ist auch der Grund, warum etwa im TV-Bereich Sprachbefehle bereits weit verbreitet sind.

Die Entwicklung geht nun dahin, die Stimme des Nutzers zu erkennen und damit zuordnen zu können. Wenn das Smart Home Device „weiß“, wer mit ihm redet, kann es dem Nutzer eine sehr persönliche Erfahrung bieten. Es geht aber auch um Sicherheit: Beim Online-Shopping etwa sollte das System nur die Bestellungen des Nutzers aufnehmen und nicht jeden hereingerufenen Wunsch eines Gastes erfüllen. Wenn Stimmen nicht genau zugeordnet werden, könnte versehentlich auch Hintergrundlärm als Eingabe erkannt werden – etwa das laufende Fernsehprogramm, wie schon bei Google und Alexa geschehen.

Stimmbiometrie als Schlüssel zum Erfolg

Wie der Fingerabdruck ist auch das Profil der Stimme jedes Menschen einzigartig. Während dieses Merkmal bei der Spracherkennung lästig ist – hier möchte man sich auf den Inhalt des Gesagten konzentrieren und muss dabei mit der Variabilität menschlicher Sprache klarkommen – ist es bei der Stimmbiometrie eine sehr erwünschte Eigenschaft. Beide Technologien, Spracherkennung und Stimmbiometrie, nutzen „Deep Learning“ auf der Basis von Neuronalen Netzen, wobei die Netze während des Trainings lernen, auf unterschiedliche Aspekte zu achten.

Diesen „Stimmabdruck“ eines Menschen können intelligente Systeme mittlerweile nutzen, um den Sprecher eindeutig zu identifizieren. Über 150 Millionen Menschen nutzen diese einfache Authentifizierung mittels Stimmbiometrie bereits, etwa bei Banking-Systemen oder Callcenter-Lösungen, wo die Stimme zum Passwort wird. Dank dieser Kombination von KI und Stimmbiometrie muss der Smart-Home-Bewohner nur noch „Hallo“ sagen – wahlweise auch „Sesam öffne dich“ – und sein Smart Home wird sich automatisch auf seine Präferenzen einstellen.

Opus Research geht davon aus, dass es im Jahr 2020 mehr als 500 Millionen Stimmabdrücke geben wird. Nutzer werden verschiedene Anwendungen alleine durch ihre Stimme bedienen können. Stimmbiometrie, also die Erkennung der Sprache als biometrische Authentifizierung, ist eine leistungsstarke Schnittstelle für zahlreiche Dienstleistungen und Geschäftsbereiche; dabei erfordert sie nur minimale Investitionen in Hardware. Von allen biometrischen Merkmalen wie Fingerabdruck und Iris-Scan gilt die Sprache als das beste und einfachste Merkmal für die Authentifizierung, weil es ohne Berührung auskommt. Dies weisen unter anderem Oinam Joymala und Neha Khare in ihrer Studie zur Sicherheit im Smart Home nach.

Unzählige Einsatzmöglichkeiten

Was man alles mit der Stimme machen kann, wissen wir noch nicht. Die Möglichkeiten sind nahezu endlos – ein paar Einsatzszenarien kennt man jedoch bereits, etwa das klassische „OK, Google“ oder „Alexa, wie spät ist es?“. Doch Stimmbiometrie kann deutlich mehr. Wie wäre es etwa, nie wieder einen Hausschlüssel zu brauchen? Die Aussage „Meine Stimme ist mein Passwort“ genügt, um die Tür zum Smart Home aufschwingen zu lassen. Anschließend geht automatisch das Licht an, die Raumtemperatur wird nach Wunsch des Bewohners geregelt und der Fernseher startet automatisch das gewünschte Programm.

Übrigens ist Sprache nicht nur im Smart Home wichtig. Auch im Online-Handel ist die Authentifizierung durch Stimmbiometrie von entscheidender Bedeutung: Die Stimme stellt sicher, dass keine Bestellungen unter falschem Namen getätigt und Kreditkartendaten schnell verifiziert werden können. Auch die Unterhaltungsindustrie profitiert, denn ein einfacher Sprachbefehl des Kunden reicht aus, um eine Transaktion zu verifizieren – und ersetzt die lästige Passworteingabe.

Während des Autofahrens zu telefonieren ist dank Freisprecheinrichtung (auch rechtlich) kein Problem mehr. Weitere Aktionen am Smartphone, wie etwa das Verfassen einer kurzen Email oder im Stau das Abendessen per App zu bestellen, werden hingegen zur Herausforderung. Spätestens bei der Bezahlung müsste der Fahrer auf das Display schauen und Passwort oder Bezahldaten bestätigen. Stimmbiometrie erlaubt eine Authentifikation, ohne die Hände vom Lenkrad zu nehmen.

Fazit: Das Internet der Dinge besser nutzen

Über die Stimmbiometrie ist schon heute sicher, dass sie Authentifikationsprozesse einfacher und sicherer macht. Dank ihr können wir das Internet der Dinge noch effizienter nutzen und uns den Alltag selbst vereinfachen: das eigene Haus sichern und steuern, zugreifen auf alle Geräte und Daten von überall, personalisiert einkaufen – alles mit der eigenen Stimme. Stimmbiometrie ist der nächste Schritt, das Potenzial des Internet der Dinge voll auszuschöpfen und die Interaktion mit Maschinen menschlicher zu machen.