Conversational Interfaces

Innovationsführer, Ökosysteme und Potentiale in der Mensch-Maschine-Schnittstelle?

Kommentar  10.03.2017
Björn Böttcher ist Senior Analyst und Data Practice Lead bei Crisp Research mit dem Fokus auf Analytics, BI, datenbasierte Geschäftsmodelle und Künstliche Intelligenz. Mit mehr als 10 Jahren Berufserfahrung in der IT und einem wissenschaftlichen Hintergrund und Fokus stehen moderne Lösungen mit praktischem Nutzen im Fokus seiner Betrachtung.

Normal 0 21 false false false DE X-NONE X-NONE /* Style Definitions */ table.MsoNormalTable {mso-style-name:"Normale Tabelle"; mso-tstyle-rowband-size:0; mso-tstyle-colband-size:0; mso-style-noshow:yes; mso-style-priority:99; mso-style-parent:""; mso-padding-alt:0cm 5.4pt 0cm 5.4pt; mso-para-margin:0cm; mso-para-margin-bottom:.0001pt; mso-pagination:widow-orphan; font-size:11.0pt; font-family:"Calibri","sans-serif"; mso-ascii-font-family:Calibri; mso-ascii-theme-font:minor-latin; mso-hansi-font-family:Calibri; mso-hansi-theme-font:minor-latin; mso-fareast-language:EN-US;}
Conversational Interfaces bieten in vielen Bereich des Alltags und der Arbeitswelt eine Erleichterung in der Kommunikation. Der intuitive Zugang zu Daten und deren Verarbeitung wird durch die sprachliche Interaktion optimiert.

Am Anfang war das Wort

Sprache war von Anbeginn der Zeit eine wichtige Möglichkeit zur Verständigung mit anderen Artgenossen. Und selbst artübergreifende Kommunikation entdeckt man im Alltag. Denn mit den vierbeinigen Mitbewohnern redet man natürlich auch gerne. Wir haben technologisch ebenso eifrig versucht, die Sprache auf ein Medium zu bannen, um den Austausch von Informationen und Kunst dadurch über weite Entfernungen und in breiter Masse zugänglich zu machen. Wer erinnert sich nicht an Tonbänder, Schallplatten und Audiokassetten.

Mit Echo und Echo Dot gewinnt die Sprachsteuerung wieder an Bedeutung.
Mit Echo und Echo Dot gewinnt die Sprachsteuerung wieder an Bedeutung.
Foto: Amazon

Zugegeben, beinahe wäre eine Generation herangewachsen, die keines der besagten Medien mehr gekannt hätte, jedoch konnte diese Gefahr gebannt werden. Selbst die Kassetten erhalten wieder einen Auftrieb. Nach einer aktuellen Erhebung des Billboard Magazins gab es eine Absatzsteigerung von 74 Prozent in 2016. Dies zeigt, dass Technologien manchmal doch länger durchhalten oder wiederaufleben. Und auch ist dies ein Indiz dafür, dass Sprache und Gesang uns überall begleiten in unserem Leben. Wenn wir uns überlegen, wie viel Zeit ich mit dem Schreiben und Sie dann im Anschluss mit dem Lesen verbringen, dann ist dies in der Tat eine ineffiziente Form des Informationsaustauschs. Direkter und effizienter ginge dies über eine Tonspur.

Bots, Alexa und Co.

Was wurde zu Zeiten der USS Enterprise die Interaktion mit dem Computer bewundert. Der Protagonist musste nur das Aktivierungswort „Computer“ benutzen, um die Maschine dazu zu bewegen eine Handlung auszuführen oder eine Frage zu beantworten. Auch den Tee konnte man sich so zubereiten lassen - natürlich inklusive der Tasse.

Testen Sie Ihr IoT-Grundwissen

Was früher wie Science-Fiction klang, ist in der Tat gar nicht mehr so weit weg. Ich kann in der Tat eine Tasse ausdrucken lassen und sicherlich auch eine Vorrichtung konstruieren, welche mir das Einschenken von Wasser und Tee selbst ermöglicht. Dies alles mit einer Sprachsteuerung zu versehen, ist auch möglich. Lediglich die Geschwindigkeit mit der ein Besatzungsmitglied des Raumschiffs dies umsetzen konnte, fehlt noch ein wenig.

Ermöglicht wird dies durch die technologische Evolution im Bereich des 3D-Drucks, des Machine Learnings, der Netzwerktechnologie und von IoT-Geräten. Die Sprachsteuerung oder vielmehr die Interaktion mit einem Interface durch das Medium Sprache, ist durch Siri (Apple) wieder in den Vordergrund gerückt. Populärer ist zurzeit jedoch Alexa, welche in dem Echo und Echo Dot Geräten aus dem Hause Amazon brav den Dienst verrichtet. Egal, ob Deutsch oder Englisch angesprochen und gefragt, die nette weibliche Stimme antwortet, sofern dies in ihren Möglichkeiten liegt.

Ökosysteme und die Innovationskraft

Doch wie weit sind die Möglichkeiten dieser Assistenten und der Conversational Interfaces? Nun die Stärke des Assistenten liegt in seinem Backend. Dies umfasst zum einen das Verständnis des gesprochenen Worts in Gänze und zum anderen ist der Kontext wichtig, um die korrekte Reaktion einleiten zu können. Ein Assistent wird umso mächtiger, je mehr Anschluss er bekommt. Damit ist das Ökosystem von enormer Bedeutung.

In den USA gab es im Januar 2017 bereits 6884 kategorisierte Skills für Alexa.
In den USA gab es im Januar 2017 bereits 6884 kategorisierte Skills für Alexa.
Foto: Crisp Research

Wenn man sich die aktuelle Untersuchung der Alexa Skills, so nennt man die Fähigkeiten, welche Sie bereitstellen kann, anschaut, dann fällt auf, dass es in den USA aktuell 6884 kategorisierte Skills gibt. In Deutschland sind es immerhin schon 507 dieser Skills. Eine genauere Betrachtung der Verteilung der Skills auf die Kategorien zeigt, dass in den USA die meisten Fähigkeiten aus den News (2203), Games, Trivia & Accessories (1826) und Education & Reference (1269) kommen. In Deutschland sind dies die Bereiche Neuheiten & Humor (56), Bildung und Nachschlagewerke (86), sowie Spiele, Quiz & Zubehör (103).

In Deutschland steigt die Anzahl der Skills für Alexa langsam aber sicher an.
In Deutschland steigt die Anzahl der Skills für Alexa langsam aber sicher an.
Foto: Crisp Research

Diese jeweils drei Kategorien stellen ungefähr 50 Prozent der angebotenen Skills. Damit ist die treibende Kraft der Innovationen klar der Konsument. In seiner Rolle als Technik verliebter Mensch, interagiert man gerne mit neuen und lässt der Kreativität freien Lauf. Durch Technologien, wie Serverless Architekturen, sind auch schnelle neue eigene Skills mit ein wenig Programmieraufwand hinzugefügt. Dabei sprechen wir heutzutage nicht mehr von Monaten, sondern von Stunden.

Durch Technologien, wie Serverless Architekturen, sind auch schnelle neue eigene Skills mit ein wenig Programmieraufwand hinzugefügt, die Taktrate erhöht sich.
Durch Technologien, wie Serverless Architekturen, sind auch schnelle neue eigene Skills mit ein wenig Programmieraufwand hinzugefügt, die Taktrate erhöht sich.
Foto: Crisp Research

Glauben Sie nicht? Doch in der Tat sind es vom Auspacken des Gerätes bis zur Erstellung eigener Skills nur ein paar Stunden. Vorausgesetzt man hat ein wenig Programmiererfahrung. Doch auch Templates können verwendet werden, um eigene Skills zu erstellen. Die Digitalisierung schlägt also mit brachialer Geschwindigkeit zu.

Mit diesem Wissen und der Erfahrung steigt dann natürlich auch der Erwartungsdruck, wenn es dann an den Arbeitsplatz geht. Wo im heimischen Umfeld Musik gehört oder die Heizung über den sprachgesteuerten Assistenten geregelt wird, soll auf Arbeit dann ein Ersatzteil bestellt oder ein Dokument im Workflow weiterbearbeitet werden können.

Was ebenso wichtig ist, wie die Integration möglichst vieler Schnittstellen, ist auch die Überschreitung von Unternehmensgrenzen. So wäre es sicherlich hilfreich, wenn Alexa auch googeln könnte, um die Verbreitung noch weiter voranzutreiben und die Fähigkeiten noch mehr an den Alltag des Konsumenten anzupassen. Eine wichtige Rolle werden daher gerade im Kontext der Conversational Interfaces noch integrierte Cloud Plattformen einnehmen, da diese die Bündelung von unterschiedlichsten Quellen ermöglichen.