Automatisierte Workflows

Bots und Assistenten auf dem Vormarsch

Björn Böttcher ist Senior Analyst und Data Practice Lead bei Crisp Research mit dem Fokus auf Analytics, BI, datenbasierte Geschäftsmodelle und Künstliche Intelligenz. Mit mehr als 10 Jahren Berufserfahrung in der IT und einem wissenschaftlichen Hintergrund und Fokus stehen moderne Lösungen mit praktischem Nutzen im Fokus seiner Betrachtung.

Bots und Assistenten wie Siri, Ok Google oder Cortana sind aktuell nur bedingt und für einen vertikalen Anwendungsfall zu gebrauchen. Mit der nächsten Generation von Bots können dank Machine Learning auch gesamte Workflows automatisiert werden.
Mit aktuellen Chatbots kann man bereits im Messenger Flugtickets buchen.
Mit aktuellen Chatbots kann man bereits im Messenger Flugtickets buchen.
Foto: Zapp2Photo - shutterstock.com

Wie häufig sprechen Sie mit ihrem Smartphone, wenn kein anderer Mensch in der Leitung ist? "Hey Siri" oder "Ok Google" sind Ihnen nicht unbekannt? Sie sprechen also mit Maschinen? Nun ich mache es gerade. Ich diktiere diesen Text in meinen Computer. Wenn ich mich zurück erinnere an die Zeiten, wo ich mir ein teures Headset und die dazugehörige Software kaufen musste, diese dann nach der Installation stundenlang trainieren durfte, damit das Diktat dann einigermaßen funktioniert, so bin ich froh, dass heutzutage nur noch ein Knopfdruck oder ein "Hotword" zum Diktieren notwendig ist. Diese sogenannten Bots und Assistenten sind jedoch aktuell nur bedingt und nur für einen vertikalen Anwendungsfall zu gebrauchen. Meistens beschränkt sich dieser auf die Suche.

Siri konnte als eines der ersten Systeme eine breite Masse von Menschen begeistern, unterstützen - und natürlich belustigen.
Siri konnte als eines der ersten Systeme eine breite Masse von Menschen begeistern, unterstützen - und natürlich belustigen.

Von Siri, Ok Google und Co.

Mit Siri ging nicht alles los, aber Siri konnte als eines der ersten Systeme eine breite Masse von Menschen begeistern, belustigen und unterstützen. Denn ein Assistent wie Siri hilft dabei Dinge zu erledigen, für die man eben gerade keine Hand frei hat. Der klassische Anwendungsfall ist die SMS oder E-Mail im Auto. Auch ein Termin ist schnell diktiert und eingetragen. Jedoch nur, wenn man sich mit Standardtools im Ökosystem des Anwenders bewegt.

Doch auch das Verständnis ist manchmal nicht so einfach. Denn die Sprache ist aktuell noch eine große Hürde. Dies gilt für Apple, Google, Amazon und Microsoft. Eben für alle. Während Schlüsselwörter recht gut verstanden werden, ist ein Akzent schon mal hinderlich. Schwierig wird es, wenn die gewünschten Wörter noch in einer anderen Sprache geborgt sind. Dann kann auch ein einfacher Tweet schnell zu einem Problem werden, den man nur mit einer manuellen Korrektur auflösen kann. Hier sollte z.B. ein Tweet mit dem Hashtag #machinelearning versehen werden. Nun es ist ein Maschinenring geworden und Siri hilft mir auch nur beim Tüten und somit nicht beim Twittern.

Die beste Spracherkennung hat meiner Auffassung nach Google. Auf der Google Konferenz io16 wurde bekannt gegeben, dass 20 Prozent der Suchanfragen über das Smartphone per Sprache gestellt werden. Wenn ich über mein persönliches Umfeld nachdenke, so fallen mir schon Menschen ein, die dazugehören. Und überraschenderweise nicht unbedingt junge Menschen. Google hat den Vorteil, dass es durch sehr clevere strategische Schachzüge die richtigen Daten erheben konnte, um zum Beispiel das Sprachverständnis einer Maschine gut anlernen zu können. Microsoft hat auf der anderen Seite dies hervorragend für die Handschriftenerkennung trainiert.

So hat jeder Anbieter eine Strategie und unterschiedlich gute Assistenten oder Bots, die mehr oder weniger hilfreiche Dinge für den Menschen im Alltag erledigen können. Kritisch wird es immer, wenn die Assistenten das Ökosystem verlassen. Auch sind die Komplexität und die Anzahl der Fragen, die man stellen kann beschränkt. Ein paar nette kleine Spielereien sollen helfen dem persönlichen Assistenten ein wenig "menschlicher" wirken zu lassen, wenn Siri zum Beispiel eine Geschichte erzählen soll. Und auf Konkurrenz reagieren die Systeme auch ein wenig verwirrt.

Viv, Cortana und Allo - Next Generation Assistenten

Einige ehemalige Entwickler von Siri haben einen neuen Assistenten entwickelt, der automatisch ein wenig Programmcode erzeugen kann, um für den gewünschten Kontext der Anfrage eine Antwort erzeugen zu können. Diese dynamische Programmerzeugung hilft dabei, komplexere Fragestellungen zu beantworten oder Aufgaben zu erledigen, die auf ein gewisses personalisiertes Wissen vom Nutzer beruhen.

Ein demonstriertes Beispiel war die Bestellung und Bezahlung durch den Assistenten von Blumen für die Mutter des Referenten. Mit zwei Sprachbefehlen war dieser Prozess vollständig abgeschlossen. Auch Microsofts Cortana kann mehr Kontext in Anfragen miteinbeziehen und auch Aufgaben gezielter abarbeiten. So weiß der Bot z.B. wenn ich nach einem Restaurant suche, welche Speisen ich bevorzuge und schlägt dann direkt ein italienisches Restaurant in der Nähe vor.

Auch hier sind natürlich persönliche Daten des Nutzers notwendig. Google hat mit Allo einen neuen Assistenten vorgestellt, der auf den aktuellen Machine-Learning-Verfahren des Konzerns beruht. Dieser ist sehr interaktiv und verbindet viele Informationen des Nutzers mit denen der gesamten Nutzer aus dem Google-Universum. So ist es beispielsweise durch die Nutzung von 200 Millionen Nutzern des Google Fotodienstes möglich gewesen, Bilder und deren Inhalte von Maschinen erkennen zu lassen. Dadurch kann nun auch auf eine Bildnachricht eine Antwortoption vorgeschlagen werden.

Bei allen neuen Bots und Assistenten spielen die Daten eine wichtige Rolle. Daher ist die Frage nach der Datenethik bedeutsamer als je zuvor. Daten sind überall. Unternehmen müssen klar kategorisieren, ob Daten, die zwar durch technische Möglichkeiten erhoben werden können, auch aus rechtlicher und ethischer Sicht zu verwenden sind. Bei Google stellt beispielsweise die Menge der Daten über die Gesamtanzahl der Nutzer einen entscheidenden Mehrwert bereit.

Kategorisierung zur Datenethik
Kategorisierung zur Datenethik
Foto: Crisp Research 2016

Inhalt dieses Artikels