Nun ist auch Amazon auf den GenAI-Zug aufgesprungen: In einer aufwändigen Demo im Headquarter in Arlington, Virginia, demonstrierte der Konzern, wie der Bot auf natürlich sprachige Anfragen reagiert und ganz ohne Befehlsphrasen Filme empfiehlt oder Smart-Home-Routinen ausführt. Dave Limp, der scheidende Leiter von Amazons Devices-Geschäft, musste dazu nicht einmal mehr das Signalwort "Alexa" aussprechen. Die Antworten klingen nun deutlich frischer und spontaner.

Für Amazon-Manager Limp war die Ankündigung der neuen Alexa-Generation eine seiner letzten Amtshandlungen. Er wird das Unternehmen verlassen und aller Voraussicht nach durch Microsoft-Manager Panos Panay ersetzt. Panay war 19 Jahre bei Microsoft und hatte dort das Devices-Geschäft betreut. Er stand regelmäßig auf der Bühne, wenn es neue Surface-Rechner anzukündigen galt. Auch Windows 11 wurde unter seiner Regie entwickelt.

Mit Alexa-Speakern erreicht Amazon den Zugang zu Endusern

Was die neuen Alexa-Funktionen betrifft, soll eine Preview in diesem Herbst für Haushalte mit vorhandenen Echo-Lautsprechern oder Fire-TV-Produkten erscheinen. Laut Amazon wird sogar noch der erste Echo-Speaker von 2014 kompatibel mit der neuen KI-Generation sein. Wie das Wall Street Journal vermutet, ist die überarbeitete Alexa-Variante keinesfalls nur Spielerei: Amazon versuche, seine Attraktivität an der Benutzerschnittstelle zu erhöhen, um das Konsumentenverhalten besser analysieren zu können.

Das Alexa-Geschäft läuft für den E-Commerce-Riesen seit Jahren gut: Die Echo-Geräte sind die weltweit beliebtesten Smart Speaker. Viele User haben sich daran gewöhnt, auf Sprachbefehl das Licht einzuschalten oder Musik abzuspielen. Laut Limp wurden im Laufe der Zeit fast eine Milliarde Geräte gekauft, die mit Alexa verknüpft sind.

ChatGPT setzt Amazons Alexa-Business allerdings unter Druck: Die von OpenAI entwickelte generative KI beantwortet Fragen nicht mehr nur mit vorgefertigten Antworten, sondern ist in der Lage, durchaus komplexe Dialoge zu führen. In einer Fire TV-Demo bat Daniel Rausch, Vice President für Alexa und Fire TV, den Assistenten, "ein paar Actionfilme zu finden", und fügte hinzu: "Zeige mir die, für die ich nicht bezahlen muss." Er bekam eine Liste von Actionfilmen von verschiedenen Streaming-Anbietern angezeigt, für die er ein Abo besitzt.

Antwortzeiten sind Alexas großes Problem

Eine technische Hürde für Alexa sind die Latenzen. Wenn Menschen Prompts in ChatGPT oder Microsofts Bing Chat eingeben, kommt es zu einer Verzögerung, bevor die Antwort eintrifft. Am Bildschirm mag das erträglich sein, bei einer gesprochenen Konversation, können die Pausen nerven. Amazon sagte, man habe hart daran gearbeitet, die Verzögerungen zu reduzieren. Offenbar hat das Unternehmen erkannt, dass niedrige Latenzzeiten der Schlüssel zum Erfolg des neuen Alexa-Bots sind.

Amazon hat nach Unternehmensangaben die Gen-AI-Funktionen von Alexa so konzipiert, dass Kernaufgaben im Mittelpunkt stehen, die auch heute schon abgedeckt werden: Nachrichten, Smart-Home-Steuerung und Home Entertainment etwa. Wie bei ChatGPT können die User Alexa bitten, Gedichte und Geschichten zu erfinden oder Nachrichten zusammenzufassen. "Bei einem großen Sprachmodell besteht immer das Risiko, dass es Halluzinationen gibt", warnte Rausch vor fehlerhaften Ergebnissen. Amazon habe aber "einige sehr spezifische Dinge" vorgenommen, um korrekte Angaben hervorzubringen. "Es kann aber sein, dass wir es nicht immer richtig machen", zeigte sich der Amazon-Manager vorsichtig.

Amazon kennt das Risiko, dass Alexa eine Aufforderung falsch interpretiert, was dann zum Beispiel dazu führen kann, dass sich mitten in der Nacht das Garagentor öffnet. Deshalb schränkt der Konzern diese neue Ebene der Kontrolle erst einmal ein. Die erste Preview mit GenAI wird nicht in der Lage sein, sensible Sicherheitssysteme wie intelligente Schlösser oder Garagentore zu steuern. Diese Funktionen sollen aber später folgen.

Amazon stellte in seiner Präsentation auch neue Hardware vor, darunter den Echo Hub und einen neu gestalteten Echo Show 8. Wie alle Echo-Produkte mit Bildschirmen, Kameras und Näherungssensoren werden auch diese neuen Geräte über GenAI-Funktionen verfügen. Beispielsweise lässt sich einstellen, dass sich eine Anzeige auf dem Display ändert, wenn eine Person näherkommt, oder Alexa wird automatisch aktiv, wenn jemand in die Kamera schaut. (hv)