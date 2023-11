Noch während des Hin und her um den früheren und neuen CEO Sam Altman und seine Gefolgschaft, hat OpenAI relativ diskret die vor zwei Monaten angekündigte Funktion ChatGPT Voice für alle Nutzer ausgerollt. Die kurze Ankündigung machte der zum Zeitpunkt des Announcement eigentlich geschasste President Greg Brockman, aber vermutlich hatte nicht mal er den Überblick über seinen aktuellen Beschäftigungsstatus behalten.

ChatGPT Voice rolled out for all free users. Give it a try — totally changes the ChatGPT experience: https://t.co/DgzqLlDNYF — Greg Brockman (@gdb) November 21, 2023

Wie der Name bereits andeutet, ermöglicht ChatGPT Voice den Nutzern der mobilen App, dem KI-Chatbot per Spracheingabe Fragen zu stellen. ChatGPT antwortet darauf mit einem Audio-Output. OpenAI nutzt dazu ein Text-to-Speech-Modell, das basierend auf Text und einigen Sekunden langen Sprachproben sehr menschlich klingende Stimmen generieren kann. Nach eigenen Angaben arbeitete das Unternehmen mit professionellen Synchronsprechern zusammen, um fünf verschiedene Stimmen zu generieren. Für die Transkribierung verbaler Äußerungen in Text kam das hauseigene Open-Source-Spracherkennungssystem Whisper zum Einsatz.

5 Stimmen zur Auswahl

Um das Feature zu nutzen, muss man in der mobilen App für Android und iOS die Einstellungen öffnen und unter "Neue Funktionen" das Feature "Spracheingabe" auswählen. Nach dem Aktivieren taucht im Chatverlauf in der rechten unteren Ecke des Screens ein Kopfhörer auf. ChatGPT bietet fünf Stimmen mit unterschiedlichen Charakteristiken zur Auswahl an.

Wie ein Kurztest zeigte, akzeptiert der KI-Chatbot auch bereitwillig Sonderwünsche wie einen bayerischen oder schottischen Dialekt - ohne diesen aber tatsächlich zu "sprechen". Ansonsten antwortet der Bot relativ zügig und präzise. Je nach Stimmauswahl ist ChatGPT - subjektiv betrachtet - auch weniger steif und formell als sein schriftliches Pendant. Interessanterweise reagiert ChatGPT Voice dabei nicht nur auf Sprache, sondern auch Geräusche. Nach einem kleinen Huster erklärte der Chatbot, dass er zwar kein Arzt sei, aber anhaltender Husten verschiedene Ursachen haben könnte. Um im Anschluss zu fragen: "Haben Sie andere Symptome bemerkt oder bereits einen Mediziner konsultiert?"

Um sich solche neugierigen Fragen zu ersparen, sollte man daher bei Nichtbenutzung darauf achten, die Aufnahmefunktion zu stoppen oder die App ganz zu schließen.