Für Android und iOS

ChatGPT Voice allgemein gratis verfügbar

22.11.2023
Von 


Manfred Bremmer beschäftigt sich mit (fast) allem, was in die Bereiche Mobile Computing und Communications hineinfällt. Bevorzugt nimmt er dabei mobile Lösungen, Betriebssysteme, Apps und Endgeräte unter die Lupe und überprüft sie auf ihre Business-Tauglichkeit. Bremmer interessiert sich für Gadgets aller Art und testet diese auch.
Neben den Benutzern der Bezahlversionen Plus und Enterprise dürfen nun auch diejenigen mit ChatGPT sprechen, die die Gratisversion nutzen.
Mit dem KI-Chatbot kann man jetzt auch ohne Extra-Lizenz direkt sprechen.
Mit dem KI-Chatbot kann man jetzt auch ohne Extra-Lizenz direkt sprechen.
Foto: fizkes - shutterstock.com

Noch während des Hin und her um den früheren und neuen CEO Sam Altman und seine Gefolgschaft, hat OpenAI relativ diskret die vor zwei Monaten angekündigte Funktion ChatGPT Voice für alle Nutzer ausgerollt. Die kurze Ankündigung machte der zum Zeitpunkt des Announcement eigentlich geschasste President Greg Brockman, aber vermutlich hatte nicht mal er den Überblick über seinen aktuellen Beschäftigungsstatus behalten.

Wie der Name bereits andeutet, ermöglicht ChatGPT Voice den Nutzern der mobilen App, dem KI-Chatbot per Spracheingabe Fragen zu stellen. ChatGPT antwortet darauf mit einem Audio-Output. OpenAI nutzt dazu ein Text-to-Speech-Modell, das basierend auf Text und einigen Sekunden langen Sprachproben sehr menschlich klingende Stimmen generieren kann. Nach eigenen Angaben arbeitete das Unternehmen mit professionellen Synchronsprechern zusammen, um fünf verschiedene Stimmen zu generieren. Für die Transkribierung verbaler Äußerungen in Text kam das hauseigene Open-Source-Spracherkennungssystem Whisper zum Einsatz.

5 Stimmen zur Auswahl

Um das Feature zu nutzen, muss man in der mobilen App für Android und iOS die Einstellungen öffnen und unter "Neue Funktionen" das Feature "Spracheingabe" auswählen. Nach dem Aktivieren taucht im Chatverlauf in der rechten unteren Ecke des Screens ein Kopfhörer auf. ChatGPT bietet fünf Stimmen mit unterschiedlichen Charakteristiken zur Auswahl an.

Wie ein Kurztest zeigte, akzeptiert der KI-Chatbot auch bereitwillig Sonderwünsche wie einen bayerischen oder schottischen Dialekt - ohne diesen aber tatsächlich zu "sprechen". Ansonsten antwortet der Bot relativ zügig und präzise. Je nach Stimmauswahl ist ChatGPT - subjektiv betrachtet - auch weniger steif und formell als sein schriftliches Pendant. Interessanterweise reagiert ChatGPT Voice dabei nicht nur auf Sprache, sondern auch Geräusche. Nach einem kleinen Huster erklärte der Chatbot, dass er zwar kein Arzt sei, aber anhaltender Husten verschiedene Ursachen haben könnte. Um im Anschluss zu fragen: "Haben Sie andere Symptome bemerkt oder bereits einen Mediziner konsultiert?"

Um sich solche neugierigen Fragen zu ersparen, sollte man daher bei Nichtbenutzung darauf achten, die Aufnahmefunktion zu stoppen oder die App ganz zu schließen.