OpenAI macht derzeit eher mit Personalthemen von sich reden ("Swiss IT Magazine"
berichtete), aber auch technisch geht es für den KI-Entwickler voran. Wie das Unternehmen knapp auf X
angekündigt hat, steht die ChatGPT Voice getaufte Funktion per sofort allen Nutzern zur Verfügung. Bei dieser handelt es sich um eine Sprachsteuerung für ChatGPT, die bereits vor einigen Monaten vorgestellt wurde. Bisher war sie jedoch ausschliesslich Plus- und Enterprise-Abonnenten vorbehalten. Nun ist ChatGPT Voice auch ohne Abo uneingeschränkt nutzbar.
Statt Anfragen einzutippen, können sie Nutzer in natürlicher Sprache formulieren und mit dem Assistenten reden, der ebenfalls auf diesem Weg antwortet. Die Funktion nutzt dabei ein neues Text-to-Speech-Modell, das auf professionelle Synchronsprecher setzt und mehrere Ausgabestimmen bietet.
Um die Sprachsteuerung zu starten, müssen Anwender diese über die Einstellungen sowie die Option "Neue Funktionen" aktivieren. Anschliessend können sie auf die Kopfhörertaste auf dem Startbildschirm der App drücken, um eine der fünf verfügbaren Stimmen auszuwählen und anschliessend mit ChatGPT zu sprechen.
Allerdings ist sich
OpenAI auch der Gefahren der Technologie bewusst und beschränkt die öffentliche Nutzung daher. "Diese Fähigkeiten bergen auch neue Risiken, wie zum Beispiel die Möglichkeit für böswillige Akteure, sich als Personen des öffentlichen Lebens auszugeben oder Betrug zu begehen. Aus diesem Grund setzen wir diese Technologie für einen speziellen Anwendungsfall ein – den Voice-Chat." Dieser wurde mit Sprechern erstellt, mit denen OpenAI direkt zusammengearbeitet hat. Weitere Szenarien soll es jedoch im professionellen Umfeld geben. Spotify nutzt die Technologie beispielsweise für ein Voice Translation-Pilotprojekt, das Podcastern helfen soll, die Reichweite ihrer Geschichten zu vergrössern, indem sie ihre Podcasts in zusätzliche Sprachen mit der eigenen Stimme übersetzen können.
(sta)