OpenAI hat eine neue KI-Anwendung namens Voice Engine vorgestellt. Voice Engine imitiert Stimmen von Menschen täuschend echt auf Basis einer kurzen Audioaufnahme von 15 Sekunden Dauer. Die Technologie ist seit Ende 2022 in Entwicklung –
OpenAI präsentiert
in einem Blogbeitrag bereits verschiedene Praxisbeispiele und merkt an, die Software sei in der Lage, realistische Stimmen mit Gefühl zu generieren.
Als mögliche Anwendungsfälle für Voice Engine führt der Beitrag Leseunterstützung für Kinder und des Lesens nicht fähiger Personen, Übersetzung der Sprachinhalte von Videos und Podcasts, Unterstützung für nicht sprechfähige Menschen sowie die Unterstützung von Patienten beim Wiedererlangen der Sprechfähigkeit im Fall von onkologisch oder neurologisch bedingten Problemen auf.
OpoenAI gibt gleichzeitig an, sich des Risikos von stimmimitierenden Technologien bewusst zu sein. Man arbeite deswegen mit US- und internationalen Partnern wie Behörden, Medien, Unterhaltungsindustrie, Bildungswesen sowie der Zivilgesellschaft zusammen. "Wir sind der Meinung, dass jeder breite Einsatz synthetischer Sprachtechnologien mit einer Stimmauthentifizierung einhergehen sollte, die sicherstellt, dass der ursprüngliche Sprecher seine Stimme wissentlich dem Dienst hinzufügt, sowie mit einer No-Go-Stimmenliste, die die Erstellung von Stimmen, die prominenten Persönlichkeiten zu ähnlich sind, erkennt und verhindert", heisst es in dem Blogpost abschliessend.
(ubi)