KI-Anwendungen sind gerade in aller Munde. Insbesondere ChatGPT sorgte in den letzten Wochen wiederholt für Schlagzeilen. Jüngst hat
Microsoft, das seine Finger auch bei ChatGPT im Spiel hat, eine eigene KI-Anwendung namens VALL-E veröffentlicht. Deren Fähigkeit besteht darin, Stimmen imitieren zu können.
Auf
Github haben die Entwickler von VALL-E die KI-Anwendung näher vorgestellt: Das Modell wurde mittels 60'000 Stunden an englischen Sprachdaten trainiert und braucht nun lediglich eine Aufnahme von drei Sekunden, um die Stimme eines unbekannten Sprechers zu imitieren. Das Besondere and VALL-E besteht dabei darin, dass die KI auch in der Lage ist, den Tonfall und die Emotionen eines Sprechers nachzuahmen. Dabei soll die imitierte Stimme an Ähnlichkeit und Natürlichkeit kaum zu überbieten sein, so die Entwickler.
VALL-E ist derzeit noch nicht öffentlich verfügbar und kann daher nicht individuell getestet werden. Via Github haben die Entwickler aber ein Sample an imitierten Stimmen geteilt.
(rf)