Nvidia hat eine neue KI namens Fugatto
vorgestellt. Diese ist gemäss den Entwicklern in der Lage, Musik, Stimmen, Geräusche oder einen Mix davon zu kreieren, basierend auf Audio-Files sowie Textprompts. Als Beispiele nennt
Nvidia das Erstellen eines Songs, das Hinzufügen oder Entfernen eines spezifischen Instruments aus einer Audiospur oder das Manipulieren einer Stimme. Der Hersteller geht gar so weit und behauptet, die KI können Geräusche erschaffen, welche die Menschheit noch nie gehört hätte.
Mit der KI soll das Erstellen und editieren von Audio so mühelos werden wie noch nie zuvor. Das breite Einsatzgebiet von Musik, Stimmen und Geräuschen eröffne eine grosse Bandbreite an Zielgruppen, wie etwa Songwriter, Agenturen oder Gamestudios. Rafael Valle, Manager of Applied Audio Research bei Nvidia sagt, dass man ein Modell entwickeln wollte, welches Geräusche und Musik verstehen und interpretieren könne, wie Menschen es tuen.
Konkrete Veröffentlichungspläne liegen allerdings noch nicht vor. Einen Vorgeschmack auf die Fähigkeiten von Fugatto liefert Nividia mit diesem Video.
(dok)