Im Kampf um die KI-Vorherrschaft, die derzeit von Microsoft und OpenAI dominiert wird – Stichwort ChatGPT –, zündet
Google eine neue Stufe: Eine KI namens MusicLM generiert aus einer Beschreibung in Textform ein Musikstück. Der Suchriese bietet MusicLM aber (noch) nicht allgemein an, sondern beschreibt die Text-to-Music-Technologie, die von einem Team von Google Research entwickelt wird, in einem Paper der Cornell University und
präsentiert auf Github diverse Hörbeispiele.
Die Entwickler erklären im Abstract zu ihrem Forschungspapier: "Unsere Experimente zeigen, dass MusicLM bisherige Systeme sowohl punkto Audioqualität als auch bei der Einhaltung der Textbeschreibung übertrifft. Darüber hinaus zeigen wir, dass MusicLM sowohl auf Text als auch auf eine Melodie konditioniert werden kann, indem es gepfiffene und gesummte Melodien gemäss dem in einer Textbeschriftung beschriebenen Stil umwandeln kann."
Im Gegensatz zu MusicLM konnten bisherige KI-Musikgeneratoren keine komplexen Stücke in hoher Klangqualität erzeugen. Allerdings macht anhand der Beispiele vor allem von MusicLM erzeugte elektronische Musik eine gute Falle – die Beispiele mit klassischer Musik, Rap und Metal klingen eher merkwürdig. Es gibt für die Entwickler also noch einiges zu tun, bevor Google den Dienst der Öffentlichkeit zugänglich machen kann.
(ubi)