Neues KI-Tool bringt Porträt-Fotos zum Sprechen und Singen
Quelle: Alibaba Group

Neues KI-Tool bringt Porträt-Fotos zum Sprechen und Singen

Emote Portrait Alive heisst eine neue KI-Anwendung, die Forscher des Alibaba-Konzerns kreiert haben. Das Tool ist in der Lage, ein Porträt-Bild auf Basis einer Audio-Datei zum Sprechen oder sogar zum Singen zu bringen.
10. März 2024

     

Chinesische Forscher des zum Alibaba-Konzern gehörenden Institute for Intelligent Computing haben das KI-Tool Emote Portrait Alive vorgestellt, das Porträt-Fotos zu einem Video animiert. In Kombination mit einer Audio-Datei lässt sich die abgebildete Person so zum Sprechen oder sogar zum Singen bringen. Anders als bei ähnlichen Modellen wird hier allerdings auf den Einsatz von 3D-Modellen verzichtet. Stattdessen kommt ein sogenanntes Diffusionsmodell zum Einsatz, das Mimik und Lippenbewegungen aus den Audiosequenzen berechnet und direkt auch die einzelnen Video-Frames generiert.


Die Forschungsergebnisse wie auch die Funktionsweise der KI-Anwendung wurden mittlerweile veröffentlicht und auf Github wurde eine ganze Reihe von Beispielen aufgeschaltet, welche die Möglichkeiten eindrücklich demonstrieren. So wurde etwa ein Porträt-Bild von Audrey Hepburn aus dem Film Roman Holiday zum Singen eines Ed-Sheeran-Songs gebracht. Diverse weitere Beispiele mit durch generative KI erstellten Charakteren demonstrieren die Möglichkeiten, was Sprache, Rhythmus oder Stil anbelangt. Ob und in welcher Weise die neue KI-Anwendung der Allgemeinheit zur Verfügung gestellt wird, ist offen. Vorsicht ist jedenfalls angesagt: Für die Verfasser von Fake News dürften sich damit gänzlich neue Möglichkeiten ergeben. (rd)



Weitere Artikel zum Thema

Bard kann neu auch Bilder generieren und versteht mehr Sprachen

2. Februar 2024 - Bard arbeitet nun in den meisten Ländern mit dem Sprachmodell Gemini Pro. Dazu hat Googles Chatbot jetzt auch einen Bildgenerator erhalten, der seine Werke mit einem Wasserzeichen markiert.

Google Lumiere: Durchbruch bei KI-Videos

25. Januar 2024 - Eine Forschungseinheit von Google hat erfolgreich einen neuen Ansatz für die Generierung von Videos mit KI gefunden. Die gezeigten Beispiele sind vielversprechend.

Neue Youtube-KI fasst Videos und Kommentare zusammen

7. November 2023 - Youtube lässt eine Handvoll Premium-User neue KI-Funktionen testen. Diese können Kommentare nach Themen sortieren und Fragen zum laufenden Video beantworten.


Artikel kommentieren
Kommentare werden vor der Freischaltung durch die Redaktion geprüft.

Anti-Spam-Frage: Vor wem mussten die sieben Geisslein aufpassen?
GOLD SPONSOREN
SPONSOREN & PARTNER