Neues KI-Tool bringt Porträt-Fotos zum Sprechen und Singen

Quelle: Alibaba Group

Neues KI-Tool bringt Porträt-Fotos zum Sprechen und Singen

Emote Portrait Alive heisst eine neue KI-Anwendung, die Forscher des Alibaba-Konzerns kreiert haben. Das Tool ist in der Lage, ein Porträt-Bild auf Basis einer Audio-Datei zum Sprechen oder sogar zum Singen zu bringen.

10. März 2024

Chinesische Forscher des zum Alibaba-Konzern gehörenden Institute for Intelligent Computing haben das KI-Tool Emote Portrait Alive vorgestellt, das Porträt-Fotos zu einem Video animiert. In Kombination mit einer Audio-Datei lässt sich die abgebildete Person so zum Sprechen oder sogar zum Singen bringen. Anders als bei ähnlichen Modellen wird hier allerdings auf den Einsatz von 3D-Modellen verzichtet. Stattdessen kommt ein sogenanntes Diffusionsmodell zum Einsatz, das Mimik und Lippenbewegungen aus den Audiosequenzen berechnet und direkt auch die einzelnen Video-Frames generiert.

Die Forschungsergebnisse wie auch die Funktionsweise der KI-Anwendung wurden mittlerweile veröffentlicht und auf Github wurde eine ganze Reihe von Beispielen aufgeschaltet, welche die Möglichkeiten eindrücklich demonstrieren. So wurde etwa ein Porträt-Bild von Audrey Hepburn aus dem Film Roman Holiday zum Singen eines Ed-Sheeran-Songs gebracht. Diverse weitere Beispiele mit durch generative KI erstellten Charakteren demonstrieren die Möglichkeiten, was Sprache, Rhythmus oder Stil anbelangt. Ob und in welcher Weise die neue KI-Anwendung der Allgemeinheit zur Verfügung gestellt wird, ist offen. Vorsicht ist jedenfalls angesagt: Für die Verfasser von Fake News dürften sich damit gänzlich neue Möglichkeiten ergeben. (rd)

(Quelle: Alibaba Group)

(Quelle: Alibaba Group)

Weitere Artikel zum Thema

Bard kann neu auch Bilder generieren und versteht mehr Sprachen

2. Februar 2024 - Bard arbeitet nun in den meisten Ländern mit dem Sprachmodell Gemini Pro. Dazu hat Googles Chatbot jetzt auch einen Bildgenerator erhalten, der seine Werke mit einem Wasserzeichen markiert.

Google Lumiere: Durchbruch bei KI-Videos

25. Januar 2024 - Eine Forschungseinheit von Google hat erfolgreich einen neuen Ansatz für die Generierung von Videos mit KI gefunden. Die gezeigten Beispiele sind vielversprechend.

Neue Youtube-KI fasst Videos und Kommentare zusammen

7. November 2023 - Youtube lässt eine Handvoll Premium-User neue KI-Funktionen testen. Diese können Kommentare nach Themen sortieren und Fragen zum laufenden Video beantworten.

Artikel kommentieren

Phishing-Alarm in Microsoft 365 und Google Workspace

Phishing-Alarm in Microsoft 365 und Google Workspace

Wie Unternehmen sich vor Homoglyphen- und Spoofing-Angriffe schützen können

Erfolg mit KI-Agenten durch fünf Schlüsselfaktoren

Erfolg mit KI-Agenten durch fünf Schlüsselfaktoren

KI-Agenten revolutionieren das Kundenerlebnis: Sie analysieren Daten, erstellen Pläne und handeln überwiegend autonom. KI-Agenten eröffnen Unternehmen neue Möglichkeiten von automatisierten Serviceanfragen bis hin zu komplexen Abläufen, die ohne menschliches Zutun durchgeführt werden.

Die effizienteste IT-Strategie? Ist hybrid.

Die effizienteste IT-Strategie? Ist hybrid.

CIOs verstehen die digitale Transformation oft als unabdingbaren Wechsel ihrer gesamten IT in die Cloud. Doch die Online-Dienste entfalten ihren grössten Vorteil in Kombination mit lokalen Installationen. Hybrid Computing macht deshalb nicht umsonst ‚die Runde‘: Schliesslich gewährleistet es Sicherheit und Kontrolle durch eigene IT-Ressourcen – und volle Agilität in der Cloud. Björn Orth, Geschäftsführer des Microsoft Solutions Partners VENDOSOFT bricht eine Lanze für diese Form der hybriden Lizenzierung.

Wirkung im Ziel!

Wirkung im Ziel!

Was wäre, wenn Aus- und Weiterbildungen unmittelbar sichtbare Wirkung zeigten? Nein, dies ist keine Fiktion. Drei einfache Schritte führen zum Ziel.

Cyber Resilience Act: Auswirkungen auf Embedded Device Security

Cyber Resilience Act: Auswirkungen auf Embedded Device Security

Der Cyber Resilience Act verändert die Sicherheitsanforderungen für Embedded Devices grundlegend. Welche neuen Herausforderungen kommen auf Unternehmen zu? Wie lassen sich Compliance-Vorgaben effizient umsetzen? Gemeinsam mit unserem Partner ONEKEY zeigen wir, wie Sie Sicherheitsrisiken minimieren und Embedded Devices optimal schützen.

Zögern Sie noch bei der Automatisierung?

Zögern Sie noch bei der Automatisierung?

Der moderne Arbeitsplatz entwickelt sich ständig weiter. Technologische Fortschritte, die Bedürfnisse einer Mehrgenerationenbelegschaft und hybride Arbeitsmodelle machen die Optimierung der Mitarbeitererfahrung zunehmend komplex.

GOLD SPONSOREN

SPONSOREN & PARTNER