...::: C&M News by Ress - Druckansicht :::...

Drucken (Bereits 7 mal)


Neues KI-Videotool von Alibaba lässt Bilder lebendig werden

(01. März 2024/07:53)

Bild: Alibaba

Das KI-Tool Emo kombiniert Porträts mit Audiodateien, um die darauf abgebildeten Personen in Videos singen oder sprechen zu lassen

Nachdem das Jahr 2023 vor allem durch das Generieren von Texten und Bildern über künstliche Intelligenz geprägt war, dürfte das Jahr 2024 im Zeichen der KI-generierten Videos stehen. So hatte OpenAI, das Unternehmen hinter dem beliebten KI-Chatbot ChatGPT, mit Sora ein System gezeigt, das realistisch wirkende Videos auf Basis von Textbefehlen (Prompts) erstellen soll. Nun legt der chinesische Konzern Alibaba nach und präsentiert ein Tool, das Videos auf Basis von Porträts und Audiodateien generiert.

Das Tool trägt den Namen Emo (Emote Portrait Alive). Kommerziell verfügbar ist es noch nicht, allerdings haben die Forschenden von Alibaba erste Demovideos auf Github veröffentlicht, Details zur Funktionsweise werden in einem Paper (PDF) erläutert. Emo ermöglicht es, ein Porträtbild zu einem Video zu animieren, indem dieses mit einer Audiodatei kombiniert wird. So entsteht der Eindruck, die abgebildete Person würde sprechen oder singen.


Mehr dazu findet ihr auf derstandard.at


https://ress.at/neues-kivideotool-von-alibaba-laesst-bilder-lebendig-werden-news02032024013535.html
© by RessServerWorks, 2024