开源生成人物照片说话视频的VLOGGER

开源生成人物照片说话视频的VLOGGER

800_auto

VLOGGER是一个创新的多模态扩散方法,用于生成单张照片的人物讲话视频,包含说话时脸部嘴唇和手势的完美生成,适合数字人制作和ai复活亲人的好项目。

65f904009f925.gif

65f903b0c8846.gif

它能分析文本和音频信息,通过两个阶段的扩散模型产生照片中的人物动作,包括面部表情、姿态和身体动作,以生成...

点击查看剩余70%

{{collectdata}}

网友评论