阿里开源支持全身肢体动作的图片说话口型同步对口型框架FantasyTalking-BFW编程笔记

阿里开源支持全身肢体动作的图片说话口型同步对口型框架FantasyTalking

800_auto

FantasyTalking 是由阿里巴巴 AMAP 团队和北京邮电大学联合研发的新型框架，专注于从单张静态肖像生成逼真的可动画化虚拟形象。

该项目基于预训练的视频扩散变换器模型，采用双阶段视听对齐策略，能够生成高质量的动态视频，广泛应用于游戏开发、影视制作、虚拟现实、虚拟主播和智能教育等领域。

核心功能

口型同步：能够准确识别并同步虚拟角色的口型与输入语音，使角色在说话时的口型与语音内容完全一致，增强角色的真实感。

面部动作生成：根据语音内容和情感信息...

点击查看剩余70%

打赏博主×