阿里开源支持全身肢体动作的图片说话口型同步对口型框架FantasyTalking
FantasyTalking 是由阿里巴巴 AMAP 团队和北京邮电大学联合研发的新型框架,专注于从单张静态肖像生成逼真的可动画化虚拟形象。
该项目基于预训练的视频扩散变换器模型,采用双阶段视听对齐策略,能够生成高质量的动态视频,广泛应用于游戏开发、影视制作、虚拟现实、虚拟主播和智能教育等领域。
核心功能
口型同步:能够准确识别并同步虚拟角色的口型与输入语音,使角色在说话时的口型与语音内容完全一致,增强角色的真实感。
面部动作生成:根据语音内容和情感信息...
点击查看剩余70%
网友评论