阿里发布音频驱动照片声情并茂说话生成视频框架EMO

阿里发布音频驱动照片声情并茂说话生成视频框架EMO

阿里巴巴智能计算研究院最新开发的框架,EMO(Emote Portrait Alive),代表了音频驱动的AI肖像视频技术的一大进步。EMO能够利用单幅参考图片和语音音频,创造出具有丰富表情和头部姿态动作的视频。这项技术精准捕捉人类表情的微妙变化和个性化的面部特征,打造出既逼真又充满表现力的动态图像。

800_auto

点击查看剩余70%

{{collectdata}}

网友评论