抖音数字分身虚拟数字人直播技术的几种实现方式

最近各大直播平台的数字人直播太火了,数字人不仅可以24小时直播,而且还能与观众互动,甚至如果直播不说,你还以为是真人主播,太逼真了,主要用于文旅、餐饮、带货、服装等行业。我去咨询了一下价格,起步都是几万块,太贵了,明明是开源的软件,国内就变成商业收费的项目了,今天我来说一下实现这种数字人虚拟分身的几种开源实现方式,给大家省点钱。

抖音数字分身虚拟数字人直播技术的几种实现方式

一、数字主播话术文案脚本生成

主播说的文字可以通过chatgpt直接生成文案,你只要告诉chatgpt你的要求,chatgpt就能帮你生成24小时都说不完的文案,太强大了。当然国内也有一些模仿chatgpt的跟随者。这个文字就是后面驱动数字人说话生成音频声音及声音的基础。

网址:https://chat.openai.com/chat

二、首先是数字人声音克隆

数字人直播首先我们从声音克隆开始,因为直播都是通过声音来驱动的,我们可以将真人主播的声音进行克隆训练,生成一个模型,然后就可以通过文字来生成直播说话的声音了,推荐一个开源项目so-vits-svc,支持文件和实时转换输出。

https://gi...

点击查看剩余70%

{{collectdata}}

网友评论0