抖音数字分身虚拟数字人直播技术的几种实现方式-BFW博客

抖音数字分身虚拟数字人直播技术的几种实现方式

最近各大直播平台的数字人直播太火了，数字人不仅可以24小时直播，而且还能与观众互动，甚至如果直播不说，你还以为是真人主播，太逼真了，主要用于文旅、餐饮、带货、服装等行业。我去咨询了一下价格，起步都是几万块，太贵了，明明是开源的软件，国内就变成商业收费的项目了，今天我来说一下实现这种数字人虚拟分身的几种开源实现方式，给大家省点钱。

抖音数字分身虚拟数字人直播技术的几种实现方式

一、数字主播话术文案脚本生成

主播说的文字可以通过chatgpt直接生成文案，你只要告诉chatgpt你的要求，chatgpt就能帮你生成24小时都说不完的文案，太强大了。当然国内也有一些模仿chatgpt的跟随者。这个文字就是后面驱动数字人说话生成音频声音及声音的基础。

网址：https://chat.openai.com/chat

二、首先是数字人声音克隆

数字人直播首先我们从声音克隆开始，因为直播都是通过声音来驱动的，我们可以将真人主播的声音进行克隆训练，生成一个模型，然后就可以通过文字来生成直播说话的声音了，推荐一个开源项目so-vits-svc，支持文件和实时转换输出。

https://gi...

点击查看剩余70%

打赏博主×

抖音数字分身虚拟数字人直播技术的几种实现方式

网友评论0

手把手教你用ai做一个互动的数字人女友伴侣网页教程

勒索软件现在公开被盗数据

js 中文数组或中文对象数组排序实现的几种方式

C与C++要退出历史舞台？

python识别手势并控制智能家居

教你用nginx与lua打造更高并发应用

ios与andriod中webview网页js用户登录状态同步方案

如何在Python中提取Chrome密码

微信小程序使用live-pusher和live-player实现视频直播

7种浏览器js离线数据库比较

{{item.title}}

deepfacelive实时换脸直播视频通话教程

浅谈AI克隆人的几个开源项目

这个世界是真实的吗？

分享6款文字语音生成驱动虚拟数字人说话的开源项目

deepfakelab进行换脸入门教程

GitHub上的17款开源项目推荐

AI人工智能实时克隆别人声音将你的声音变成任意一个人的声音

教你用ChilloutMix让ai人工智能创作真假难辨的美女照片

教你实现在国内正常访问chatgpt接口

声音驱动照片或视频人物说话嘴唇同步开源库Wav2Lip教程

win10上powershell运行wsl报错Wsl/0x80072f7d如何解决？

人工智能技术属于科学范畴吗？

pi与claw及codex有啥不同？

有没有在电脑上运行iphone虚拟机的软件？

如何将电脑扬声器声音同步输出到另外一台手机或电脑上/

为啥图片和视频大模型的提示词支持json和python代码？

Chromium的 Kiosk 模式是干啥的？

豆包如何生成15秒以上的视频？

ai文本大模型最后会升级成做任何动画片吗？

python有没有一键扒谱和音乐背景旋律与人声分离的库？