分享一个开源的支持情感控制、语言配音转换的零样本文本到语音(TTS)模型MaskGCT

分享一个开源的支持情感控制、语言配音转换的零样本文本到语音(TTS)模型MaskGCT

800_auto

MaskGCT 是一个大规模的零样本 TTS 系统,它采用了一种新的非自回归掩码生成编解码器变换器(MaskGCT)架构,旨在通过文本预测语义和声学令牌来生成语音。

800_auto

该系统由两个阶...

点击查看剩余70%

{{collectdata}}

网友评论