通义开源语音大模型:声音理解SenseVoice 和 语音生成CosyVoice

通义开源语音大模型:声音理解SenseVoice 和 语音生成CosyVoice

800_auto

SenseVoice 是一个多语言音频理解大模型,它在中文和粤语的语音识别上相比于 Whisper 模型有 50% 的相对提升,推理速度快 15 倍,并且支持先进的情绪识别和...

点击查看剩余70%

{{collectdata}}

网友评论