阿里开源AI语音大模型 FunAudioLLM涵盖高精度多语言情感辨识语音识别SenseVoice和自然语音生成CosyVoice

阿里开源AI语音大模型 FunAudioLLM涵盖高精度多语言情感辨识语音识别SenseVoice和自然语音生成CosyVoice

800_auto

阿里巴巴近期宣布开源其语音大模型项目 FunAudioLLM,该项目包含两个核心模型:SenseVoice 和 CosyVoice。

SenseVoice 主要用于高精度多语言语音识别、情感辨识和音频事件检测,支持超过 50 种语言,其中在中文和粤语识别上的表现优于...

点击查看剩余70%

{{collectdata}}

网友评论