阿里开源可直接理解音频的70亿大语言模型Qwen2-Audio

阿里开源可直接理解音频的70亿大语言模型Qwen2-Audio

800_auto

Qwen2-Audio模型能够理解和转录语音内容,分析音说话者情感,识别环境声,并转化为文字,其模型大小为 70 亿参数。

该模型具有以下特点:

1、直接支持语音交互,无需依赖自动语音识别(ASR)模块。

800_auto

2、能够深入分析音...

点击查看剩余70%

{{collectdata}}

网友评论