搜索

首页/笔记/详情

阿里开源可直接理解音频的70亿大语言模型Qwen2-Audio

博文: 34 作品: 382 开源: 3

私信我

阿里开源可直接理解音频的70亿大语言模型Qwen2-Audio

800_auto

Qwen2-Audio模型能够理解和转录语音内容，分析音说话者情感，识别环境声，并转化为文字，其模型大小为 70 亿参数。

该模型具有以下特点：

1、直接支持语音交互，无需依赖自动语音识别（ASR）模块。

800_auto

2、能够深入分析音...

点击查看剩余70%

{{collectdata}}

网友评论

{{item.title}}

{{item.summary}}

博文: 34 作品: 382 开源: 3

私信我

bfwsolo，与ai对话就能生成部署全栈web系统

最新提问