阿里开源Qwen2-Audio模型可直接语音交互音频输入

阿里开源Qwen2-Audio模型可直接语音交互音频输入

800_auto

Qwen2-Audio 是一个大规模的音频 - 语言模型(LALMs),能够接受多种音频信号输入,并通过音频分析或直接根据语音指令进行文字响应。

该模型可以自主判断并智能切换在两种交互模式:音频分析和语音聊天。

在音频分析模式下,Qwen2-Aud...

点击查看剩余70%

{{collectdata}}

网友评论