Mistral AI 开源 Voxtral:首个 24B/3B 双版本语音理解模型,全面超越 Whisper

Mistral AI 开源 Voxtral:首个 24B/3B 双版本语音理解模型,全面超越 Whisper

800_auto

法国 Mistral AI 今日正式在 Hugging Face 与 GitHub 同步开源 Voxtral 系列——其首款语音理解大模型,包含 Voxtral Small(24 B) 与 Voxtral Mini(3 B) 两档参数规模,均以 Apache 2.0 许可证发布。

核心能力

超长上下文:32 k token 窗口,一次性处理 30 min 音频转录 或 40 min 语义理解,无需分段。

超越 Whisper:在 FLEURS、C...

点击查看剩余70%

{{collectdata}}

网友评论