Mistral AI 开源 Voxtral:首个 24B/3B 双版本语音理解模型,全面超越 Whisper
法国 Mistral AI 今日正式在 Hugging Face 与 GitHub 同步开源 Voxtral 系列——其首款语音理解大模型,包含 Voxtral Small(24 B) 与 Voxtral Mini(3 B) 两档参数规模,均以 Apache 2.0 许可证发布。
核心能力
超长上下文:32 k token 窗口,一次性处理 30 min 音频转录 或 40 min 语义理解,无需分段。
超越 Whisper:在 FLEURS、C...
点击查看剩余70%
网友评论