小米开源声音理解大模型 MiDashengLM-7B:22 项评测刷新 SOTA,首 Token 延迟仅为同类 1/4

小米开源声音理解大模型 MiDashengLM-7B:22 项评测刷新 SOTA,首 Token 延迟仅为同类 1/4

2025 年 8 月 4 日,小米正式开源自研 声音理解大模型 MiDashengLM-7B。官方宣称,该模型在 22 个公开评测集 上刷新了多模态大模型的最好成绩(SOTA),并在推理速度与显存效率上实现 双突破。

800_auto

技术架构

音频编码器:Xiaomi Dasheng

2024 年首发即刷新 AudioSet 50+ mAP,在 HEAR Benchmark 三大领域保持领先。

语言解码器:Qwen2...

点击查看剩余70%

{{collectdata}}

网友评论