小米开源声音理解大模型 MiDashengLM-7B:22 项评测刷新 SOTA,首 Token 延迟仅为同类 1/4
2025 年 8 月 4 日,小米正式开源自研 声音理解大模型 MiDashengLM-7B。官方宣称,该模型在 22 个公开评测集 上刷新了多模态大模型的最好成绩(SOTA),并在推理速度与显存效率上实现 双突破。
技术架构
音频编码器:Xiaomi Dasheng
2024 年首发即刷新 AudioSet 50+ mAP,在 HEAR Benchmark 三大领域保持领先。
语言解码器:Qwen2...
点击查看剩余70%
网友评论