蚂蚁发布新模型 Ling-2.6-flash 推理成本仅为同类十分之一

蚂蚁发布新模型 Ling-2.6-flash 推理成本仅为同类十分之一

4 月 22 日,蚂蚁集团百灵大模型团队正式推出全新 Instruct 模型 Ling-2.6-flash,该模型以极致 Token 效率为核心优势,推理成本仅为同类主流模型的十分之一,引发行业关注。

800_auto

Ling-2.6-flash 总参数量 1040 亿,采用高度稀疏化的 MoE 混合线性架构,实际推理仅激活 74 亿参数,大幅降低计算开销。

在 Artificial Analysi...

点击查看剩余70%

{{collectdata}}

网友评论