蚂蚁发布新模型 Ling-2.6-flash 推理成本仅为同类十分之一

私信我

4 月 22 日，蚂蚁集团百灵大模型团队正式推出全新 Instruct 模型 Ling-2.6-flash，该模型以极致 Token 效率为核心优势，推理成本仅为同类主流模型的十分之一，引发行业关注。

800_auto

Ling-2.6-flash 总参数量 1040 亿，采用高度稀疏化的 MoE 混合线性架构，实际推理仅激活 74 亿参数，大幅降低计算开销。

在 Artificial Analysi...

点击查看剩余70%

私信我

最新提问

打赏博主×