Moonshot开源高效推理多模态大模型Kimi-VL-A3B-Thinking
Kimi-VL-A3B-Thinking 是由 Moonshot AI 开发的一种先进视觉-语言模型,专注于长链推理和多模态任务。
核心特性
高效参数激活:Kimi-VL-A3B-Thinking 是一个高效的多模态推理模型,其语言解码器仅激活 2.8B 参数,在保持轻量级的同时,展现出强大的多模态推理能力。
长链推理能力:该模型通过长链思维(Chain-of-Thought, CoT)监督微调和强化学习(Reinforcement Learning, RL)进行训练,具备强大的长链推理能力。
长上下文处理:支持 128K 上下文窗口,能够处理长文本和复杂输入,适合长视频和长文档的处理。
高分辨率视觉...点击查看剩余70%
网友评论