阿里开源325亿参数推理模型QwQ 32b,性能与满血版deepseek r1齐平

阿里开源325亿参数推理模型QwQ 32b,性能与满血版deepseek r1齐平

800_auto

QwQ 是 Qwen 团队开发的推理模型,专注于提升 AI 的推理能力。与传统指令调优模型相比,QwQ 具备更强的思考和推理能力,尤其在高难度问题上表现出色。QwQ-32B 是该系列的中等规模版本,拥有 320 亿参数,通过强化学习(Reinforcement Learning, RL)技术,其性能可媲美拥有 6710 亿参数...

点击查看剩余70%

{{collectdata}}

网友评论