阿里开源最强混合推理ai大模型qwen3,超越gpt-o1、grok3、deepseek
阿里巴巴于2025年4月29日凌晨发布了新一代通义千问Qwen3系列模型。
Qwen3系列涵盖了8款不同尺寸的模型,包括2款混合专家(MoE)模型和6款密集模型,参数规模从0.6B到235B。
具体如下:
核心亮点
混合推理模式:Qwen3是国内首个“混合推理模型”,将“快思考”(非思考模式)与“慢思考”(思考模式)集成进同一个模型。用户可以根据任务复杂度灵活切换模式,还能通过/think和/no_think标签动态控制思考深度。
多语言能力:支持119种语言和方言,在多语言推理测试中表现突出。
性能提升:在多项基准测试中表现优异,例如在奥数水平的AIME25测评中斩获81.5分,在编程能力测试中与DeepSeek-R1等顶级模型处于同一梯队。
它的旗舰模型 Qwen3-235B-A22B 在编码、数学、通用能力等基准测试中表现出色,与 DeepSeek-R1、o1、o...
点击查看剩余70%
网友评论