微软发布140亿参数小语言AI推理模型Phi-4,推理能力超越满血deepseek r1

微软发布140亿参数小语言AI推理模型Phi-4,推理能力超越满血deepseek r1

800_auto

微软在2025年4月30日发布了Phi-4系列小语言AI推理模型,这一系列模型专为复杂推理任务设计,展现了小型模型在推理能力上的重大突破。

模型特点

Phi-4-reasoning:拥有140亿参数,通过监督微调(Supervised Fine-Tuning, SFT)训练,并结合OpenAI o3-mini的高质量推理演示数据,生成详细的推理链条。

Phi-4-reasoning-plus:在Phi-4-reasoning的基础上,通过强化学习(Reinforcement Learning, RL)进一步提升性能,tokens用量比标准版多1.5倍,支持更高精度。

Phi-4-mini-reas...

点击查看剩余70%

{{collectdata}}

网友评论