微软发布140亿参数小语言AI推理模型Phi-4,推理能力超越满血deepseek r1
微软在2025年4月30日发布了Phi-4系列小语言AI推理模型,这一系列模型专为复杂推理任务设计,展现了小型模型在推理能力上的重大突破。
模型特点
Phi-4-reasoning:拥有140亿参数,通过监督微调(Supervised Fine-Tuning, SFT)训练,并结合OpenAI o3-mini的高质量推理演示数据,生成详细的推理链条。
Phi-4-reasoning-plus:在Phi-4-reasoning的基础上,通过强化学习(Reinforcement Learning, RL)进一步提升性能,tokens用量比标准版多1.5倍,支持更高精度。
Phi-4-mini-reas...
点击查看剩余70%
网友评论