微软发布140亿参数小语言AI推理模型Phi-4，推理能力超越满血deepseek r1-BFW编程笔记

微软发布140亿参数小语言AI推理模型Phi-4，推理能力超越满血deepseek r1

800_auto

微软在2025年4月30日发布了Phi-4系列小语言AI推理模型，这一系列模型专为复杂推理任务设计，展现了小型模型在推理能力上的重大突破。

模型特点

Phi-4-reasoning：拥有140亿参数，通过监督微调（Supervised Fine-Tuning, SFT）训练，并结合OpenAI o3-mini的高质量推理演示数据，生成详细的推理链条。

Phi-4-reasoning-plus：在Phi-4-reasoning的基础上，通过强化学习（Reinforcement Learning, RL）进一步提升性能，tokens用量比标准版多1.5倍，支持更高精度。

Phi-4-mini-reas...

点击查看剩余70%

打赏博主×