首页 > 汽车笔记 > 汽车笔记 > 微软重磅发布Phi-4推理模型,小型AI挑战大模型霸主

微软重磅发布Phi-4推理模型,小型AI挑战大模型霸主

发布时间:2025-05-01 22:45:41来源: 13663887898

5 月 1 日消息,微软昨日(4 月 30 日)发布 Phi-4-reasoning 系列推理模型,通过监督微调 Phi-4,并利用 o3-mini 生成的高质量“可教导”提示数据集训练,专为复杂推理任务设计。

IT之家援引博文介绍,微软本次共推出 Phi-4-reasoning、Phi-4-reasoning-plus 和 Phi-4-mini-reasoning 三款模型,官方称该系列模型不仅延续了小型模型的高效特性,还在推理能力上实现重大突破。

该系列模型通过推理时间扩展(inference-time scaling)技术,擅长处理需要多步骤分解和内部反思的复杂任务,尤其在数学推理和代理型应用中表现突出,具备媲美大型前沿模型的潜力。

Phi-4-reasoning 是一款拥有 140 亿参数的开源推理模型,通过监督微调(Supervised Fine-Tuning,SFT)Phi-4,结合 OpenAI o3-mini 的高质量推理演示数据,并充分利用额外计算资源,生成详细的推理链条。

Phi-4-reasoning-plus 增强版通过强化学习(Reinforcement Learning,RL)进一步提升性能,tokens 用量比标准版多 1.5 倍,支持更高精度。

两款模型在数学推理和博士级科学问题测试中,均超越 OpenAI o1-mini 和
DeepSeek-R1-Distill-Llama-70B
,甚至在 AIME 2025(美国数学奥林匹克资格赛)中击败 6710 亿参数的 DeepSeek-R1 满血模型。

Phi-4-mini-reasoning 专为计算资源有限的环境设计,是一款基于 Transformer 的紧凑型语言模型,优化用于数学推理。

汽车笔记更多>>

6999起三星S26系列发布丨硬件防窥屏 安卓机皇? 三星研发部门负责人解释Galaxy S26系列手机未原生集成磁吸功能 魅族科技宣布战略转型,将暂停国内手机新产品自研硬件项目 魅族第一个停更!内存涨价潮下手机厂商承压 华为清华联手,研发28nm存内计算芯片 又一国产全模态视频大模型杀入Artificial Analysis榜单Top 2 苹果警告旧版Home家庭架构今起停用 OPPO K14x 5G手机海外发布,配置与售价全曝光 华为nova16系列再次确认:三芯分层+方形前摄革新,定价诚意拉满 OPPO Find X10系列配置曝光:2nm芯、双2亿主摄,堆料不讲武德 ColorOS再次发力:二月体验升级大揭秘,覆盖众多机型! 小米17 Max再次被确认:取消副屏和加大电池,两亿像素也没跑了 iQOO Z11系列突然入网:90W+9000mAh,还有LCD屏幕! 三星Galaxy S26系列完整规格曝光,预计2月25日正式发布 京东高端手机Top10,华为Mate 80六连冠,iQOO 15 Ultra大亮 CounterPoint报告2025全球手机存量:8大品牌破2亿 分析师:苹果iPhone 18 Pro系列起售价将与前代持平 苹果即将移除iTunes愿望清单功能,提醒用户迁移内容 苹果预计本月推出搭载M5 Pro/Max芯片的新款MacBook Pro笔记本电脑 联想拯救者Y700 2026款小平板配置曝光:骁龙8E5处理器配8.8英寸3K LCD屏 SK海力士、闪迪:2025Q4 NAND闪存平均单价上涨30%以上 PGYTech蒲公英RetroVa摄影套件亮相,适配苹果iPhone多机型 Mate 80卖爆!华为拿到1月中国手机市场份额第一名:份额提升至18.6% 人民日报头版力挺,OPPO折叠屏技术引苹果学习! 《后厂村AI派》正式启动:Pitch Your Next Move! 中途退学的艺术生,开发Web 3D项目,周下载量破400万 印奇挂帅后,阶跃星辰最强开源模型登场!六大国产AI芯片已适配 Moltbook漏洞大到可以冒充Karpathy发帖,黑客都急了 苹果妙控键盘固件更新,覆盖M4/M5款iPad Pro与M3 Air机型 昔日HDD巨头Conner重生回归!进军外置存储与手机周边