P

Phi 4 Reasoning Plus

由 microsoft 开发
Phi-4-reasoning-plus 是微软研究院开发的先进开放权重推理模型,基于 Phi-4 通过监督微调和强化学习优化,专注于数学、科学和编码领域的高级推理能力。
下载量 19.83k
发布时间 : 4/17/2025
模型介绍
内容详情
替代品

模型简介

Phi-4-reasoning-plus 是一个高效的推理模型,通过思维链追踪数据集和强化学习进行优化,特别擅长数学推理、科学问题和代码生成任务。

模型特点

高级推理能力
通过监督微调和强化学习优化,特别擅长数学推理、科学问题和代码生成任务。
长上下文处理
支持 32k 令牌的上下文长度,在处理长序列时保持连贯性和逻辑一致性。
结构化响应
响应分为思维链推理块和总结块,提供详细的推理过程和精确的解决方案。
高效训练
使用 160 亿令牌的训练数据,在 32 H100-80G GPU 上训练 2.5 天完成。

模型能力

数学推理
科学问题解答
代码生成
聊天对话
逻辑推理

使用案例

教育
数学问题解答
解决复杂的数学问题,如奥林匹克数学题。
在 AIME 2025 上达到 78.0 分
科学问题解答
回答研究生水平的科学问题。
在 GPQA-Diamond 上达到 68.9 分
编程
代码生成
生成功能性代码,解决编程竞赛问题。
在 LiveCodeBench 上达到 53.1 分