P

Phi 4 Reasoning Plus GGUF

由 unsloth 开发
Phi-4-reasoning-plus 是由微软研究院开发的开源推理模型,专注于数学、科学和编程领域的高级推理能力。
下载量 109.62k
发布时间 : 5/1/2025
模型介绍
内容详情
替代品

模型简介

Phi-4-reasoning-plus 是一个基于 Phi-4 的先进推理模型,通过监督微调和强化学习在链式思维跟踪数据集上进行训练,专注于数学、科学和编程技能。

模型特点

高级推理能力
专注于数学、科学和编程领域的高级推理任务,通过监督微调和强化学习优化。
长上下文支持
支持长达32k标记的上下文长度,适合处理复杂任务。
高性能
在多个推理基准测试中表现优异,优于同类模型。
安全对齐
通过严格的安全后训练方法,确保模型在安全和道德准则下的使用。

模型能力

数学问题解答
科学问题解答
编程问题解决
链式思维推理
文本生成

使用案例

教育
数学奥林匹克问题解答
解决高难度的数学奥林匹克问题,如AIME和OmniMath中的题目。
在AIME 2025上达到78.0%的准确率。
研究生水平科学问题解答
解答复杂的、研究生水平的科学问题,如GPQA-Diamond中的题目。
在GPQA-D上达到68.9%的准确率。
编程
竞争性编程问题解答
解决来自竞争性编程竞赛的代码生成问题,如LiveCodeBench中的题目。
在LiveCodeBench上达到53.1%的准确率。